文章详情

Pruna AI 是一家来自欧洲的初创公司,专注于 AI 模型的压缩算法开发。近日,该公司宣布将其优化框架开源,以帮助开
2025-04-26 03:32:10
文章详情介绍
Pruna AI 是一家来自欧洲的初创公司,专注于 AI 模型的压缩算法开发。近日,该公司宣布将其优化框架开源,以帮助开发者更高效地压缩和 AI 模型。
Pruna AI 开发的框架结合了多种效率方法,包括缓存、剪枝、量化和蒸馏等,旨在提升 AI 模型的性能。该框架不仅标准化了压缩模型的保存和加载,还能对压缩后的模型进行评估,以判断其质量是否显著下降,同时测量压缩带来的性能提升。
Pruna AI 的联合创始人兼首席技术官约翰・拉赫万(John Rachwan)表示:“我们的框架类似于 Hugging Face 对 transformers 和 diffusers 的标准化,我们为各类效率方法提供了一种统一的调用和使用方式。” 大公司如 OpenAI 已经在其模型中应用了多种压缩方法,例如使用蒸馏技术来创建其旗舰模型的更快版本。
蒸馏是一种通过 “教师 - 学生” 模型提取知识的技术,开发者向教师模型发送请求并记录输出。这些输出随后用于训练学生模型,使其能够近似教师模型的行为。拉赫万指出,虽然许多大公司倾向于自行构建压缩工具,但在开源社区中,往往只能找到基于单一方法的解决方案,而 Pruna AI 提供了一个整合多种方法的工具,极大地简化了使用过程。
目前,Pruna AI 的框架支持多种类型的模型,包括大型语言模型、扩散模型、语音识别模型和计算机视觉模型。但该公司目前主要集中于图像和视频生成模型的优化。已有如 Scenario 和 PhotoRoom 等企业在使用 Pruna AI 的服务。
除了开源版本,Pruna AI 还推出了一个企业版,包含高级优化功能和一个优化代理。拉赫万透露:“我们即将发布的最令人兴奋的功能是压缩代理,用户只需提供模型,并设定速度和准确度的要求,代理将自动找到最佳的压缩组合。”
Pruna AI 按小时收费,类似于用户在云服务上租用 GPU 的方式。通过使用优化后的模型,企业可以在推理时节省大量费用。例如,Pruna AI 成功将一个 Llama 模型的体积缩小了八倍,且几乎没有损失精度。该公司希望客户能够将其压缩框架视为一种投资,最终获得回报。
近日,Pruna AI 完成了650万美元的种子融资,投资者包括 EQT Ventures、Daphni、Motier Ventures 和 Kima Ventures。
项目:https://github.com/PrunaAI/pruna
划重点:
🌟 Pruna AI 推出开源优化框架,结合多种压缩方法提升 AI 模型性能。
🤖 大公司常用蒸馏等技术,Pruna AI 提供整合多种方法的工具,简化使用流程。
💰 企业版支持高级功能,帮助用户在保持准确度的前提下实现模型压缩和性能提升。
最新星火攻略
更多- 上海浦东聚焦人形机器人与大型模型技术,致力于建设创新型产业园区
- 百度携手华为鸿蒙共同推出创新型 AI 搜索模式“百看计划”,引领未来技术发展新潮流
- 地下城与勇士的最新排行榜分析:深入探讨DNF各职业表现与实力排名
- 赛力斯宣布成立新技术公司,涵盖人工智能与机器人相关业务领域,推动未来科技发展
- AI日报:OpenAI推出史上最昂贵的o1-pro API;腾讯全新混元推理模型T1即将发布;阶跃星辰开源Step-Video-TI2V视频生成模型
- 奥拉星帝皇圣龙攻略详解 如何有效击败奥拉星帝皇圣龙获取胜利
- 软银收购Arm架构芯片设计公司Ampere Computing,以增强其在人工智能领域的战略布局
- 杭州六小龙推出新一代开源模型SpatialLM,推动机器人快速理解三维世界的能力革新!
- ChatGPT 因“诽谤性”捏造儿童谋杀故事遭隐私投诉
- 精灵宝可梦阿罗拉冒险:畅游太阳·月亮中的魔幻世界,探索未知的神奇精灵
- 国产深海小型机器人成功达到一万米深海并实现多种运动模式,荣登国际顶尖学术期刊
- 运动掌控新时代!阶跃星辰 Step-Video-TI2V 图生视频模型现已开源,助力创意无限
- Meta AI时隔将近一年再次回归欧洲市场,首度推出文本对话功能以满足用户需求
- 谷歌Chrome浏览器将整合Gemini AI助手,让用户操作变得更加便利!
- LG宣布开源EXAONE Deep推理AI模型,称其为韩国首个自主研发的人工智能推理解决方案
最新星火智能
更多- 猫王音响拥抱AI科技:传统音响的智能化转型与未来发展
- 深圳推出人工智能先锋城市建设项目支持方案实施细则全面解读
- 东莞建立中国首个专注于制造业的城市级人工智能大模型中心,推动产业智能化转型
- 高阶用户的理想选择?OpenAI推出O1-Pro推理模型,百万Token售价高达600美元令人瞩目
- 腾讯混元再度发力,全新推理模型T1将于3月21日晚正式发布,敬请期待新科技盛宴!
- Google Chrome将整合Gemini AI技术,为用户带来更加智能化的浏览体验升级
- 大话西游3自由人序列号获取解析 与大话西游3自由人序列号使用技巧详解
- Adobe推出“Project Slide Wow”项目,让数据瞬间变换为引人注目的精彩PPT演示文稿
- Orpheus TTS:新一代人类情感表达贴近的语音合成模型
- 仙剑五前传详细攻略及玩法解析 全面解读仙剑五前传各大任务与角色攻略
- 微软与贝莱德伙伴关系携手马斯克xAI,共同推动300亿美元人工智能基础设施合作联盟
- 波士顿动力的Atlas机器人展示非凡运动才能:快速奔跑、华丽翻滚、灵活侧翻及动感霹雳舞
- 英伟达大举收购合成数据初创企业Gretel,助力推动生成式AI技术的快速发展
- 波士顿动力Atlas机器人最新进展:展现出接近人类的灵活动作能力引发广泛关注
- DNF黑暗武士PK技巧全面解析与实战经验分享