文章详情

近日,HPC-AI Tech 宣布推出 Open-Sora2.0,这是一款突破性的视频 AI 系统,仅需约十分之一的典型
2025-04-15 20:58:53
文章详情介绍
近日,HPC-AI Tech 宣布推出 Open-Sora2.0,这是一款突破性的视频 AI 系统,仅需约十分之一的典型训练成本即可实现商业级质量。这一进展标志着在资源密集型的视频 AI 领域可能出现范式转变,堪比语言模型中出现的效率提升。
虽然像 Movie Gen 和 Step-Video-T2V 这样现有的高质量视频生成系统可能需要数百万美元的训练费用,但 Open-Sora2.0的训练支出仅约为20万美元。尽管成本大幅降低,但测试表明,其输出质量可与 Runway Gen-3Alpha 和 HunyuanVideo 等已建立的商业系统相媲美。该系统使用了224个 Nvidia H200GPU 进行训练。
提示:“两个女人坐在米色沙发上,房间温馨舒适,背景是砖墙。她们愉快地交谈,面带微笑,在亲密的中景镜头中举杯庆祝红酒。”| 视频:HPC-AI Tech
Open-Sora2.0通过一种新颖的三阶段训练过程实现其效率,首先从低分辨率视频开始,逐步细化到更高分辨率。集成像 Flux 这样的预训练图像模型进一步优化了资源利用。其核心是视频 DC-AE 自动编码器,与传统方法相比,它提供了卓越的压缩率。这一创新转化为令人瞩目的5.2倍更快的训练速度和超过十倍更快的视频生成速度。虽然更高的压缩率导致输出细节略有减少,但它极大地加快了视频创建过程。
提示:“一颗番茄在一片生菜上冲浪,顺着牧场酱汁瀑布而下,夸张的冲浪动作和柔滑的波浪效果凸显了3D 动画的乐趣。”| 视频:HPC-AI Tech
这款开源系统可以从文本描述和单张图像生成视频,并通过运动评分功能让用户控制生成片段中的运动强度。HPC-AI Tech 提供的示例展示了各种场景,包括逼真的对话和异想天开的动画。
然而,Open-Sora2.0目前在分辨率(768x768像素)和最长视频时长(5秒或128帧)方面存在限制,逊于 OpenAI 的 Sora 等领先模型的功能。尽管如此,其在视觉质量、提示准确性和运动处理等关键领域的表现正逼近商业标准。值得注意的是,Open-Sora2.0的 VBench 得分现在仅落后 OpenAI 的 Sora0.69%,与之前版本4.52% 的差距相比有了显著改进。
提示:“一群拟人化的蘑菇在一片黑暗的魔法森林中举行迪斯科派对,伴随着闪烁的霓虹灯和夸张的舞步,它们光滑的纹理和反光的表面强调了滑稽的3D 外观。”| 视频:HPC-AI Tech
Open-Sora2.0的成本效益策略与语言模型中的“Deepseek 时刻”相呼应,当时改进的训练方法使开源系统能够以远低于商业系统的成本实现商业级性能。这一发展可能会对视频 AI 领域的价格产生下行压力,该领域目前由于计算需求高昂,服务按秒收费。
培训成本比较:Open-Sora2.0需要大约20万美元,而 Movie Gen 需要250万美元,Step-Video-T2V 需要100万美元。| 图片:HPC-AI Tech
尽管取得了这一进展,但开源和商业视频 AI 之间的性能差距仍然大于语言模型,这突显了该领域持续存在的技术挑战。Open-Sora2.0现在已在 GitHub 上作为开源项目提供。
最新星火攻略
更多- 如何在Word中将另一份文档的整页合并到当前文档中,并确保格式保留的方法
- 65岁老人因感到头晕,AI技术成功检测出早期胰腺癌病例
- 怪物猎人荒野中最强灭龙瓶斩斧配装全解析与技巧分享
- 国家网信办发布《标识人工智能生成合成内容的实施细则》,要求 AI 生成的合成内容必须进行明显标识
- 怪物猎人荒野大回复中蜜虫的具体位置在哪里能找到
- OpenAI重磅消息:GPT-5即将发布,CPO预计今年AI代码自动化水平将达到99%!
- 如何在火影忍者中获取神器的详细攻略与技巧分享
- 快手搜索AI全面升级:DeepSeek R1强势接入,搜索体验实现质的飞跃!
- 神界危机4:黑暗中的恶魔交织与神秘纷争的最终对决
- 智谱华章成功获得5亿融资,计划打造城市级大模型应用平台
- 魔兽力量的试炼在游戏中有哪些重要作用和实际应用价值
- 骁龙8sGen4全面解析:性能跑分与游戏体验双双超越竞争对手
- 一男子因利用 AI 撰写色情小说被判刑十个月,非法获利超两万元
- 往日不再温泉营地提升信任度的有效方法和技巧分享
- OpenAI与CoreWeave建立战略合作关系,签署高达119亿美元的合作协议
最新星火智能
更多- 如何在我的世界中制作铁傀儡的详细步骤与技巧分享
- 昆仑万维推出开源Skywork R1V视觉推理模型,引领思维链技术的创新进步
- 刺客信条影一直提示检查附加内容的问题该如何解决与处理
- 香港人工智能领域岗位缺口日益扩大,现急需超2000名专业人才填补空缺
- 洛克王国圆眼蜘蛛的首次上线时间是什么时候?
- 全面提升生命质量!全国首个出生健康管理大模型CHANGE重磅发布,科技赋能健康未来
- 金铲铲之战中的监察老鼠角色玩法详解以及策略分享
- 掌握你的喜好!Gemini现已能够依据你的搜索历史提供个性化问题解答
- 怪物猎人荒野麻痹流狩猎笛最佳配装推荐与实战技巧分析
- Manus对官方X账号被禁言回应:此事件与加密货币诈骗毫无关联
- 攻城掠地刘备最适合搭配的兵书推荐与分析,探索历史上他们的战术智慧
- NS2版《塞尔达:旷野之息》将不会包含任何付费DLC内容,玩家可安心享受完整游戏体验
- AMD 通过巧妙优化和适配的计算力助力人工智能的成功之路
- 《双影奇境》首轮媒体评分解禁:MC 91、OC 90,IGN 9分、GS 10分创佳绩引发热议
- 详细探讨在Linux环境下安装Xshell的重要性及其编译步骤解析