文章详情

华为昇腾联合阶跃星辰发布开源多模态模型,共同拓展人工智能新领域
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多
更新:
2025-04-24 03:51:11
文章详情介绍
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。
Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情感、方言、语言、唱腔和个性化风格的语音的大模型。这一技术的发布,标志着 AI 语音交互领域的一次重要突破。
图源备注:图片由AI生成,图片授权服务商Midjourney
值得一提的是,这些模型是基于华为昇腾 CANN 异构计算架构和昇腾服务器进行适配的。开发者和企业用户可以在魔乐社区中便捷地下载和体验这些模型。为了进一步降低使用门槛,魔乐社区还提供免费算力支持,让用户可以在线进行模型推理,而无需复杂的环境搭建,快速验证他们的 AI 方案。
此外,阶跃星辰的开源模型受到了多个行业标杆企业的关注,包括天数智芯、阿里云、火山引擎、TCL 等各行各业的厂商已纷纷接入这一开源生态。未来,阶跃星辰计划在3月份推出新的图生视频模型,进一步丰富其产品线。
华为昇腾与阶跃星辰的这一合作不仅拓展了多模态 AI 模型的应用场景,也为开发者提供了更为强大的工具,推动了整个行业的技术进步。
最新星火攻略
更多- 探寻江湖秘籍不动朔风枪与八逆的最佳技能组合搭配
- 索尼音乐采取维权措施,强制下架超过7.5万条由AI生成的音乐作品
- 剑与骑士团珂薇特的技能解析与实战应用详解
- AI日报:国家超级计算平台推出阿里千问大模型;抖音加强对AI炒股诈骗的整治力度;可灵AI首次发布毛茸茸等三种新AI特效
- 密室逃脱7环游世界第二章寂静岛攻略分享与通关技巧解析
- 警惕!抖音加强打击AI炒股诈骗行为,AI选股软件及相关课程内容成为重点整治目标
- 在荒野国度中,如何有效地对家园进行迁移与重建,确保生存与发展
- 宇树科技正式启动跨境电商业务,阿里速卖通旗舰店盛大开业,众多产品享受“百亿补贴”优惠政策
- 当票房冠军遇上街头艺人,他们能否激活各自的潜能和技能呢?
- 摆脱复杂建模烦恼!手绘草图瞬间转化为精致3D模型,MeshPad助力设计师完美释放创造力!
- 崩坏星穹铁道缇宝及其专属武器所需材料获取攻略详解
- 仅用短短四周时间!富士康成功推出其中文大语言模型FoxBrain,开启AI新纪元
- 揭示江湖秘辛:如何运用天罡之力突破棍法,成功挑战武穆山庄的通关之道
- 热血无赖游戏中的提升方式与实用升级技巧详细解析
- 百度AI创作工具橙篇成功融合DeepSeek-R1全面升级版,开启全新创作体验
最新星火智能
更多- 王者荣耀KPL春季赛观战玩家可以享受到哪些精彩福利与惊喜活动
- 加州新法案实施:确保人类重新掌控职场决策,告别机器老板的时代
- 王者荣耀阿轲化蝶舞皮肤的售价具体是多少?以及购买途径和相关说明
- 国家超算互联网平台成功接入阿里巴巴的千问大模型,提供QwQ-32B API服务
- 时空裂缝究竟隐藏在哪里?探索时空裂缝的真实所在与奥秘
- 月圆之夜噩梦模式吸血鬼领主战斗详细攻略与技巧分享
- 罗永浩旗下细红线科技启动春季招聘,聚焦人工智能系统开发领域,迎接新挑战
- 美国司法部施压谷歌出售Chrome浏览器,同时解禁AI领域投资限制以促进竞争
- 魔兽世界万圣节活动掉落详情解析 笑傲艾泽拉斯的节日惊喜
- 永夜降临中的克莉斯多复苏效果究竟如何影响游戏体验与角色发挥
- 华为最新申请的AI模型专利曝光,或将显著提高生成AI模型的运算效率
- 双影奇境第二章跳车顶的解谜攻略详细解析及步骤分享
- AI行业的新利器!Finer-CAM助力精准图像理解与清晰分类,提升AI的视觉识别能力
- 在江湖之中如何开辟新天地?解析棍过百花的独特玩法与策略
- 重温游历之旅,魔力宝贝怀旧攻略:再访经典奇幻世界与冒险经历