文章详情

Meta联合滑铁卢大学的研究人员近日共同发布了一款名为 MoCha 的全新 AI 系统,能够通过简单的文本描述生成带有同
2025-04-27 23:40:53
文章详情介绍
Meta联合滑铁卢大学的研究人员近日共同发布了一款名为 MoCha 的全新 AI 系统,能够通过简单的文本描述生成带有同步语音和自然动作的完整动画角色。这一创新技术有望极大地提升内容创作的效率和表现力,并在多个领域展现出巨大的应用潜力。
打破传统,全身动画与精准口型同步
与以往侧重于面部表情的 AI 模型不同,MoCha 的独特之处在于能够渲染全身的自然运动。无论是从近距离还是半近距离拍摄,系统都能根据文本内容生成包括 唇部同步、手势以及多角色之间的互动 等细腻动作。早期的演示主要集中在上半身,展示了系统如何使角色的口型与对话内容精准匹配,肢体语言也与文本所表达的含义自然契合。
为了实现更精确的唇部同步,研究团队创新性地引入了 “语音-视频窗口注意力”机制。这一机制有效地解决了 AI 视频生成中长期存在的两大挑战:音频保持完整分辨率时视频处理过程中的信息压缩,以及并行视频生成时容易出现的口型错位问题。其核心原理在于 限制每一帧画面只能访问特定窗口范围内的音频数据。这种方法模仿了人类语音的运作方式——口部动作依赖于即时声音,而肢体语言则跟随更广泛的文本模式。通过在每帧音频前后添加标记,MoCha 能够生成更流畅的过渡和更准确的唇语同步效果。
多角色轻松管理,提示系统简洁高效
在处理包含多个角色的场景时,MoCha 团队开发了一套 简洁高效的提示系统。用户只需 定义一次角色信息,便可以通过简单的标签(如 ‘Person1’,‘Person2’)在不同的场景中引用这些角色。这种方式避免了重复描述角色的繁琐过程,使得多角色动画的创作更加便捷。
性能卓越,超越同类系统
经过在150种不同场景下的测试,MoCha 在唇部同步和自然动作质量方面均优于同类系统。独立评估人员对 MoCha 生成的视频的逼真度给予了高度评价。测试结果表明,MoCha 在各项指标上都展现出超越竞争对手的实力。
Meta 的研究团队认为,MoCha 在 数字助理、虚拟化身、广告和教育内容 等领域都展现出巨大的应用潜力。然而,Meta 尚未透露该系统是否会开源,或者仍将作为研究原型存在。值得注意的是,MoCha 的开发正值各大社交媒体公司竞相发展 AI 驱动视频技术的关键时期。
此前,Meta 已经推出了 MovieGen,而 TikTok 的母公司字节跳动也在积极研发其自身的 AI 动画系统,包括 INFP、OmniHuman-1和 Goku. 这场 AI 视频技术的竞赛,无疑将加速相关技术的进步和应用普及。
项目入口:https://top.aibase.com/tool/mocha
最新星火攻略
更多- 天涯明月刀中燕南飞角色的深度解读与背景分析,探寻其在故事中的重要性与魅力
- Meta 发布 MoCha AI 系统:实现角色动画的同步语音与动作生成新技术
- 英国智库建议放宽人工智能相关版权法规,以促进跨大西洋合作和关系维护
- ChatGPT 借助 “吉卜力热潮” 快速增长,付费用户数量突破 2000 万大关
- Meta AI 研究负责人皮诺宣布离职 650亿美元投资计划仍在持续推进中
- 魔兽世界考古虫子的秘密揭示:深入挖掘考古虫子背后的传奇故事与神秘力量
- OpenAI 延迟推出新产品,图像生成技术遇到容量瓶颈挑战
- OpenAI 低调推出 OpenAI 学院,免费提供丰富的人工智能学习资源,助力教育发展
- 梦幻西游跑商工具箱:每位玩家都不可或缺的游戏辅助神器与必备工具
- 在人工智能浪潮中,软件供应链遭遇严重安全威胁:机密泄露事件增加了64%
- 日本 Rapidus 正式启动 AI 芯片的试生产工作,迈出关键一步
- 炉石传说英雄乱斗深入研究与解析,探讨其策略与玩法的全面指南
- 微软首席技术官指出产品经理在人工智能培训过程中扮演着关键角色的重要性
- 魔兽争霸:三国无双的巅峰之作——经典策略与动作的完美结合之旅
- 广东省推出新策略,全面促进人工智能和机器人产业的“AI+”与“机器人+”应用创新发展
最新星火智能
更多- 造梦西游3修改大师豪华版使用指南 - 如何高效利用造梦西游3修改大师豪华版进行游戏修改
- 国家天文台与阿里云联合推出全球首款太阳大模型“金乌”:M5级耀斑预报准确率成功突破91%水平
- LOL天赋系统的各种BUG分析与解决方案深度探讨
- HCLTech 在美国设立全新 AI 驱动的公共部门子公司,推动智能化服务发展
- 宇树科技推出Dex5灵巧手:实现单手20个自由度,挑战人类在精细操作领域的极限能力
- GPT-4o的图像生成技术不断突破,展现多领域卓越才能,激发AI创意的新极限
- AI日报:Runway推出新一代视频生成模型Gen-4;宇树G1在短短5分钟内直播带货突破百万销售额;OpenAI宣布即将开源新型AI模型
- 部落守卫战21-5关卡详细攻略与战术深入分析,助你轻松通关挑战
- 联想推出三大全新AI服务品牌“擎天、百应、想帮帮”,积极进军AI服务市场抢占先机
- 途牛推出全新智能助手“小牛”:依托开源大模型,畅享一站式智能出行服务新体验
- 纸嫁衣4第三章:在迷雾重重的情节中揭开真相的秘密与探索
- 顺丰同城与豆包、腾讯混元等多家企业成功建立战略合作关系,以推动本地服务的发展
- 天下3魍魉角色加点解析与技巧分享,助你轻松掌握魍魉加点攻略
- 2024年广东省人工智能核心产业预计规模将突破2200亿元大关
- 伟大的妈妈35节阅读答案:在游戏中学习与成长的乐趣与启示(游戏教育的重要性与亲子互动)