文章详情

3月11日,通义实验室团队宣布开源R1-Omni模型,为全模态模型的发展带来了新的突破。该模型结合了强化学习与可验证奖励
2025-04-24 14:05:17
文章详情介绍
3月11日,通义实验室团队宣布开源R1-Omni模型,为全模态模型的发展带来了新的突破。该模型结合了强化学习与可验证奖励(RLVR)方法,专注于提升多模态情感识别任务中的推理能力和泛化性能。
R1-Omni的训练分为两个阶段。在冷启动阶段,团队使用包含580条视频数据的组合数据集进行微调,这些数据来自Explainable Multimodal Emotion Reasoning(EMER)数据集和HumanOmni数据集。这一阶段旨在为模型奠定基础推理能力,确保其在进入RLVR阶段前具备一定的多模态情感识别能力,从而保障后续训练的平稳性、效率与稳定性。
随后,在RLVR阶段,模型通过强化学习与可验证奖励机制进一步优化。该阶段的关键在于策略模型和奖励函数。策略模型处理视频帧和音频流组成的多模态输入数据,生成带有详细推理过程的候选响应,展示模型如何整合视觉和听觉信息以得出预测。奖励函数则受DeepSeek R1启发,分为精确率奖励和格式奖励两部分,共同形成最终奖励,既鼓励模型生成正确预测,又保证输出结构化且符合预设格式。
实验结果显示,R1-Omni在同分布测试集DFEW和MAFW上,相较于原始基线模型平均提升超过35%,相较于有监督微调(SFT)模型在未加权平均召回率(UAR)上提升高达10%以上。在不同分布测试集RAVDESS上,其加权平均召回率(WAR)和UAR均提升超过13%,展现出卓越的泛化能力。此外,R1-Omni还具有显著的透明性优势,通过RLVR方法,音频和视频信息在模型中的作用变得更加清晰可见,能够明确展示各模态信息对特定情绪判断的关键作用,为理解模型决策过程和未来研究提供了重要参考。
论文:
https://arxiv.org/abs/2503.05379
Github:
https://github.com/HumanMLLM/R1-Omni
模型:
https://www.modelscope.cn/models/iic/R1-Omni-0.5B
最新星火攻略
更多- AI大模型领域的最新发展:新技术的引入与产业合作的不断加强
- 逆水寒手游2.3.1版本素问内功最佳搭配策略与玩法解析
- 冒险岛枫叶:在探索与回忆交织的奇幻旅程中寻找属于自己的传奇故事
- 最好玩的 Manus 复刻项目,GAIA 基准一马当先,完全开放源码随意尝试!
- 逍遥九重天梦境玩法全解析与攻略技巧分享,让你轻松掌握梦境秘境的乐趣与挑战
- 魔兽世界冰霜法师天赋加点攻略 详解冰法最佳加点选择与玩法心得
- 新一代人工智能技术有望早期识别脑部退化,从而有可能颠覆现有的痴呆症治疗方法
- 想不想修真云梦泽每日扫荡次数上限与优化策略探讨
- 广州算力中心与阿里通义携手接入先进的千问大模型QwQ-32B,实现更高效的计算能力
- 在月圆的夜晚如何有效地对付那些醉酒的鬼魂
- 阿里巴巴AI搜索引擎Accio用户数已突破百万 新增智能功能助力全球贸易新发展
- 天使之翼2最新满级密码揭秘与使用技巧分享
- 探寻江湖丹田的提升之道:如何有效增强内力与修为
- AI日报:DeepSeek澄清有关R2发布时间的虚假信息;腾讯推出巨型模型Hunyuan-TurboS;Pika新增视频互换功能
- 如何开启第二元神,让修真之路更加顺畅,探索想不想修真的新境界
最新星火智能
更多- 真我realme UI 6.0小布助手全新升级正式支持DeepSeek-R1满血版功能
- 荒野起源中如何有效获得大锤的详细方法与攻略介绍
- Pika推出视频交换新功能 通过Pikaswaps实现轻松换装体验
- 王者荣耀狂铁的全新皮肤龙之律动究竟何时正式上线与玩家们见面呢?
- 魔兽改图一条龙全攻略:尽情发挥创意,塑造你独特的游戏世界与体验
- 高通收购 Edge Impulse,推动人工智能与物联网的深度融合与创新发展
- 探索江湖眼识攻击的转化技巧与策略,如何实现有效的攻击转变
- 天龙八部2888卡获取方法与豪华福利领取攻略全解析
- 江湖武林中枪法绝技的全面解析与技巧分享
- 单目视频拍摄中的运动平滑化:TrajectoryCrafter 实现流畅自然的相机移动效果
- 科大讯飞凭借自主研发的算力卡成功跻身大模型研发的前列,展现国产技术的强大实力
- 探索2025年江湖新流派的独特魅力与风采
- 梦幻西游无名鬼蜮 探索无名鬼蜮中充满神秘与奇幻的冒险之旅
- 富士康在台湾省隆重发布首款 AI 推理大模型 “FoxBrain”,开启科技新纪元
- 如何在欢乐对决中为双子狂战打造最优阵容组合技巧与策略分享