文章详情

腾讯推出全新自研深度思维模型「T1」,正式对外发布引发业界广泛关注
近日,腾讯正式推出了其自研的深度思考模型——混元T1正式版。混元T1正式版在大规模强化学习的基础上,针对数学、逻辑推理、
更新:
2025-04-26 09:38:46
文章详情介绍
近日,腾讯正式推出了其自研的深度思考模型——混元T1正式版。
混元T1正式版在大规模强化学习的基础上,针对数学、逻辑推理、科学和代码等理科难题进行了专项优化,从而实现了推理能力的显著提升。在常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的优异成绩,仅次于顶尖模型o1。同时,在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1也展现出了业界领先推理模型的水平。
除了基础推理能力外,混元T1正式版还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。这得益于其沿用了混元Turbo S的创新架构,并采用了Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。
此外,基于出色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗。在相近的激活参数量下,混元T1实现了解码速度提升2倍。
目前,腾讯混元T1已经开放体验,并上线了API服务。用户可以根据需求,以每百万tokens1元的输入价格和每百万tokens4元的输出价格,享受这一强大推理模型带来的便捷与高效。
最新星火攻略
更多- 侠盗飞车自由城全方位攻略解析:从任务到秘籍的全面指导
- 李飞飞团队发布突破性图像处理技术,颠覆传统界限与应用模式
- 富途正式接入DeepSeek技术并推出多项升级的人工智能产品功能,助力用户体验提升
- 维他动力成功获得 2 亿元融资,预计年底发布首款智能家居机器人,引领智能家居新潮流
- 英伟达预计在美国投入数千亿美元以促进半导体供应链的持续发展与完善
- 钉钉全新AI生态政策发布,为创业者提供创新支持,推动无障碍创业环境
- 小型智能助手为法律行业带来变革,LexisNexis 发布其全新 AI 助手 Protégé
- 收购好大夫后,蚂蚁集团针对29万医生推出全新AI辅助产品系列,助力医疗服务转型
- 九阴真经丐帮内应剧情解析 深度探讨丐帮与九阴真经的关系与影响
- Roblox发布AI驱动的3D建模工具Cube,开启游戏创作的新篇章
- 65岁老人因持续头晕被AI技术成功筛查出早期胰腺癌的医疗案例
- 前字节跳动人工智能领域专家加入千寻智能,助力推动具身智能技术的创新与发展
- PSP2000与PSP3000:深入探讨掌中宝游戏机的变革与升级历程
- 天猫推出智能设计助手,助力家电与家居商家提升工作效率与设计创新
- AI日报:OpenAI推出三款新语音模型;快手搜索全面集成DeepSeek R1技术;Claude新增联网搜索功能以提升用户体验
最新星火智能
更多- 字节推出的InfiniteYou生图框架:能够维持人脸特征,随意更换场景背景,提升用户体验
- 探索木星:一场充满奇妙与惊奇的星际探险之旅
- 与岳乱lun合欢第1集:揭开逸事与角色间深厚情感的神秘面纱
- 腾讯元宝全新功能上线,助力用户轻松分析复杂的Excel表格数据
- dnf镀金手镯的购买渠道及攻略 DNF镀金手镯怎么买最划算
- 快手搜索AI全面进化:DeepSeek R1强势上线,搜索体验实现突破性飞跃!
- Midjourney 主要开发团队成员 theseriousadult 宣布离职,加入 Cursor 探索 AI 编程 Agents 研发新领域
- Krea AI推出全新“视频训练”功能 帮助用户定制独特的视频风格体验
- 阿里云携手亚洲十所顶尖高校及研究机构共筑AI人才培养新模式
- 谷歌曾任科学家的最新力作!Reka团队发布Reka Flash 3,其性能超越Gemma 3 27B,展现卓越能力
- 全球首个专为儿童打造的大型医疗模型问世,推动儿童医疗服务的全面升级与发展
- 重庆市推出全国首款具备感知能力的大模型养老陪护机器人,助力养老服务改革
- 《魔兽世界》熊猫人之谜深度剖析与背后故事探讨
- 老板电器全新推出“食神”AI烹饪模型,带来全新的智能厨房体验和美味烹饪革命
- 洛克王国探险之旅:踏上奇幻世界的奇妙探秘冒险之旅