文章详情

联想今日宣布,旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B(满血版) D
2025-04-15 01:01:07
文章详情介绍
联想今日宣布,旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B(满血版) DeepSeek 大模型时,实现了高达6708token/s 的极限吞吐量,再次刷新了单台服务器运行超大规模模型性能的纪录。
据介绍,此次性能突破得益于联想万全异构智算平台的强大支持。联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段,对大模型从预训练、后训练到推理的全流程进行了持续优化。实测结果显示,在单台部署 DeepSeek671B 大模型的联想问天 WA7785a G3服务器上,最高吞吐量达到了惊人的6708token/s。
图源备注:图片由AI生成,图片授权服务商Midjourney
在模拟问题对话场景(上下文序列长度128/1K)时,该服务器最高可支持158的并发数,TPOT(Time Per Output Token)为93毫秒,TTFT(Time To First Token)为2.01秒;而在模拟代码生成场景(上下文序列长度512/4K)时,并发数可达140,TPOT 为100毫秒,TTFT 为5.53秒。联想方面表示,这一性能表现意味着单台联想问天 WA7785a G3服务器即可支撑1500人规模企业的正常使用,是继联想问天 WA7780G3服务器单机部署满血版 DeepSeek 大模型总吞吐量突破2500token/s 之后,在单机部署该大模型推理性能上的又一次重大飞跃。
联想方面强调,此次技术突破是联想中国基础设施业务群、联想研究院 ICI 实验室和 AMD 联合设计、协同调优、共同实现的成果。同时,这并非最终结果,联想与 AMD 仍在持续探索深度调优的新方法,以期实现更高的性能突破。
最新星火攻略
更多- 怪物猎人荒野百暴操虫棍最佳配装攻略和厉害技能推荐
- 怪物猎人荒野护雷颚龙战斗技巧分享及掉落材料全面解析
- 饿了么正式启动本地生活人工智能算法大赛 诚邀参与者共同争夺30万元的丰厚奖金池
- 英雄联盟时光杯第二季完整赛程展示及详细安排介绍—Lol时光杯赛程时间表
- 如何在Windows 7中正确设置U盘启动,确保系统顺利引导
- 谷歌Gmail推出全新智能“添加到日历”功能,使用户的活动安排变得更加简单高效!
- 双影奇境中全长椅的具体位置以及相关说明
- 怪物猎人荒野攻势高会心太刀最佳配装策略分享与解析
- 谷歌全新发布Flash Thinking2.0版本,深度研究功能现已对所有用户开放
- 应对Word文档第一页空白页无法删除的各种原因及解决方法分享
- 全面解析怪物猎人荒野中农场素材的采集委托任务
- 天国拯救2中的司令官诅咒解除的详细解决方案与策略
- 《天龙八部续集归来》龙妹首次亮相盛大发放激活码,卡级玩家们感动不已温情回忆
- 富士康在台湾省首次推出名为“FoxBrain”的AI推理大模型,引领智能科技新潮流
- 关于《怪物猎人荒野》在手机上是否可以游玩的详细分析与说明
最新星火智能
更多- 暮光高地海滩侦查任务:探索神秘海岸线的秘密与挑战
- 深入了解2025年英雄联盟全球先锋赛中TES战队各成员的背景与实力分析
- 2025年人工智能领域持续投资热潮:美国九家公司获得超过一亿美元的融资支持
- 如何成功获取洛克王国中的雪精灵角色及其相关技巧和攻略分享
- 哪些海洋区域曾被誉为生命的禁区-探索神奇海洋3月6日的2025年答案
- 阿里推出独立网站以展示其AI视频模型通义万相Wan,助力视频创作创新技术的发展
- 怪物猎人荒野高容错斩斧最佳配装攻略分享,助你提升狩猎效率
- 《怪物猎人:荒野》全新接待员换装Mod上线:视觉冲击力与游戏乐趣双重提升!
- 鬼泣巅峰之战第一阶段的游戏攻略与玩法解析
- 怪物猎人荒野达里尔的研究报告续篇支线任务详细流程解析
- 老板电器全新发布“食神”AI智能烹饪模型,带来前所未有的智能厨房全新体验
- 神匠游戏将参加2025ChinaJoy-GameConnection独立游戏展区,期待与您共同探索精彩时刻!
- 金铲铲之战羁绊追踪者组合搭配推荐:轻松激活8种羁绊攻略分享
- Adobe重磅发布10款AI智能助手,助力客户轻松打造个性化网站
- 反向真香:《幻兽帕鲁》工作室CEO坚决拒绝任何收购提议,展现独立精神