首页 > 生活知识 > 每天学习 > 后训练时代,联想如何搭建算力赛道的“超级枢纽”?

后训练时代,联想如何搭建算力赛道的“超级枢纽”?

发布时间:2025-05-21 22:13:03来源: 15699338890

从ChatGPT掀起全民AI热潮,到DeepSeek、千问3等本土大模型接连崛起,算力早已超越传统硬件范畴,成为国家战略竞争的新制高点。据中国信息通信研究院发布的《中国算力发展指数白皮书(2022 年)》显示,预计到2030年,全球算力规模将达到56 ZFLOPS,年平均增长率为65%。

在这场算力争夺战中,联想作为行业重要参与者,正通过一系列创新举措构建自身竞争优势。

近日,联想以2025创新科技大会为舞台,在联想AI算力基础设施技术创新论坛暨春季新品发布会上,推出六大创新技术与两大重磅升级,正式推出堪称“算力矩阵”的重磅武器——联想万全异构智算平台3.0、全新算力服务器家族、联想凌拓全新存储产品家族和针对多种规模构建的AI算力集群的智能网络体系以及创新技术与产品,并升级AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本


我们好奇,随着大模型规模的不断扩展、应用场景的日益复杂,AI算力基础设施行业面临哪些挑战?联想新发布的联想万全异构智算平台3.0以及服务器产品实力如何,能否应对挑战?未来,联想在服务器及智算平台这两个赛道又将有怎样的战略规划与布局?

AI浪潮下,算力基础设施面临五大挑战

IT基础设施作为算力的物质基础和核心载体,在行业数字化发展的各个方面都起着不可或缺的作用。如今,随着以DeepSeek为代表的开源大模型走进千行百业,算力基础设施面临新挑战。

第一,算力需求多样化。从基础模型的预训练到推理模型、多模态模型的应用,以及从简单的对话机器人到AI Agent、具身智能的发展,对服务器等设施算力需求也变得更加多样化,这就要求算力基础设施能够提供预训练算力、训推算力、推理算力等更全面多样的AI算力。

第二,算力基础设施需要更高性能。模型本地部署的应用潮流,对大模型一体机的单机性能提出了极致要求,需要服务器具备更强的计算能力、更高的存储容量和更快的读写速度,以满足本地模型的高效运行。


同时,万卡、十万卡级算力集群的出现,要求在超大规模算力集群里,实现“算存网”能力的高效协同,以避免因某一环节的性能瓶颈而影响整个集群的算力发挥。

第三,算力基础设施需要更高能效。AI算力的增长对电力需求提出了更多挑战,如何在满足算力需求的同时,降低数据中心的能耗,实现绿色计算,是服务器及算力基础设施面临的重要问题。

第四,算力基础设施需要更高可靠性。在AI计算中,尤其是大规模的分布式训推过程中,硬件故障可能导致整个集群计算水平大幅度下降。这就要求算力基础设施具备更高的硬件可靠性和故障自愈能力。

第五,算力基础设施需要提高通信效率。以DeepSeek为代表的MoE架构大模型,在训推过程中的通信复杂度呈指数级增长,与传统的稠密模型相比,各个专家间需要不断地通信、协同计算,导致多个GPU间频繁交互,这对AI服务器之间的通信网络提出了更高的要求。

技术突围!联想两大利器破解算力困局

如何破解大模型时代算力基础设施面临的诸多挑战?在联想看来,唯有创新才是破解挑战的唯一选择。

回首过去,当行业面临大模型预训练和传统模型推理的算力诉求时,联想通过技术创新,推出联想万全异构智算平台四大技术,筑牢大模型发展底座。

如今,联想依旧以创新为引领,打造大模型时代的坚实底座,在本次大会上推出联想万全异构智算平台3.0与全新算力服务器家族两大核心“利器”。

利器一:发布联想万全异构智算平台3.0

联想中国基础设施业务群战略管理部总监黄山表示,联想万全异构智算平台3.0进一步推出五大差异化技术,帮助用户在AI预训练、后训练、推理的过程中取得最高效、最稳定的算力。具体而言,五大技术将带来算力设施如下升级。

其一,AI推理加速算法集,可对MLA等业界新型方法进行工程实践落地,并结合联想积累的混合精度量化、分布式并行等方法二次优化,将DeepSeek等大模型的推理性能提升5-10倍,单台8卡GPU服务器采用该平台后可支持190路用户同时使用DeepSeek满血版,相比业界最优社区方案保持20%性能优势,满足用户对推理高吞吐量、低延时的诉求。

其二,AI编译优化器,能在构建AI计算图过程中,采用临近算子融合、高效算子替代和简化计算路径等方式,结合与GPU战略伙伴的研发成果优化算子,经其优化后,AI训练后推理的计算开销至少降低15%,且分布式训练或推理规模越大,效果越显著。

其三,AI训推慢节点故障预测与自愈系统,基于联想三年以上积累的AI训推故障特征库并训练故障预测模型,实现用AI模型预测AI故障。系统通过异步训练检查点或推理备份准备故障恢复环境,故障发生时自动排除故障点,实现百卡集群故障秒级恢复、千卡分钟级恢复、万卡十分钟级以内恢复。

其四,专家并行通信算法,针对MoE架构大模型训推中all to all通信方式带来的指数级通信复杂度问题,研发细粒度的计算通信协同优化算法,在底层核函数层面实现计算与通信过程高度并行,将推理延迟降低300%以上,网络带宽利用率从50%提升到90%。

其五,智能资源调度引擎,可基于实时负载感知与异构算力特征,动态优化GPU/CPU/DPU等资源分配策略。通过拓扑感知的任务调度算法,将多模态模型训推任务与硬件架构精准匹配,使混合算力集群利用率提升25%以上,端到端任务执行效率提高30%,全面释放异构算力潜能。

利器二:全新算力服务器家族

联想中国基础设施业务群服务器产品部总经理周韬在发布会上指出,联想在服务器发展中一直通过引领服务器技术创新,为客户重新定义新的算力。如今,面对大模型后训练时代,联想选择再次进化服务器,并重新定义算力。本次联想推出的全新算力服务器家族,可面对不同AI应用场景,充分释放AI服务器的算力潜能。

每天学习更多>>

消息称下一代 Siri 性能堪比 ChatGPT,苹果推送 iPadOS 17.7.8 正式版 三星:Q1 全球 NAND 市场规模环比减 25% 华硕CEO:AI PC仍需1-2年才能实现 后训练时代,联想如何搭建算力赛道的“超级枢纽”? 小鹏MONA M03 Max开箱首秀,5月底开启交付 理想L系列焕新版实测:激光雷达+双腔悬架,安全性能碾压同级? 续航王者榜:埃安LX续航1008km,极氪001加速3.8秒 Tank S3 Pro智能手表发布:具备坚固耐用的军用品质、大容量电池 家用MPV怎么选?比亚迪夏对比丰田格瑞维亚 月薪不过万,也想提SUV的来集合,8个预算能拿下的高颜值车型来了 快手X巴黎欧莱雅 500个家乡首次商业化 验证“家乡叙事”商业承载力 iQOO Neo10 Pro+发布:联合抖音提升电竞直播体验 电商代运营大变局:品牌流失、平台刁难,谁能在分化中杀出重围? 买美孚黑金送黄金!京东养车618福利再加码让养车省钱又省心 天猫主场剑指三连胜 飞翼防线告急 数据+模型深度拆解WNBA焦点战 平台治理需兼顾商家与消费者权益 不限价新盘中签率出炉:望云润玺20.25%,玉湖之星26.59% 楼市必涨和二手房必亏并行不悖 2025年1-4月份全国房地产市场基本情况 哈洽IN现场|哈洽会上的“AI显眼包” 机器人把科技玩明白了 文远知行中东首推纯无人驾驶 Robotaxi,技术输出加速 《数字中国建设2025年行动方案》出炉 部署“人工智能+”等8个方面重大行动 “AI+网文”:一键出海、全球追更 00后开始怀念2010年代:快手3.2亿次播放的怀旧视频。 阿里、京东发布最新财报;抖音电商今年前四月补贴商家超80亿元|一周未来商业 保定二手房市场深度解析:5万套房源背后的购房密码 合肥美女189平米新房装修,一进去就不想出来,这装修堪称教科书 济南4月新房价格指数环比持平,前4个月成交1.39万套 北京楼市的终局:严控人口,取消限购! 房价暴涨神话终结?四个扎心数据告诉你楼市真相