近日,联想公司正式上线发售了其全新产品——联想万全异构智算平台。这一平台瞄准通用计算、科学计算与人工智能算力等多个领域,通过革新性技术显著提升了算力效率。
当下,“大模型+大算力+大数据”成为新一代人工智能发展的基石。然而,智能计算的资金投入和技术门槛通常远高于通用计算,使得用户急需一个全新的计算开发与管理平台。基于这一现状,联想基础设施业务群顺势而为,抢先布局,打造了联想万全异构智算平台。
该平台集成了五大创新技术:算力匹配魔方、GPU内核态虚拟化、联想集合通信算法库、AI高效断点续训技术以及AI与HPC集群超级调度器,为用户提供了一个高质量、高标准的异构智算解决方案。
核心特性与技术创新
1.算力匹配魔方
算力匹配魔方能够智能匹配用户的算力需求。基于广泛的硬件评测与AI算子算法集成工作,联想构建了一个算力魔方知识库,标识了AI场景、算法与集群配置的最佳匹配关系。用户只需输入场景和数据,算力魔方即可自动加载最优算法并调度最佳集群配置。
2.GPU内核态虚拟化
GPU内核态虚拟化技术通过联想研究院开发的先进虚拟化算法,将GPU算力损耗降至最低,大幅提升GPU利用率,几乎逼近GPU算力极限。
3.联想集合通信算法库
联想集合通信算法库能显著提升网络通信效率。利用先进算法优化数据传输路径,该库能够实时感知多种网络拓扑,使得千卡规模集群的网络通信效率提升超10%,且集群规模越大,效果越显著。
4.AI高效断点续训技术
AI高效断点续训技术通过特征采样与AI模型预测训练故障,减少AI训练中断时间。该技术能在断点前优化备份,将断点续训恢复时间缩短至分钟级,有效提高训练效率并节约算力成本。
5.AI与HPC集群超级调度器
AI与HPC集群超级调度器能够满足混合集群资源共享需求。它可在AI和HPC调度模式间切换,实现跨集群的全局动态管理与算力资源调度,并在一小时内完成跨集群资源调度和共享。
高度自动化与智能化
联想万全异构智算平台不仅能高度自动化地完成AI全流程开发,提供高可用算力,并且在持续突破计算效率瓶颈的同时还能显著降低业务全周期使用成本(TCO),加速应用部署。用户既可以自动完成AI计算并发布模型或推理服务,也可以手动深入调整计算过程,比如选择工具和模型、调整算力配置和进行任务定制化监控。该平台不仅助力用户实现全流程开发的高度自动化和异构智算的无边界,还能够有效降低算力成本。
联想战略的重要组成
联想万全异构智算平台作为AI 2.0时代的重要基础设施,是联想中国基础设施战略框架的核心组成部分。它与服务器、存储、数据网络、软件及超融合以及边缘基础设施产品和方案,共同构成了联想AI导向基础设施的完整体系,为企业智能化转型提供了坚实可靠的技术支撑。
https://biz.lenovo.com.cn/activity/isomerism.html