欢迎访问网乐聚!

华为推出全新架构昇腾 AI 计算集群,可支持超万亿参数大模型训练

金融科技 2023-10-03 wedh5768

在华为全联接大会 2023 期间,华为常务董事、ICT 基础设施业务管理委员会主任、企业 BG 总裁汪涛正式发布全新架构的昇腾 AI 计算集群 —— Atlas 900 SuperCluster,可支持超万亿参数的大模型训练。

据介绍,新集群采用全新的华为星河 AI 智算交换机 CloudEngine XH16800,借助其高密的 800GE 端口能力,两层交换网络即可实现 2250 节点(等效于 18000 张卡)超大规模无收敛集群组网。同时使用了创新的超节点架构,大大提升了大模型训练能力。并从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。

与此外,华为还发布了更开放、更易用的 CANN7.0,不仅全面兼容业界的 AI 框架、加速库和主流大模型,还深度开放底层能力,让 AI 框架和加速库可以更直接地调用和管理计算资源,使能开发者自定义高性能算子,让大模型具备差异化的竞争力。

以及升级了 Ascend C 编程语言,以更高效的编程方式,简化算子实现逻辑,大幅缩短融合算子的开发周期,为 AI 模型与应用的快速开发赋能。

汪涛表示,随着人工智能进入大模型时代,大算力正在成为人工智能发展的核心引擎。华为改变传统的服务器堆叠模式,以系统架构创新打造 AI 集群,实现算力、运力、存力的一体化设计,突破大算力瓶颈。

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

Copyright © 2029 网乐聚 版权所有

苏ICP备2022030477号-6 |——:合作/投稿联系微信:nvshen2168

|—— TXT地图 | 网站地图 |