互联网频道 频道

北电数智发力模型适配领域:DeepSeek全尺寸模型与国产芯片深度融合

  近日,北电数智成功实现了DeepSeek-V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等国产芯片的混元算力适配,为AI应用提供了更多算力选择。

  这一成果的背后,离不开北电数智“宝塔·模型适配平台”的有力支持。“宝塔·模型适配平台”是北电数智开发的高质量AI工具链,该平台能够抹平不同国产芯片在底层架构、软件生态上的差异,快速实现对模型的优化支持和硬件适配。在“宝塔·模型适配平台”上,用户可以忽略底层硬件的差异从而轻松高效使用各种算力。平台会自动基于大模型的调用需求,为其匹配合适的算力资源以确保如DeepSeek等模型的高效运行。

  DeepSeek模型采用了创新的混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)以及自研训练框架等多项工程化创新,这些独特创新机制使得DeepSeek模型只需消耗较少的算力资源即可实现与OpenAI模型相当的性能。而与此同时,DeepSeek模型在算法层面的创新也对AI芯片的通用性提出了更高要求。国产芯片在底层架构、软件生态等方面存在差异,这对如DeepSeek模型的适配工作带来挑战。正是基于这样的背景,“宝塔·模型适配平台”的重要性更加凸显。

  在处理推理任务方面,针对DeepSeek类超大模型,数据中心的集群化推理尤为重要。北电数智推出的混元推理技术路线与DeepSeek技术路线具有天然的匹配性。

  北电数智实现DeepSeek模型与国产算力的深度适配融合也为整个AI行业带来了深刻的启示,即只有促进和满足国产原生模型的算力需求,才能同时真正推动国产算力的发展。北电数智所推出的“星火·国产算力AI原生适配认证”,也旨在从芯片层面加强国产模型与国产算力的适配工程,推动国产芯片的场景化商业成功以及AI原生应用的加速落地。

  目前,北电数智“宝塔·模型适配平台”已完成24款基座大模型的适配工作,并正式开通企业版内测服务,用户可以在该平台上轻松构建和部署基于DeepSeek模型的AI应用支撑实际业务使用场景需求。

  关注“北电数智AI江湖”小程序,查看更多资讯。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章