互联网频道 频道

上海交大师生畅用满血DeepSeek!昇腾加速中国自主创新大模型

  近日,上海交通大学基于昇腾Atlas 800T A2算力集群,成功完成DeepSeek全系列模型的本地化部署,成为国内首个实现千亿级大模型全栈国产化部署的高校。此次部署涵盖DeepSeek-R1、DeepSeek-V3等核心模型,重点服务于教学、科研、管理和服务等多场景,标志着高校AI基础设施建设迈入新阶段。

  这背后,是昇腾先进架构带来的卓越性能以及原厂服务FAE的支持,为多个DeepSeek模型提供算力支撑。针对高校场景的特殊需求打造三大技术突破:

  轻量化推理架构:通过昇腾Ascend核间通信优化技术,实现4台Atlas 800服务器承载DeepSeek-R1和DeepSeek-V3千亿参数推理,硬件投入成本降低65%;

  动态资源调度:基于昇腾AI原生算力平台,实现教学、科研、管理和服务等各类场景的算力弹性分配,算力资源利用率实现一定程度的提升;

  全栈自主可控:从昇腾处理器到MindSpore框架的深度适配,使DeepSeek-V3在复杂数学推理任务中的端到端时延较传统方案实现有效缩短。

  借助华为昇腾的独特优势,DeepSeek在推理效率上得到显著提升,成本也大幅降低。2025年2月4日,DeepSeek-V3、DeepSeek-R1、Janus-Pro正式上线华为昇腾社区,支持一键获取DeepSeek系列模型。

  从即日起,上海交大师生可通过网页/APP申请体验“满血版”DeepSeek,无需担心“深度思考用不了”“对话提问无反应”。同时,上海交通大学鲲鹏昇腾科教创新卓越中心也将推动DeepSeek系列模型与课程设计、科研创新等方面融合,探索AI加持下的学习与科研新范式。

  鲲鹏昇腾科教创新卓越中心定位为基于鲲鹏昇腾技术路线的校级生态合作平台,在校企合作、产教融合方面发挥重要作用,卓越中心将持续推动DeepSeek等重要AI创新在高校领域落地,进一步将人工智能技术带到师生生活、学习、科研的方方面面,逐浪世界科技最前沿。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章