2025年一月以来,由 DeepSeek 团队开发的系列模型,如拥有6710亿参数的大型语言模型 DeepSeek-R1 等,一经发布便在全球范围内引发热议,其先进的架构和卓越的性能吸引了众多开发者与科技企业的目光。国内外众多企业争先上线DeepSeek系列大模型,而昇腾凭借强大的算力支持与技术协同能力,让 DeepSeek 的上线进程按下“快进键”,以令人惊叹的中国速度,实现了技术与应用的高效对接。
事实上,早在 DeepSeek 模型发布之初,昇腾就已深度参与其中。2024年12月26日,DeepSeek AI正式发布大型语言模型DeepSeek-V3,发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理。在2025 年春节期间,合作成果集中爆发,多家企业相继官宣基于昇腾成功上线 DeepSeek 相关服务。
潞晨科技推出基于昇腾算力的 DeepSeek R1 系列推理API及云镜像服务;SiliconCloud(硅基流动)上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1;移动云基于昇腾生态全版本、全尺寸、全功能支持DeepSeek系列产品,全面上线13个中国移动智算中心;电信天翼云“息壤”智算平台从昇腾硬件、推理引擎到模型服务支持DeepSeek-R1满血版至轻量化蒸馏模型灵活部署;联通云基于联合创新和自研加速引擎,构建昇腾智算底座,与DeepSeek-R1模型深度对接。同时,DeepSeek-R1、V3、V2、Janus-Pro等模型正式上线昇腾社区、电信魔乐社区,支持在昇腾硬件平台上开箱即用,推理快速部署。
DeepSeek的成功,展示了中国在AI领域的创新实力,加速了大模型更加广泛的应用,为人们的生活带来更多的便利和乐趣。AI行业将迎来更为广阔的发展空间,中国在大模型高速发展中发挥越来越重要的作用,贡献中国速度,展现中国力量。