2月18日,国内领先的可观测与应用安全厂商基调听云发布了《大模型服务性能评测 DeepSeek-R1 API 版》第一期报告,对多家提供 DeepSeek-R1 API 服务的厂商进行全面评测,为开发者和终端用户提供了重要参考。
DeepSeek-R1 推理大模型自 2025 年 1 月 20 日发布以来备受关注,其逻辑推理能力出色,引发全球轰动。然而,随着用户量暴增,该模型官方服务频繁报错,服务器繁忙问题突出。在此背景下,多家第三方服务商推出相关服务,市场竞争加剧。
此次评测利用基调听云拨测工具,模拟真实用户进行主动监控,从网络性能、接口响应时间、推理速度、内容生成速度等多个关键指标,对主流云服务厂商的 API 接口展开深入测试。评测数据综合了多个城市、运营商、主机和时间维度的分析,确保结果的科学性与可靠性。
评测结果显示,在参与评测的火山引擎、DeepSeek 官方、硅基流动、腾讯云、阿里云百炼等厂商中,火山引擎表现最为突出,在 API 响应性能上全面领先,平均速度、推理速度、生成速度均为最优,可用性高达 99.83% ,是 API 接入的首选推荐。DeepSeek 官方虽推理速度较快,但首 Token 延迟长达 7.753 秒,可用性仅 42.21%,成为明显短板。硅基流动首 Token 响应快且可用性稳定,但平均速度较弱。腾讯云整体性能较低,总性能最差且可用性一般。阿里云百炼平均速度最慢,首包时间最长,不过可用性尚可。
DeepSeek R1评测结果(图片来自基调听云公众号)
从不同维度进一步分析,火山引擎在北京、上海、广州、深圳、苏州、成都、重庆、武汉、成都、杭州等所有城市测试中均保持最高性能;DeepSeek 官方在重庆的首 Token 时间最长,其他城市在 9 秒内;硅基流动的可用性在广州表现最差,其他城市在 98% 以上。运营商维度,DeepSeek 官方在中国移动网络下建连时间较长,其他运营商下均在 0.05 秒以内,其余服务商指标未见明显差异。主机维度,腾讯云主机数量最多、分布最广,DeepSeek 官方主机数量最少。时间维度上,不同时段各服务商表现不同,整体受用户流量和服务器负载影响。
此次评测为开发者和企业用户提供了深度数据支撑,有助于其科学选择服务商,优化产品体验。此外,基调听云还为普通用户整理了支持 DeepSeek-R1 的第三方服务及相关网站信息,涵盖免费和付费模式,方便用户选择使用。同时,基调听云预告正在对网页版本的 DeepSeek-R1 服务进行评测,后续将发布网页版评测结果。