唯一全球前三开源模型！文心4.5系列模型登智源安全榜国内第一-互联网专区

唯一全球前三开源模型！文心4.5系列模型登智源安全榜国内第一

作者：网络编辑：程门 2025-11-19 16:35

　　近日，智源研究院旗下大模型评测体系 FlagEval 发布最新一期“安全与价值观榜”。在该榜单中，百度开源模型 ERNIE-4.5-300B-A47B 表现突出：总榜成绩位列国内第一、全球第三，在开源模型中业内知名，总合格率达到 85.58%，成为唯一进入全球前三的开源模型。

　　FlagEval推出的全新“安全与价值观榜单”，围绕语料安全、模型安全、风险防控等关键指标，对主流大模型的安全能力进行系统评估。据了解，本次评测覆盖 18家主流厂商的大语言模型，包括OpenAI、Google、Anthropic、Microsoft、深度求索等国内外头部机构。

　　FlagEval 最新榜单显示，全球头部模型在安全合规能力上已逐步形成成熟体系。其中，Claude Sonnet 4 以86.76%位居第一，GPT-4.1 紧随其后排名第二， ERNIE-4.5-300B-A47B 以85.58%的综合表现位列全球第三，国内第一，成为唯一进入前三的国产大模型。

　　值得注意的是，ERNIE-4.5-300B-A47B在开源榜业内知名，是全球优异进入前三的开源模型，稳居安全合规第一梯队，标志着中国团队在安全合规能力上跻身国际第一梯队。

　　从行业整体来看，厂商间差异仍然明显。头部模型在策略偏移防御（如拒答率、风险感知）上更为稳定；不同厂商对本地化价值标准的理解差异，也直接拉开了整体得分区间。与此同时，以 ERNIE-4.5-300B-A47B 为代表的领先开源模型正在快速缩小与国际闭源模型的差距。

　　业内专家指出，安全性正成为衡量大模型可大规模落地的关键指标，其复杂性与专业度正成为核心竞争力。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

关注我们