找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

安远AI发布国内首个前沿AI风险监测平台,首期报告揭示十大最新洞

11月7日,安远AI正式发布 前沿AI风险监测平台(airiskmonitor.net),并同时发布首期监测结果《前沿AI风险监测报告(2025Q3)》。这是国内首个专注于评估与监测前沿AI模型灾难性风险的第三方平台。

安远AI发布国内首个前沿AI风险监测平台,首期报告揭示十大最新洞-1.jpg
平台通过基准测试和数据分析,对主流前沿大模型的滥用和失控风险进行了针对性评估和定期监测,并可以动态掌握AI模型风险现状及其变化趋势,为政策制定者、模型开发者、AI安全研究者提供参考。首期监测覆盖了全球15家领先模型公司过去一年发布的50个前沿模型,包括GPT、Claude、Gemini、Grok、Llama、Qwen、DeepSeek、MiniMax、Kimi、豆包、混元、文心一言、智谱清言等国内外主流模型。
基于对上述模型能力和安全测评,首期监测报告揭示了前沿AI风险的十大最新洞察:
1.前沿模型的风险指数过去一年持续上升
2.不同模型系列的风险指数趋势分化明显
3.推理模型带来能力分提升,但安全分未有相应提升
4.开源模型的能力和安全表现和闭源模型整体相当
5.前沿模型的网络攻击能力增长迅速
6.前沿模型的生物能力已部分超越人类专家
7.…但多数前沿模型对有害生物问题的拒绝率偏低
8.前沿模型的化学能力和安全水平提升缓慢
9.多数前沿模型的越狱防护能力不足
10.大部分前沿模型的诚实性不足
值得一提的是,平台发现DeepSeek、Qwen和MiniMax等国产模型在过去三个月内发布的最新版本,相较于先前版本在多个领域的风险指数均呈现显著下降。这一下降主要得益于模型安全分数的提升,具体表现为模型在面对滥用请求时表现出更强的拒绝倾向。这是一个积极的趋势。
详情见:
https://zhuanlan.zhihu.com/p/1973030109960246202
https://airiskmonitor.net/
回复

使用道具 举报

说点什么

您需要登录后才可以回帖 登录 | 立即注册
HOT • 推荐