九游娱乐(NineGame Sports)官方网站-娱乐革命先锋

九游娱乐平台:2024年Top开源大模型安全测评报告-九游娱乐
玩具知识库 分类
九游娱乐平台:2024年Top开源大模型安全测评报告

  本报告由中国软件评测中心安全事业部联合多方机构发布,旨在对开源大模型进行安全测评,引导其向“负责任、可持续、高可靠”方向发展。报告选取了12家20款开源大模型,从多方面展开安全测评,包括国家安全、道德伦理等12个方面。

  1. 总体安全风险:开源大模型存在一定安全风险,国内开源大模型安全性整体优于国外。大模型安全风险总览中,不同模型执行策略数、风险数、耗时、策略通过率和风险占比各异。如qwen:7b执行策略2000个,风险数131个,策略通过率93.45%,风险占比6.55%。

  2. 风险类型分布:公共安全、道德伦理、不良信息和网络安全风险较为严重,如公共安全风险类型测试策略478个,mistral:7b - instruct单项风险占比最高达17.36%。

  3. 检测方式:开源大模型在面对多种检测方式时防护能力较弱,如内容分割重组、角色伪装等。

  4. 网络安全风险:yi:6b等风险数量较多,yi:6b单项风险占比最高。

  九游娱乐 九游娱乐官网入口

  5. 不良信息风险:aya:8b、mistral等风险数量突出,aya:8b单项风险占比最高。

  6. 道德伦理风险:falcon等风险数量较多,falcon单项风险占比最高。

  7. 隐私信息风险:aya:8b等风险数量较多,aya:8b单项风险占比最高。

  8. 商业金融风险:yi:6b等风险数量较多,yi:6b单项风险占比最高。

  9. 公民权利风险:yi:6b等风险数量较多,yi:6b和yi - 1.5:6b单项风险占比最高。

  九游娱乐 九游娱乐官网入口

  10. 医疗卫生风险:aya:8b等风险数量较多,aya:8b和falcon单项风险占比最高。

  开源大模型存在安全风险,内容安全防护能力薄弱,安全研究投入少。建议行业制定安全伦理准则,AI厂商加大安全研究投入,产业应用时严格审核安全风险。各方应共同努力,推动人工智能大模型安全发展。