大模型安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标,覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力,为大模型研发和落地保驾护航。
366电竞赛事数据近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。
资料显示,360是中国人工智能产业发展联盟(AIIA)安全治理委员会副组长单位以及大模型安全风险防范能力系列评估规范“核心参编单位”,同时作为中国网络空间安全协会人工智能安全治理专业委员会首批成员单位,参与大模型语料库和安全评测。
360集团表示,自身在网络安全领域深耕多年,拥有的安全大数据规模全球领先;且作为国内较早布局人工智能大模型的企业,360自研的认知型通用大模型——“360智脑”在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力第一梯队。为对应人工智能时代出现的AI安全新挑战,360提出“以模制模”的理念,用人工智能对付人工智能,研发360安全大模型,目前已经在多个重要安全领域实现大模型能力的全面赋能。
此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行,此次测试数据共7343条,包含了个人隐私、歧视偏见、违法违规等维度,使用Responsibility Score(负责度评分)和 Safety Score(安全评分)两个指标。结果显示,360智脑在两方面评分均表现良好,超过目前市面上主流的阿里、智谱、百川等7个大模型,综合成绩第一,表明360智脑不仅具备较强的安全意识,还能更好回答安全问题,在安全性能方面优势很大。
766.42MB
查看697.99MB
查看80.7MB
查看733.17MB
查看881.91MB
查看320.61MB
查看524.35MB
查看374.59MB
查看245.73MB
查看116.39MB
查看788.36MB
查看140.35MB
查看734.99MB
查看375.89MB
查看169.66MB
查看328.52MB
查看636.71MB
查看131.88MB
查看848.56MB
查看985.95MB
查看665.81MB
查看549.91MB
查看950.22MB
查看640.50MB
查看610.67MB
查看316.61MB
查看485.65MB
查看154.73MB
查看920.68MB
查看963.52MB
查看778.69MB
查看953.36MB
查看283.78MB
查看103.36MB
查看340.25MB
查看446.53MB
查看983.46MB
查看750.44MB
查看985.42MB
查看829.52MB
查看920.85MB
查看823.93MB
查看564.69MB
查看707.80MB
查看859.67MB
查看347.56MB
查看280.66MB
查看572.47MB
查看199.29MB
查看563.17MB
查看861.82MB
查看874.52MB
查看688.57MB
查看665.36MB
查看625.18MB
查看346.33MB
查看527.80MB
查看586.11MB
查看692.36MB
查看133.58MB
查看927.54MB
查看734.55MB
查看843.57MB
查看658.75MB
查看865.83MB
查看271.26MB
查看990.91MB
查看481.10MB
查看105.24MB
查看784.94MB
查看633.90MB
查看609.82MB
查看670.89MB
查看147.81MB
查看359.76MB
查看108.57MB
查看443.69MB
查看180.33MB
查看599.46MB
查看375.20MB
查看801.65MB
查看144.49MB
查看170.17MB
查看831.47MB
查看980.83MB
查看757.52MB
查看276.65MB
查看391.95MB
查看200.75MB
查看308.32MB
查看743.67MB
查看329.25MB
查看174.67MB
查看467.37MB
查看998.82MB
查看194.77MB
查看952.47MB
查看286.53MB
查看683.76MB
查看427.72MB
查看306.89MB
查看112.32MB
查看722.59MB
查看232.59MB
查看
488凯里kw
莫斯科十多个购物中心收到爆炸威胁,普京回应音乐厅恐袭事件「更关心背后雇主是谁」,哪些信息值得关注?✛
2025-07-08 10:06:34 推荐
845188****5792
歌手吹牛老爹涉嫌多起性侵案✟
2025-07-09 15:17:49 不推荐
950152****3309
晋江教育局通报初中女生坠亡✣
2025-07-08 17:16:18 推荐
60飞碟高尔夫
小米汽车销售称泄密要赔百万✦
2025-07-07 16:34:14 推荐