点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:蚂蚁集团蚁天鉴2.0发布 打造大模型安全测评智能体
首页> IT频道> 今日头条 > 正文

蚂蚁集团蚁天鉴2.0发布 打造大模型安全测评智能体

来源:光明网2024-07-08 12:32

  7月5日,在2024世界人工智能大会“迈向AGI:大模型焕新与产业赋能论坛”上,蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。蚁天鉴2.0新增AI鉴真功能,支持图像、视频等多模态内容真实性及深度伪造检测,并在测评功能上持续升级,打造了大模型安全测评“智能体”,新增大模型X光、大模型基础设施测评两大测评功能。至此,蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。

蚂蚁集团蚁天鉴2.0发布 打造大模型安全测评智能体

蚂蚁集团联合清华大学发布“蚁天鉴2.0”

  蚂蚁集团副总裁、大安全技术部总裁李俊奎表示,大模型和Agent智能体正带来前所未见的智能体验,同时也带来了模型内部幻觉、安全漏洞和深度生成内容滥用等新的挑战。蚁天鉴旨在打造AI大模型的安全铠甲,确保大模型技术在安全可靠的环境中发挥效能。

  蚁天鉴2.0在测评端研发了“测评智能体”。该测评智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,可扩展测评垂类大模型、多模态大模型及Agent智能体,并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例,保障测评效果和效率。

  与此同时,该智能体也增加了两项新功能。一是“大模型X-ray”,即大模型X光,可针对大模型的内在神经元进行X光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。二是“大模型基础设施测评”,此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发,深入扫描模型算法组件及软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。

  同时,蚁天鉴2.0防御端新增“AI鉴真”功能,支持多模态内容真实性及深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪。目前,蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集,覆盖主流生成方案,有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。

  目前,蚁天鉴的检测与防御产品已开放给20家外部机构和企业使用,为通用大模型及医疗、金融、政务等垂直领域行业大模型应用安全保驾护航。蚂蚁AI金融助理“支小宝”结合蚁天鉴,通过大模型训练与推理风险管控、大模型风险点全方位评测、大模型用户交互风险管控等举措保障大模型应用安全,确保数据的准确性和金融逻辑的严格性。2024年,蚁天鉴商业化迈出重要一步,通过蚂蚁数科开始服务广泛的外部客户。

  论坛现场还发布了由清华大学、中关村实验室、蚂蚁集团等机构联合编制的《大模型安全实践(2024)》白皮书,为行业打造高价值参考体系。

  白皮书基于当前大模型发展趋势与挑战,提出了大模型安全实践总体框架,确立了“以人为本,AI向善”为大模型安全建设的核心,确保技术进步服务于人类福祉;以“安全、可靠、可控”三个核心维度的大模型安全技术体系,涵盖大模型安全测评与防御的综合技术方案;以及“端、边、云”为大模型安全技术的主要承载实体。蚂蚁集团安全生态副总裁邵晓东表示,白皮书还阐述了大模型在金融、医疗、政务等领域安全应用的案例,以及“五维一体”协同共治的治理框架,希望行业共同推动大模型安全生态发展。

  本场论坛汇聚了国内外研究机构和顶尖学者以及产业人士等,从前沿技术、产业应用等不同视角分享了大模型安全的研究,探讨端云协同、端侧应用等最新趋势以及大模型安全最新体系与实践。这些深入的讨论,也将为大模型如何安全可靠地助力产业转型升级、推进数字经济发展提供更加明确的前进方向。(李文)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 乙巳年黄帝故里拜祖大典在河南新郑举行

  • 上海:纪念五卅运动100周年文物史料专题展开幕

独家策划

推荐阅读
2025年4月1日,船舶航行在安徽省合肥市庐江县境内的引江济淮航道上,标志着菜子湖湿地候鸟越冬季禁航结束,菜(子湖)巢(湖)线恢复通航
2025-04-01 15:40
2025年3月31日,江苏苏州吴中区光福镇,太湖之滨,桃花、樱花、油菜花等竞相绽放,生态优美,春景如画
2025-04-01 15:31
用镜头记录城市更新 青岛首届“百家媒体看改变”活动圆满闭幕
2025-03-20 10:14
"昭君杯"首届全国老年合唱大赛在北京国家大剧院正式启动
2025-03-19 16:10
2025年2月25日,云南省昭通市绥江县,新市金沙江特大桥施工现场,工人正加紧施工。
2025-02-26 15:41
2025年2月7日,重庆市巫山县曲尺乡月明村一大片梅花竞相开放、灿若红霞,游客和市民前来游玩打卡,尽享春日的快乐和惬意
2025-02-08 14:52
2025年2月5日,福建省福清市石竹山风景区,一场非遗英歌舞、建瓯挑幡等非遗表演正在进行,让游客感受中华优秀传统文化魅力,丰富景区文化内涵和游览品质
2025-02-06 15:55
2025年1月20日,江西省赣州市章贡区城市中央公园内,游船与湖水、植被、高楼相互映衬,呈现出一幅冬日多彩美丽生态画卷
2025-01-20 15:30
2025年1月16日,受低温天气影响,山西省运城盐湖出现冬季独特的“硝花”景观,水面上的硝花形态各异晶莹剔透,美不胜收。
2025-01-16 15:56
一位“行者”行走在广袤的沙漠中,遮掩着绝世的面庞,一面“古镜”掩埋于厚重的沙下,刻满了时间的裂痕。
2025-01-13 17:25
2025年1月9日,重庆市酉阳土家族苗族自治县桃花源国家森林公园白雪皑皑,雪景如画
2025-01-09 15:24
关爱卡寒假公益行 助力云南各族青少年儿童梦想起航
2025-01-08 14:42
2025年1月5日,在山西太原南站开往呼和浩特东站的D4022次列车前,游客自拍合影。
2025-01-06 16:01
2024年12月8日,广西梧州岑溪市岑城镇木榔村,生态田园中阡陌纵横线条分明,冬韵如画。
2024-12-10 16:48
2024年12月10日,贵州省黔西市绿化白族彝族乡大海子村,青山环绕树木葱茏,构成一幅美丽的生态画卷。
2024-12-10 16:40
2024年12月6日,古城苏州街头,成片的银杏、红枫等树木色彩斑斓满目缤纷,成为一道迷人的风景。
2024-12-06 15:48
2024年12月6日,初冬时节,山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙,种植户忙着管护花卉。
2024-12-06 15:48
2024年11月30日,初冬时节,河南省南阳卧龙岗文化园内,树木换上"新装",宛如一幅五彩斑斓的画卷,吸引不少市民、游客前往赏景。
2024-11-30 18:34
民以食为天,一日三餐承载着居民的幸福感。
2024-11-27 18:59
政协协商与基层社会治理的衔接,可实现协商于民协商为民,让全过程人民民主更好的在基层体现。
2024-11-24 22:51
加载更多