(资料图)
伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。
大语言模型引领创新浪潮席卷全球,国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时,大模型的安全风险也引发广泛担忧。此前,BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中,对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估,发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外,AI安全实验室还在主流AI框架中发现200多个漏洞,影响超过40亿终端设备。5月30日,二十届中央国家安全委员会第一次会议上也明确提出,需“提升网络数据人工智能安全治理水平”。
目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中,提示注入攻击因利用有害提示覆盖大语言模型的原始指令,具有极高危害性,也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。
为推动行业采取有效防御措施,构建更加安全可信的大语言模型,BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。 报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。
测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面,需进行网络安全测评和内容安全测评,检测模型软件、插件及供应链等的安全漏洞,并评估模型是否产生有害、有偏见、侵权或与事实不符的内容,以提出整改建设方案。在安全防御方面,报告建议应构建多层次的协同防御体系,包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性,以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面,需建设大语言模型安全风险监测预警平台,包括构建威胁情报库和建立自动化预警系统,以实时追踪安全事件、攻击模式和漏洞信息,并及时发出预警。
基于报告形成测评能力,未来,BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”,为国内大模型提供提示注入攻击风险安全测评,全面推动我国构建安全可信的人工智能。
伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。
爱出汗和不爱出汗的人,谁更健康?,肌肉,阳气,汗腺,健康,多汗症,不爱出汗
全国妇联等14部门日前印发通知,联合部署开展“少年儿童心向党关爱...
据透露,苹果公司已迫不得已对其MR头显VisionPro的生产预期进行大幅度
对于灵活就业人员来说,肯定也是有缴纳社保的必要的,它属于我们的基础
上证报中国证券网讯7月6日上午,A股三大股指低开后集体转涨。截至10时0
昨天晚上歌手李玫姐姐发文李玫于7月2日在家中轻生,经医院团队努力
每经AI快讯,在上海嘉定举办的2023中国汽车论坛上,中国机械工业联合会
截至2023年7月5日收盘,盛美上海(688082)报收于109 0元,下跌4 34%,换
对于爵士乐发源地这个问题感兴趣的朋友应该很多,这个也是目前大家比较
AppleMacBookAir13 3英寸笔记本目前京东售价7199元,下单可参加满4000
为进一步规范旅游市场秩序,净化旅游环境,提升游客满意度,营造安全有
近年来,关岭自治县紧紧围绕“三县一中心”的发展目标,大力发展中...
为什么养老金每年都要进行调整?为什么看不到在岗职工工资的调整呢?是
记者王贝艺现如今,高层住宅如雨后春笋般拔地而起,高空抛坠物问题随之
记者从中国科学院水生生物研究所获悉,世界第一头在全人工环境中成功繁
关注暑期儿童安全很多孩子坐在电动车或自行车后座时,双脚喜欢晃来晃去
宁海县气象台2023年07月05日13时53分发布雷电黄色预警信号:受对流云团
干扰素是治疗血小板增多症一线方案,根据来源不同,可分为进口干扰
第一时间提供各大券商研究所报告,最大程度减少个人投资者与机构之间信
中新网吕梁7月5日电 题:年轻人回村记:创新创业带头致富作者 范
每经AI快讯,有投资者在投资者互动平台提问:请问公司的产品有运用到无
【ITBEAR科技资讯】7月5日消息,牛津大学赛德商学院最近发布的研究报告
1、实习实训基地。2、是高等学校、中等职业学校专门用于工程训练和实习
喀喇沁旗气象台2023年07月05日09时14分发布大风蓝色预警信号:24小时内
7月5日,生意社当归基准价为160 00元 公斤,与本月初(162 00元 公斤)相
冒襄:清初的文化泰斗冒襄(MaoXiang),清代著名文化人,以其卓越的学
这是7月4日拍摄的贵州黄果树瀑布(无人机照片)。受持续降雨及上游来水
对于以房产为对象的“套路贷”犯罪行为——准确把握罪行主要特征精...
前6月44家券商分126 8亿承销保荐费 "二中一海 "居前三