当前位置：首页 » 资讯 » 新科技 » 正文

谷歌研究团队借助GPT-4成功攻克AI-Guardian审核系统！

IP属地中国·北京 编辑：李马克布头部财经 时间：2023-08-02 14:04:13

【头部财经】谷歌研究团队近期公布了一项实验，他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施。这次实验中，他们成功攻克了名为AI-Guardian的审核系统，并分享了相关的技术细节。AI-Guardian是一种AI审核系统，能够检测图片中是否存在不当内容，并判断图片是否被其他AI进行过修改。谷歌DeepMind的研究人员在一篇名为《AI-Guardian的LLM辅助开发》的论文中，讨论了使用GPT-4来“设计攻击方法、撰写攻击原理”的方案，并将这些方案应用于欺骗AI-Guardian的防御机制。
实验中，GPT-4以一系列错误的脚本和解释欺骗AI-Guardian。例如，GPT-4可以通过误导性描述使AI-Guardian将“某人拿着枪的照片”误认为是“某人拿着无害苹果的照片”，从而绕过了AI-Guardian的审核。谷歌研究团队表示，借助GPT-4的帮助，他们成功地“破解”了AI-Guardian的防御系统，将其准确性从98%降低到仅8%。目前，相关技术文档已发布在ArXiv上，对此感兴趣的人可以前去了解。然而，AI-Guardian的开发者也指出，谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再适用。考虑到其他模型也会跟进升级，谷歌的这套攻击方案将仅作为参考性质的研究成果。
这次实验展示了GPT-4的强大能力以及对AI安全性的挑战。随着AI技术的发展，对于防御机制的优化和升级显得尤为重要。虽然目前这种攻击方案的可行性将受到限制，但我们仍需加强对AI模型安全的关注和研究，以保护用户信息和网络安全。只有不断提高防御措施，才能确保人工智能的可靠性和安全性。

标签：谷歌 GPT-4 AI-Guardian

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

卖爆的 Rokid，用「小而美」告别 AI 眼镜的巨头游戏

外卖大战没打过瘾，三巨头又卷起了硬折扣。

Apple Watch Series 11 将保留上一代设计屏幕亮度更高

全国消费金融公司首个金融区块链管理平台正式发布

营销“变天”，AI渗透广告行业，开始“带货”

关于比特币，你可能不知道的（三）

全站最新

卖爆的 Rokid，用「小而美」告别 AI 眼镜的巨头游戏

外卖大战没打过瘾，三巨头又卷起了硬折扣。

Apple Watch Series 11 将保留上一代设计屏幕亮度更高

全国消费金融公司首个金融区块链管理平台正式发布

热门推荐

小米汽车公布车辆安检专利可为提高车辆通行效率提供条件

华能新能源等在贵州成立新公司

盘点宇树科技商业版图今年曾两次增资

国家军民融合产业投资基金在广东成立投资公司注册资本9500万

江苏省运河航运公司成立船舶科技公司注册资本8000万

英特尔半导体存储技术公司更名

哈啰出行在石家庄成立网络科技公司含物联网技术服务等

百果园等在杭州成立食品科技公司注册资本1000万

宗泽后名下宗后时代更名为营养素递

中铁资本等在温州成立股权投资中心出资额12.4亿

抖音在上海成立小荷智能医疗科技公司

国企混改基金等在北京成立股权投资基金出资额14.9亿

济南中赢产发半导体人工智能股权投资基金登记成立出资额10亿

安徽省产业发展投资公司成立注册资本50亿

河北交通投资集团出资1.96亿成立两支新基金