人工智能大语言模型是目前科技领域最闪亮、最令人兴奋的东西,但它们正在引出一个新问题:它们非常容易被滥用,成为强大的网络钓鱼或诈骗工具,而且骗子不需要具备任何编程技能。更糟糕的是,目前还没有已知的解决办法。
科技公司正竞相将这些语言模型嵌入到大量的产品中,以帮助人们预订旅行行程、整理日历、做会议笔记等等。
但这些产品的工作方式——接受用户的指令,然后在互联网上搜索答案——带来了大量新的风险。有了人工智能,它们可以被用于各种恶意任务,包括泄露人们的私人信息,帮助骗子钓鱼、撰写垃圾邮件和进行诈骗。专家警告说,我们正走向一场个人安全和隐私方面的“灾难”。
以下是人工智能语言模型最容易被滥用的三种方式。
(来源:Pixabay)
有毒数据
特拉默与来自谷歌、英伟达和初创公司 Robust Intelligence 的研究团队一起发现,人工智能语言模型甚至在部署之前就很容易受到攻击。
特拉默说,大型人工智能模型是根据从互联网上爬取的大量数据进行训练的。目前,科技公司只能单方面相信这些数据没有被恶意篡改。
但研究人员发现,“毒害”大型人工智能模型所用的训练数据集是可行的。只需 60 美元,他们就可以购买域名,填满他们特意挑选的图片,然后等着它们被大型数据集捕获。他们还可以编辑维基百科或在条目中添加句子,这些条目最终会进入人工智能模型的数据集。
更糟糕的是,这些数据在人工智能模型的训练集中重复的次数越多,这种关联就越强。特拉默说,通过用足够多的例子来“毒害”数据集,就有可能永远影响模型的行为和输出。
他的团队目前没有找到任何“有毒数据攻击”的证据,但特拉默表示,这只是时间问题,因为在网络搜索中加入聊天机器人,会让攻击者更有获利动机。
不存在修复
科技公司已经意识到了这些问题,但目前还没有什么好的解决方法,独立研究人员和软件开发人员西蒙·威利森(Simon Willison)说,他研究的方向是提示注入。
当我们询问谷歌和 OpenAI 它们是如何解决这些安全漏洞时,其发言人拒绝置评。
微软表示,它正在与开发者合作,监控他们的产品可能如何被滥用,并减轻这些风险。但它承认,这个问题是真实存在的,并正在追踪潜在的攻击者可能会如何滥用这些工具。
微软人工智能安全工作的拉姆·尚卡尔·西瓦·库马尔(Ram Shankar Siva Kumar)说:“目前这个问题还没有解药。”他没有评论他的团队在 GPT 驱动的必应上线前是否发现了任何间接提示注入的证据。
纳拉亚南说,人工智能公司应该做得更多,先发制人地研究这个问题。他说:“看到他们正在用打地鼠的策略来解决聊天机器人的安全漏洞,我很惊讶。”
支持:Ren
原文:
https://www.technologyreview.com/2023/04/03/1070893/three-ways-ai-chatbots-are-a-security-disaster/
相关文章
猜你喜欢