英国《卫报》近日发现,本月刚刚上线的AI搜索引擎 ChatGPT搜索 可能被诱导生成完全误导性的摘要。这一发现引发了对AI搜索功能安全性和可靠性的担忧。
问题详情
ChatGPT搜索功能旨在通过总结网页内容(如产品评论)来加快浏览速度。然而,《卫报》通过实验发现,只需在网页中插入隐藏文本,就能让ChatGPT忽略负面评论并生成“完全正面”的摘要。此外,这种方法还可以诱导ChatGPT输出恶意代码。
隐藏文本攻击的风险
隐藏文本攻击是大语言模型(LLM)面临的已知风险,但这是首次在实时AI搜索产品中成功演示此类攻击。《卫报》指出,作为搜索领域的领导者,谷歌在处理类似问题上拥有更多经验。
OpenAI的回应
当TechCrunch联系OpenAI时,该公司并未对此具体事件发表评论,但表示已采用多种方法屏蔽恶意网站,并正在不断改进系统。(来源)
0条评论