OpenAI的ChatGPT不仅仅是一个简单的AI语言模型,它是一个由多个AI模型和内容过滤器组成的复杂系统,旨在确保其输出不会引发尴尬或法律问题。最近,这一系统中的硬编码过滤器成为了新闻焦点,因为某些特定的名字会导致ChatGPT中断对话。这些名字包括“Brian Hood”、“Jonathan Turley”、“Jonathan Zittrain”、“David Faber”和“Guido Scorza”。这些过滤器的存在揭示了ChatGPT在处理敏感信息时所面临的挑战。
硬编码过滤器的工作原理
当用户在任何上下文中提到这些名字时,ChatGPT会一致地中断对话,回应“我无法生成响应”或“生成响应时出错”,然后终止聊天会话。这种行为是由于在将AI模型的输出返回给用户之前,硬编码过滤器会阻止其输出。值得注意的是,这些名字不会影响使用OpenAI API系统或在OpenAI Playground(开发者测试的特殊网站)中的输出。
为什么是这些名字?
1、Brian Hood:
-
背景:Brian Hood是一名澳大利亚市长,曾在2023年4月威胁要起诉OpenAI,因为ChatGPT错误地声称他因贿赂入狱,而实际上他是一名揭露公司不当行为的举报人。 -
解决方案:OpenAI同意在Hood的28天最后通牒内过滤掉虚假陈述,这可能是第一个ChatGPT硬编码名字过滤器出现的时间。
2、Jonathan Turley:
-
背景:Jonathan Turley是乔治华盛顿大学法学院教授和福克斯新闻撰稿人。2023年4月,他在一篇文章中指出,ChatGPT编造了关于他的虚假指控,包括一个不存在的性骚扰丑闻,引用了从未存在的《华盛顿邮报》文章。 -
结果:尽管Turley没有对OpenAI提起诉讼,该公司也未就此事联系过他,但这个名字仍然被加入到过滤器中。
3、Jonathan Zittrain:
-
背景:Jonathan Zittrain是哈佛大学法学院教授,研究互联网治理。他在《大西洋月刊》上发表了一篇关于AI监管和ChatGPT的文章。虽然两位教授的作品出现在《纽约时报》对OpenAI的版权诉讼中的引用中,但测试其他被引用的作者名字并未触发类似错误。 -
推测:Zittrain的名字可能是因为ChatGPT在其早期版本中对其名字的处理不当而被加入过滤器。
4、David Mayer:
-
背景:Reddit用户首次在11月26日提出“David Mayer”会导致ChatGPT中断。多人分享这个名字,Reddit用户推测与David Mayer de Rothschild有关,但没有任何证据支持这些理论。 -
解决:OpenAI告诉《卫报》,David Mayer被列入其封锁名单是一个错误,并正在努力修复。
5、David Faber和Guido Scorza:
-
背景:这两个名字的具体背景尚不清楚,但它们同样会导致ChatGPT中断对话。
硬编码过滤器的问题
1、对抗性攻击:
-
攻击者可以利用这些硬编码过滤器进行对抗性攻击。例如,Scale AI的提示工程师Riley Goodside发现,攻击者可以在图像中嵌入“David Mayer”这个名字,以浅色、几乎不可读的字体呈现,导致ChatGPT在看到图像时停止响应,而用户可能不明白原因。
2、限制系统的实用性:
-
这些过滤器可能会限制ChatGPT的实用性。例如,如果有人在网站文本中添加了禁止的名字,他们可能会利用这一点故意阻止ChatGPT浏览和处理网站。
3、不便因素:
-
阻止ChatGPT提及或处理像“David Mayer”这样的名字,可能会给共享该名字的人带来不便。例如,如果你是一名教师,你有一个名叫David Mayer的学生,你想帮助整理班级名单,ChatGPT会拒绝这项任务。
未来展望
这些硬编码过滤器的存在揭示了AI助手、大型语言模型和聊天机器人在处理敏感信息时所面临的挑战。OpenAI如何解决这些问题仍然是一个悬而未决的问题。随着技术的进步,如何在保护用户隐私和避免法律风险的同时,保持系统的灵活性和实用性,将是未来发展的关键。
0条评论