大语言模型
优惠 AGENTPOISON:针对大语言模型代理的红队攻击手段
标签:AGENTPOISON
AI
4个月前 (07-18)AI
芝加哥大学、伊利诺伊大学香槟分校、威斯康星大学麦迪逊分校和加州大学伯克利分校的研究人员推出AGENTPOISON,它是一种针对大语言模型(LLM)代理的红队攻击手段。这些代理通常在各种应用中表现出色,比如自动驾驶、医疗咨询和知识问答等。这些代理依赖于记忆模块或检索增强生成(RAG)机制,通过检索知识库中的过去知识和类似... 阅读全文
优惠 LLMs新训练方法Patch-Level Training:用于提高大语言模型的训练效率
4个月前 (07-18)AI
微信 AI 模式识别中心的研究人员推出一种新的训练方法,名为“Patch-Level Training”,用于提高大语言模型(LLMs)的训练效率。这种方法通过将多个词元(tokens)压缩成一个“补丁”(patch),从而减少序列长度,降低计算成本。例如,我们有一个句子 "The quick brown fox ju... 阅读全文
优惠 检索增强型图像描述生成模型的鲁棒性Robust-cap:通过查找相关信息来帮助生成图像描述的人工智能模型
标签:Robust-cap
AI
4个月前 (07-17)AI
哥本哈根大学计算机科学系、里斯本大学高等技术学院 和Comcast 应用人工智能的研究人员发布论文,论文讨论的是“检索增强型图像描述生成模型的鲁棒性”。简单来说,就是研究一种可以通过查找相关信息来帮助生成图像描述的人工智能模型。这种模型的特别之处在于,它不仅仅是自己“想”出描述,而是会先去“查找”一些已经存在的描述,然... 阅读全文