优惠 attack-agent：多模态智能体的安全性研究，特别是探讨了这些智能体在面对对抗性攻击时的脆弱性

AI

推荐人：暴走AI 标签：多模态智能体 AI

1年前 (2024-06-19)AI

卡内基·梅隆大学的研究人员发布论文，论文的主题是关于对多模态智能体（能够处理视觉和语言信息的AI系统）的安全性研究，特别是探讨了这些智能体在面对对抗性攻击时的脆弱性。多模态智能体被设计用来在真实环境中执行任务，比如网上购物代理，它们可以根据用户的指令来选择商品。论文通过实验表明，即使在对抗性攻击下，通过适当的防御措施，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Safety Arithmetic：确保大语言模型在各种使用场景下的安全性

AI

推荐人：暴走AI 标签：Safety Arithmetic AI

1年前 (2024-06-19)AI

新加坡科技设计大学和印度理工学院 Kharagpur 分校的研究人员发布论文，论文的主题是关于如何确保大型语言模型（LLMs）在各种使用场景下的安全性。随着这些模型在翻译、问答等应用中的广泛使用，确保它们与人类价值观保持一致，不产生有害内容，变得尤为重要。通过这种方法，研究人员能够在不牺牲模型实用性的前提下，显著提高模... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Humor in AI：关于AI在幽默创作领域的研究，特别是针对卡通漫画的标题生成

AI

推荐人：暴走AI 标签：Humor in AI AI

1年前 (2024-06-19)AI

威斯康星大学麦迪逊分校和华盛顿大学西雅图分校的研究人员发布论文，论文的主题是关于人工智能（AI）在幽默创作领域的研究，特别是针对卡通漫画的标题生成。研究人员通过收集和分析大量的人类对漫画标题的评价，来训练和评估AI模型在创作幽默标题方面的能力。例如，《纽约客》杂志发布了一幅漫画，展示了一个穿着宇航服的骑士骑着马，手持... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 BAL-PM：在大语言模型中通过偏好建模来引导模型的行为，使其更符合人类的偏好

AI

推荐人：暴走AI 标签：BAL-PM AI

1年前 (2024-06-19)AI

这篇论文的主题是关于如何在大语言模型（Large Language Models，简称LLMs）中通过偏好建模来引导模型的行为，使其更符合人类的偏好。简单来说，就是教一个大型的人工智能模型如何更好地理解并满足人们的需求。论文中提出的BAL-PM（Bayesian Active Learner for Preferenc... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ServiceNow推出新型问题回答数据集REPLIQA：专门设计用来评估大语言模型在处理未见过的参考内容时的性能

AI

推荐人：暴走AI 标签：REPLIQA ServiceNow AI

1年前 (2024-06-19)AI

ServiceNow推出新型问题回答数据集REPLIQA，它专门设计用来评估大语言模型（LLMs）在处理未见过的参考内容时的性能。这个数据集的创建是为了解决现有评估方法可能存在的数据泄露问题，即模型可能在训练阶段就已经接触过测试数据，这样就不能准确评估模型的真正能力。数据集地址：https://huggingface... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠数据集RABBITS：大语言模型在生物医学领域应用时的一个特定问题：对药物名称的脆弱性

AI

推荐人：暴走AI 标签：RABBITS 数据集 AI

1年前 (2024-06-19)AI

麻省理工学院、哈佛大学、麻省总医院、波士顿儿童医院、奥胡斯大学、弗吉尼亚大学、马斯特里赫特大学、庞培法布拉大学和贝斯以色列女执事医疗中心的研究人员发布论文，讨论了大语言模型（LLMs）在生物医学领域应用时的一个特定问题：对药物名称的脆弱性。特别是在处理品牌名和通用名之间的替换时，模型的性能可能会显著下降。研究者们创建了... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠韩国科学技术研究院推出新方法TroL：提升大型语言和视觉模型（LLVMs）的效率和性能

AI

推荐人：暴走AI 标签：TroL AI

1年前 (2024-06-19)AI

韩国科学技术研究院推出新方法TroL（Traversal of Layers，即层次遍历），它用于提升大型语言和视觉模型（LLVMs）的效率和性能。TroL的核心思想是通过在模型中重复使用层（即“层次遍历”），来模拟人类在回答问题时回顾和重新审视信息的过程，从而在不增加额外计算负担的情况下提高模型的理解和生成能力。论文... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠深度求索推出开源代码模型DeepSeek-Coder-V2：专门用于理解代码和解决编程问题

AI

推荐人：暴走AI 标签：DeepSeek-Coder-V2 深度求索 AI

1年前 (2024-06-19)AI

深度求索推出开源代码模型DeepSeek-Coder-V2，这是一个专门用于理解代码和解决编程问题的人工智能系统。它通过大量的训练，能够执行与编程相关的多种任务，比如编写代码、修复错误、甚至进行数学推理。尽管DeepSeek-Coder-V2在多个标准基准测试中表现出色，与一些封闭源代码模型相比具有竞争力，但在遵循复杂... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多智能体软件开发框架AGILECODER：基于敏捷方法论，通过模拟人类软件开发流程来自动化软件的开发过程

AI

推荐人：暴走AI 标签：AGILECODER AI

1年前 (2024-06-19)AI

越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型多智能体软件开发框架AGILECODER，它基于敏捷方法论（Agile Methodology，简称AM），旨在通过模拟人类软件开发流程来自动化软件的开发过程。这个框架通过分配不同的敏捷角色（如产品经理、开发者和测试员）给不同的智能体，让它们协作完成软件开发任... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Depth Anywhere：360度全景图像的深度估计的准确性

AI

推荐人：暴走AI 标签：Depth Anywhere AI

1年前 (2024-06-19)AI

阳明交通大学的研究人员推出Depth Anywhere，提高360度全景图像的深度估计的准确性。深度估计是一种计算机视觉技术，它可以帮助计算机理解图像中物体的远近关系，这对于虚拟现实、自动驾驶导航和沉浸式媒体应用等领域非常重要。此方法在一些基准数据集上进行了测试，显示出在零样本（zero-shot）情况下，也就是模型在... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在RAG系统中是如何依赖外部检索到的上下文信息来回答问题

AI

推荐人：暴走AI 标签：RAG AI

1年前 (2024-06-19)AI

马萨诸塞大学阿默斯特分校、微软和马里兰大学帕克分校的研究人员发布论文，论文的主题是探讨在检索增强生成（Retrieval-Augmented Generation, RAG）系统中，语言模型在回答事实性问题时，是如何利用外部知识与模型内部参数信息的。RAG系统通过引入外部上下文来增强语言模型的推理能力，这在搜索、问答和... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型音乐生成模型JEN-1 DreamStyler：根据用户提供的参考音乐片段，学习并捕捉音乐中的独特概念，然后生成符合这一概念的新音乐作品

AI

推荐人：暴走AI 标签：JEN-1 DreamStyler AI

1年前 (2024-06-19)AI

新型音乐生成模型JEN-1 DreamStyler，它能够根据用户提供的参考音乐片段，学习并捕捉音乐中的独特概念，然后生成符合这一概念的新音乐作品。JEN-1 DreamStyler在定性和定量评估中都优于几个基线模型，并且提供了演示，可以在其网站上听到生成的音乐示例。此外，论文还介绍了一个新的数据集和评估协议来支持这... 阅读全文

直达链接好 0 不好 0 已关闭评论