优惠 Humor in AI：关于AI在幽默创作领域的研究，特别是针对卡通漫画的标题生成

AI

推荐人：暴走AI 标签：Humor in AI AI

10个月前 (06-19)AI

威斯康星大学麦迪逊分校和华盛顿大学西雅图分校的研究人员发布论文，论文的主题是关于人工智能（AI）在幽默创作领域的研究，特别是针对卡通漫画的标题生成。研究人员通过收集和分析大量的人类对漫画标题的评价，来训练和评估AI模型在创作幽默标题方面的能力。例如，《纽约客》杂志发布了一幅漫画，展示了一个穿着宇航服的骑士骑着马，手持... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 BAL-PM：在大语言模型中通过偏好建模来引导模型的行为，使其更符合人类的偏好

AI

推荐人：暴走AI 标签：BAL-PM AI

10个月前 (06-19)AI

这篇论文的主题是关于如何在大语言模型（Large Language Models，简称LLMs）中通过偏好建模来引导模型的行为，使其更符合人类的偏好。简单来说，就是教一个大型的人工智能模型如何更好地理解并满足人们的需求。论文中提出的BAL-PM（Bayesian Active Learner for Preferenc... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ServiceNow推出新型问题回答数据集REPLIQA：专门设计用来评估大语言模型在处理未见过的参考内容时的性能

AI

推荐人：暴走AI 标签：REPLIQA ServiceNow AI

10个月前 (06-19)AI

ServiceNow推出新型问题回答数据集REPLIQA，它专门设计用来评估大语言模型（LLMs）在处理未见过的参考内容时的性能。这个数据集的创建是为了解决现有评估方法可能存在的数据泄露问题，即模型可能在训练阶段就已经接触过测试数据，这样就不能准确评估模型的真正能力。数据集地址：https://huggingface... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠数据集RABBITS：大语言模型在生物医学领域应用时的一个特定问题：对药物名称的脆弱性

AI

推荐人：暴走AI 标签：RABBITS 数据集 AI

10个月前 (06-19)AI

麻省理工学院、哈佛大学、麻省总医院、波士顿儿童医院、奥胡斯大学、弗吉尼亚大学、马斯特里赫特大学、庞培法布拉大学和贝斯以色列女执事医疗中心的研究人员发布论文，讨论了大语言模型（LLMs）在生物医学领域应用时的一个特定问题：对药物名称的脆弱性。特别是在处理品牌名和通用名之间的替换时，模型的性能可能会显著下降。研究者们创建了... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠韩国科学技术研究院推出新方法TroL：提升大型语言和视觉模型（LLVMs）的效率和性能

AI

推荐人：暴走AI 标签：TroL AI

10个月前 (06-19)AI

韩国科学技术研究院推出新方法TroL（Traversal of Layers，即层次遍历），它用于提升大型语言和视觉模型（LLVMs）的效率和性能。TroL的核心思想是通过在模型中重复使用层（即“层次遍历”），来模拟人类在回答问题时回顾和重新审视信息的过程，从而在不增加额外计算负担的情况下提高模型的理解和生成能力。论文... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠深度求索推出开源代码模型DeepSeek-Coder-V2：专门用于理解代码和解决编程问题

AI

推荐人：暴走AI 标签：DeepSeek-Coder-V2 深度求索 AI

10个月前 (06-19)AI

深度求索推出开源代码模型DeepSeek-Coder-V2，这是一个专门用于理解代码和解决编程问题的人工智能系统。它通过大量的训练，能够执行与编程相关的多种任务，比如编写代码、修复错误、甚至进行数学推理。尽管DeepSeek-Coder-V2在多个标准基准测试中表现出色，与一些封闭源代码模型相比具有竞争力，但在遵循复杂... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多智能体软件开发框架AGILECODER：基于敏捷方法论，通过模拟人类软件开发流程来自动化软件的开发过程

AI

推荐人：暴走AI 标签：AGILECODER AI

10个月前 (06-19)AI

越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型多智能体软件开发框架AGILECODER，它基于敏捷方法论（Agile Methodology，简称AM），旨在通过模拟人类软件开发流程来自动化软件的开发过程。这个框架通过分配不同的敏捷角色（如产品经理、开发者和测试员）给不同的智能体，让它们协作完成软件开发任... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Depth Anywhere：360度全景图像的深度估计的准确性

AI

推荐人：暴走AI 标签：Depth Anywhere AI

10个月前 (06-19)AI

阳明交通大学的研究人员推出Depth Anywhere，提高360度全景图像的深度估计的准确性。深度估计是一种计算机视觉技术，它可以帮助计算机理解图像中物体的远近关系，这对于虚拟现实、自动驾驶导航和沉浸式媒体应用等领域非常重要。此方法在一些基准数据集上进行了测试，显示出在零样本（zero-shot）情况下，也就是模型在... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在RAG系统中是如何依赖外部检索到的上下文信息来回答问题

AI

推荐人：暴走AI 标签：RAG AI

10个月前 (06-19)AI

马萨诸塞大学阿默斯特分校、微软和马里兰大学帕克分校的研究人员发布论文，论文的主题是探讨在检索增强生成（Retrieval-Augmented Generation, RAG）系统中，语言模型在回答事实性问题时，是如何利用外部知识与模型内部参数信息的。RAG系统通过引入外部上下文来增强语言模型的推理能力，这在搜索、问答和... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型音乐生成模型JEN-1 DreamStyler：根据用户提供的参考音乐片段，学习并捕捉音乐中的独特概念，然后生成符合这一概念的新音乐作品

AI

推荐人：暴走AI 标签：JEN-1 DreamStyler AI

10个月前 (06-19)AI

新型音乐生成模型JEN-1 DreamStyler，它能够根据用户提供的参考音乐片段，学习并捕捉音乐中的独特概念，然后生成符合这一概念的新音乐作品。JEN-1 DreamStyler在定性和定量评估中都优于几个基线模型，并且提供了演示，可以在其网站上听到生成的音乐示例。此外，论文还介绍了一个新的数据集和评估协议来支持这... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估框架HPT：更精确地评估大语言模型在处理不同任务时的有效性

AI

推荐人：暴走AI 标签：HPT 大语言模型 AI

10个月前 (06-19)AI

印度理工学院、美国南卡罗来纳大学人工智能研究所、美国罗彻斯特理工学院、美国亚马逊 GenAI和美国斯坦福大学推出评估框架“Hierarchical Prompting Taxonomy (HPT)”，用于更精确地评估大语言模型（LLMs）在处理不同任务时的有效性。这个框架特别关注了如何根据不同任务的复杂性，采用不同层次... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在线偏好学习算法“行为临近偏好优化（BPO）”：改善大语言模型与人类期望的一致性

AI

推荐人：暴走AI 标签：BPO 大语言模型行为临近偏好优化 AI

10个月前 (06-19)AI

加州大学圣巴巴拉分校和卡内基梅隆大学的研究人员推出新的在线偏好学习算法，名为“行为临近偏好优化”（BPO），它用于改善大语言模型（LLMs）与人类期望的一致性。BPO算法的核心思想是在模型训练过程中，使学习到的语言模型尽可能地接近行为模型（即生成训练样本的模型），以此来构建一个更合适的信任域，从而提高模型的性能。例如... 阅读全文

直达链接好 0 不好 0 已关闭评论