优惠新型大语言模型基准测试工具LiveBench：克服现有基准测试中常见的问题，如测试数据集污染（即新模型训练时不小心包含了测试集中的数据）以及评判过程中的偏见和错误

AI

推荐人：暴走AI 标签：LiveBench AI

10个月前 (06-29)AI

Abacus.AI推出新型大语言模型基准测试工具LiveBench，它旨在克服现有基准测试中常见的问题，如测试数据集污染（即新模型训练时不小心包含了测试集中的数据）以及评判过程中的偏见和错误。简而言之，LiveBench是一个创新的基准测试工具，它通过提供更新频繁、自动评分和多样化任务的测试环境，帮助评估和推动LLM技... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ResumeAtlas：使用人工智能技术来提高简历分类的效率和准确性

AI

推荐人：暴走AI 标签：ResumeAtlas AI

10个月前 (06-29)AI

这篇论文的主题是关于如何使用人工智能技术来提高简历分类的效率和准确性。在这个数字化和网络化的时代，在线招聘变得越来越普遍，而简历分类是招聘过程中的一个重要环节。例如，一个大型公司发布了一个职位，可能会收到成千上万份简历，手动分类这些简历是一项非常耗时且容易出错的工作。这就是人工智能可以大显身手的地方。主要功能：自动... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠数据集大小恢复DSiRe：从模型的权重中直接确定训练模型时使用的样本数量

AI

推荐人：暴走AI 标签：DSiRe AI

10个月前 (06-29)AI

耶路撒冷希伯来大学的研究人员推出DSiRe（数据集大小恢复，Dataset Size Recovery），旨在从模型的权重中直接确定训练模型时使用的样本数量。具体来说，研究者们专注于在使用低秩适应（LoRA）微调模型的情况下，恢复用于微调的数据集大小。LoRA是一种流行的微调技术，它通过添加低秩权重矩阵来调整预训练模型... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新技术框架DPA-RAG：解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题

AI

推荐人：暴走AI 标签：DPA-RAG AI

10个月前 (06-29)AI

中国人民大学高岭人工智能学院和北京邮电大学人工智能学院的研究人员推出新技术框架DPA-RAG（Dual Preference Alignment for Retrieval-Augmented Generation），旨在解决大语言模型（LLMs）在进行检索增强型生成任务时面临的知识偏好不一致问题。简单来说，大型语言模... 阅读全文

直达链接好 1 不好 0 已关闭评论

优惠 T-FREE：解决大语言模型在文本编码方面的一些固有问题

AI

推荐人：暴走AI 标签：T-FREE AI

10个月前 (06-29)AI

达姆施塔特工业大学、黑森人工智能中心 (hessian.AI)和德国人工智能中心 (DFKI)的研究人员推出新技术T-FREE（Tokenizer-Free Generative Large Language Models via Sparse Representations），它旨在解决大语言模型（LLMs）在文本编... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 AUTOHALLUSION：为视觉-语言模型自动生成幻觉基准测试

AI

推荐人：暴走AI 标签：AUTOHALLUSION 视觉-语言模型 AI

10个月前 (06-29)AI

马里兰大学帕克分校的研究人员推出AUTOHALLUSION，这是一种为视觉-语言模型（Vision-Language Models，简称LVLMs）自动生成幻觉基准测试的方法。简单来说，LVLMs是一种人工智能，它们可以同时处理图像和语言信息，比如理解图片内容并根据图片生成描述文字。但问题是，这些模型有时会"幻想"出一... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MoA：用于自动压缩大语言模型的新方法

AI

推荐人：暴走AI 标签：MoA AI

10个月前 (06-28)AI

清华大学、无问芯穹、斯坦福大学和上海交通大学的研究人员推出MoA（Mixture of Sparse Attention），它是一种用于自动压缩大语言模型（LLMs）的新方法。MoA的核心思想是通过稀疏注意力机制来减轻大型语言模型在处理长文本时对内存和吞吐量的高需求。以往的稀疏注意力方法通常采用统一的模式，对所有注意力... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠自感知知识检索SEAKR：为大语言模型设计的自适应检索增强生成策略，减少大型语言模型在生成文本时出现的幻觉问题

AI

推荐人：暴走AI 标签：SEAKR 自感知知识检索 AI

10个月前 (06-28)AI

来自清华大学人工智能研究所、加州大学圣巴巴拉分校、北京理工大学和西门子科技数据与人工智能集团的研究人员推出“SEAKR”，即自感知知识检索（Self-aware Knowledge Retrieval），这是一种为大语言模型（LLMs）设计的自适应检索增强生成（Adaptive Retrieval-Augmented ... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 STEP-DPO：解决大语言模型在进行长链条数学推理时所面临的挑战

AI

推荐人：暴走AI 标签：STEP-DPO AI

10个月前 (06-28)AI

香港中文大学、哈尔滨工业大学（深圳）和SmartMore的研究人员推出新方法STEP-DPO（Step-wise Preference Optimization），它旨在解决大语言模型（LLMs）在进行长链条数学推理时所面临的挑战。长链条数学推理要求模型进行一系列精确且连贯的逻辑步骤，以确保最终答案的正确性。然而，现有... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型人工智能框架OMG-LLaVA：能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起

AI

推荐人：暴走AI 标签：OMG-LLaVA AI

10个月前 (06-28)AI

武汉大学、天工AI和南洋理工大学的研究人员推出新型人工智能框架OMG-LLaVA，它能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起。简单来说，OMG-LLaVA就像是一个超级聪明的图像处理助手，它不仅能看懂图片里有什么，还能理解图片中物体之间的关系，甚至能根据文字指令来处理图片。项目主页：https:... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠统一框架AUTODETECT：专门设计来自动检测大语言模型中的弱点

AI

推荐人：暴走AI 标签：AUTODETECT AI

10个月前 (06-25)AI

清华大学和智谱推出统一框架AUTODETECT，它专门设计来自动检测大语言模型（LLMs）中的弱点。例如，你有一个非常聪明的AI助手，它可以做很多复杂的事情，比如解决数学问题或者编写代码，但可能在某些看似简单的任务上犯错。AUTODETECT就像一个AI助手的教练，能够找出AI在哪些方面表现不佳，并提供改进的建议。 G... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠字节跳动推出新型大语言模型video-SALMONN：专门设计用于增强视频理解能力，尤其是通过语音增强的音频-视觉模型

AI

推荐人：暴走AI 标签：video-SALMONN 字节跳动 AI

10个月前 (06-25)AI

字节跳动推出新型大语言模型video-SALMONN，它专门设计用于增强视频理解能力，尤其是通过语音增强的音频-视觉（av-LLM）模型。简单来说，video-SALMONN就像一个超级智能的“视频助手”，它不仅能“看”懂视频里的画面，还能“听”懂视频中的对话、音乐和其他声音，甚至能理解人们的讲话内容。 GitHub：... 阅读全文

直达链接好 0 不好 0 已关闭评论