优惠投机性解码：提高大语言模型在多语言环境中的推理速度

AI

推荐人：暴走AI 标签：投机性解码 AI

10个月前 (06-25)AI

韩国科学技术研究院和KT的研究人员推出“投机性解码”（Speculative Decoding），提高大语言模型（LLMs）在多语言环境中的推理速度，通过这种方法，可以显著加快模型在多语言设置下的推理时间。论文还提到，通过这种方法，他们能够在保持翻译质量的同时，显著提高翻译速度，这对于需要快速翻译服务的场景非常有用。此... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Google DeepMind推出新型策略WARP：用于通过人类反馈进行强化学习（RLHF）以对大语言模型进行对齐

AI

推荐人：暴走AI 标签：Google DeepMind WARP AI

10个月前 (06-25)AI

Google DeepMind推出新型策略WARP（Weight Averaged Rewarded Policies），用于通过人类反馈进行强化学习（RLHF）以对大型语言模型（LLMs）进行对齐。这种策略的目的是在使用人类偏好训练的奖励模型来优化语言模型时，平衡模型性能和保持预训练知识。论文通过一系列实验验证了WA... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠以视觉为中心的方法设计！多模态大语言模型系列Cambrian-1

AI

推荐人：暴走AI 标签：Cambrian-1 AI

10个月前 (06-25)AI

纽约大学的研究人员推出多模态大语言模型系列Cambrian-1，这些模型采用以视觉为中心的方法设计。多模态大型语言模型结合了视觉和语言能力，旨在更好地理解和生成与图像和文本相关的信息。Cambrian-1的研究不仅达到了最先进的性能水平，而且还提供了一个全面的、开放的指令调整MLLM的“食谱”。研究团队提供了模型权重、... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 D-MERIT数据集：信息检索（IR）模型的评估方法

AI

推荐人：暴走AI 标签：D-MERIT数据集 AI

10个月前 (06-25)AI

亚马逊研究院、巴伊兰大学和艾伦人工智能研究所推出D-MERIT数据集，关于信息检索（Information Retrieval，简称IR）模型的评估方法。信息检索模型的任务是在一个大型的文档集合中，根据用户提出的查询（query），找出与之相关的文档段落（passages）。这就像我们在互联网上搜索信息时，搜索引擎会返... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估基准BigCodeBench：用来测试大型编程语言模型在代码生成方面的能力

AI

推荐人：暴走AI 标签：BigCodeBench AI

10个月前 (06-25)AI

评估基准BigCodeBench，它专门用来测试大型编程语言模型（LLMs）在代码生成方面的能力。这个基准通过设计具有多种功能调用和复杂指令的编程任务，来挑战和评估这些模型是否能够像人类开发者一样解决实际的编程问题。通过这种评估，研究人员和开发人员可以更好地理解LLMs在编程任务中的表现，以及它们在实际应用中的潜力和局... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠全面基准测试工具VideoHallucer：专门用来检测和评估LVLMs在视频理解任务中的幻觉问题

AI

推荐人：暴走AI 标签：VideoHallucer 幻觉 AI

10个月前 (06-25)AI

北京通用人工智能研究院、通用人工智能国家重点实验室、北京大学和加州大学圣克鲁斯分校推出全面基准测试工具VideoHallucer，专门用来检测和评估LVLMs在视频理解任务中的幻觉问题。所谓“幻觉”，指的是这些模型在理解视频内容时，可能会生成与实际视频内容不符、无关或无意义的信息，这种现象可能会误导用户。VideoHa... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态模型LongVA:更好地理解和处理非常长的视频序列

AI

推荐人：暴走AI 标签：LongVA 多模态模型 AI

10个月前 (06-25)AI

LMMs 实验室团队、新加坡南洋理工大学和新加坡科技大学的研究人员推出Long Video Assistant（LongVA）模型，让大型多模态模型（LMMs）更好地理解和处理非常长的视频序列。这里的“长视频”指的是视频帧数很多，可能达到数千帧。以往的模型在处理这类视频时会遇到困难，因为它们的视觉编码器会产生大量的视... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 4K4DGen：将静态全景图像转换成4K分辨率的4D（即具有时间和空间维度）动态场景

AI

推荐人：暴走AI 标签：4K4DGen AI

10个月前 (06-24)AI

Pico、德克萨斯大学奥斯汀分校和加州大学洛杉矶分校的研究人员推出4K4DGen，它能够将静态全景图像转换成4K分辨率的4D（即具有时间和空间维度）动态场景。这项技术对于虚拟现实（VR）和增强现实（AR）应用来说是一个巨大的突破，因为它提供了一种新的方式来创造沉浸式和动态的环境。目前4K4DGen的局限性，比如当前技术... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新方法ToVo：通过投票机制和思维链过程来创建一个开源的、高质量的数据集，用于检测和分类有害内容

AI

推荐人：暴走AI 标签：ToVo AI

10个月前 (06-24)AI

新方法ToVo（Toxicity Taxonomy via Voting），它旨在通过投票机制和思维链（Chain-of-Thought）过程来创建一个开源的、高质量的数据集，用于检测和分类有害内容（toxic content）。这种方法特别关注提高现有有害内容检测模型的透明度、可定制性和可复现性。论文还讨论了ToVo... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠一种新的机器翻译方法MeritFed：基于个性化联邦学习算法，专门针对低资源语言的翻译任务

AI

推荐人：暴走AI 标签：MeritFed AI

10个月前 (06-24)AI

一种新的机器翻译方法MeritFed，它基于个性化联邦学习（Personalized Federated Learning）算法，专门针对低资源语言（Low-Resource Languages，简称LRLs）的翻译任务。低资源语言通常缺乏足够的数据来训练高效的机器翻译模型。MeritFed算法的核心思想是，即使在不同... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MMFM-Challenge：用于改进多模态基础模型（MMFMs）在特定任务上的表现，尤其是文档理解方面

AI

推荐人：暴走AI 标签：MMFM-Challenge AI

10个月前 (06-24)AI

新框架“多模态结构化生成”（Multimodal Structured Generation），它用于改进多模态基础模型（Multimodal Foundation Models，简称MMFMs）在特定任务上的表现，尤其是文档理解方面。MMFMs是结合了不同模态（如视觉和语言）的预训练基础模型，虽然在多种任务上表现出色... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠用于自动驾驶车辆模拟和基准测试的数据驱动工具NAVSIM

AI

推荐人：暴走AI 标签：NAVSIM AI

10个月前 (06-24)AI

新框架NAVSIM是一个用于自动驾驶车辆模拟和基准测试的数据驱动工具。NAVSIM特别关注于评估基于视觉的驾驶策略，这些策略试图让自动驾驶车辆能够理解和响应它们周围的世界。NAVSIM在CVPR 2024上举办的一个竞赛，吸引了来自世界各地的团队提交了多种方法，展示了NAVSIM在推动自动驾驶研究方面的潜力。此外，论文... 阅读全文

直达链接好 0 不好 0 已关闭评论