优惠新框架LMC：用于对大语言模型在高度主观任务上的表现进行基准测试

AI

推荐人：暴走AI 标签：LMC 基准测试大语言模型 AI

10个月前 (06-16)AI

Predibase、博科尼大学的研究人员推出新框架“Language Model Council”（LMC），用于对大语言模型（LLMs）在高度主观任务上的表现进行基准测试。这个框架通过民主化的过程来评估和排名模型，尤其是在情感智能、创造性写作或说服力等主观性强、缺乏普遍共识的任务上。LMC框架的局限性，如只研究了单轮... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大型3D重建模型LRM-Zero：完全使用合成的3D数据进行训练，以实现高质量的稀疏视图3D重建

AI

推荐人：暴走AI 标签：3D重建模型 LRM-Zero AI

10个月前 (06-16)AI

Adobe 研究、石溪大学和基尔大学的研究人员推出大型3D重建模型LRM-Zero，它完全使用合成的3D数据进行训练，以实现高质量的稀疏视图3D重建。LRM-Zero的核心是名为Zeroverse的过程化3D数据集，这个数据集通过简单的基本形状、随机纹理和增强（例如高度场、布尔差分和线框）自动合成。LRM-Zer... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型基准测试工具MUIRBENCH：用来评估多模态大语言模型在理解多图像方面的能力

AI

推荐人：暴走AI 标签：MUIRBENCH 基准测试工具多模态大语言模型 AI

10个月前 (06-16)AI

南加州大学、宾大、明尼苏达大学、加州大学戴维斯分校、威斯康星大学麦迪逊分校、加州大学洛杉矶分校、俄亥俄州立大学、字节跳动和微软研究院的研究人员推出新型基准测试工具MUIRBENCH，它专门用来评估多模态大型语言模型（LLMs）在理解多图像方面的能力。简单来说，MUIRBENCH测试的是，当AI面对多个图片时，它是否能够... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大型多语言多模态文档级语料库mOSCAR

AI

推荐人：暴走AI 标签：mOSCAR AI

10个月前 (06-16)AI

来自Inria 、法国国立科学研究院、巴黎政治大学、巴黎圣日耳曼大学信息科学系、法国国立科学研究院、巴黎政治大学信息科学发展与资源研究所、法国巴黎索邦大学、通用爬行基金会和巴黎萨克雷大学的研究人员推出大型多语言多模态文档级语料库mOSCAR，mOSCAR是为了支持和改进多模态大型语言模型（mLLMs）的研究而创建的，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多语言视觉问答基准测试CVQA：通过包含多种文化和语言，推动多模态AI系统的发展，特别是提高它们在理解和推理视觉及文本数据方面的能力

AI

推荐人：暴走AI 标签：CVQA AI

10个月前 (06-16)AI

MBZUAI推出新型多语言视觉问答（VQA）基准测试CVQA（Culturally-diverse Multilingual Visual Question Answering Benchmark），CVQA旨在通过包含多种文化和语言，推动多模态人工智能（AI）系统的发展，特别是提高它们在理解和推理视觉及文本数据方面的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠估算生成式Ai在上下文学习中的“幻觉率”（hallucination rate）

AI

推荐人：暴走AI 标签：幻觉率 AI

10个月前 (06-16)AI

这篇论文的主题是关于估算生成性人工智能（Generative AI）在上下文学习（In-Context Learning, ICL）中的“幻觉率”（hallucination rate）。在上下文学习中，一个条件生成模型（Conditional Generative Model, CGM）会被提供一组数据集，并基于这个... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MLKV：针对Transformer模型解码过程中内存使用效率的一种改进

AI

推荐人：暴走AI 标签：MLKV AI

10个月前 (06-16)AI

万隆理工学院 (ITB)和MBZUAI推出一种名为MLKV（Multi-Layer Key-Value Heads）的新技术，它是针对Transformer模型解码过程中内存使用效率的一种改进。Transformer模型在自然语言处理（NLP）领域非常流行，但它们在进行自回归推理时，会因为需要存储和加载大量的键值（Ke... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠苹果推出新型视觉模型4M-21：能够在多种不同的输入和输出模态之间进行转换和预测

AI

推荐人：暴走AI 标签：4M-21 视觉模型 AI

10个月前 (06-16)AI

瑞士洛桑联邦理工学院 (EPFL)和苹果推出新型视觉模型4M-21，它是一个多模态、多任务的基础模型，能够在多种不同的输入和输出模态之间进行转换和预测。简单来说，4M-21就像一个多才多艺的艺术家，不仅能够理解一幅画（图像数据），还能根据这幅画创作出一首诗（文本描述）、一段音乐（深度信息）、甚至是一个舞蹈动作（3D人体... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠谷歌推出新颖的评估框架ToT：评估和提升大语言模型在时间推理（Temporal Reasoning）方面的能力

AI

推荐人：暴走AI 标签：ToT 时间推理 AI

10个月前 (06-16)AI

谷歌发布论文，论文的主题是关于评估和提升大语言模型（LLMs）在时间推理（Temporal Reasoning）方面的能力。时间推理对于智能系统来说是一项非常重要的任务，它涉及到理解不同事件之间的时间关系。然而，现有的时间推理基准测试通常只关注基于知识图谱（Knowledge Graph）的时间事实，这限制了研究的范围... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠微软推出新型混合神经网络架构SAMBA：高效处理无限上下文长度的语言建模而设计

AI

推荐人：暴走AI 标签：SAMBA 混合神经网络架构 AI

10个月前 (06-16)AI

微软和伊利诺伊大学香槟分校推出新型混合神经网络架构SAMBA，它专为高效处理无限上下文长度的语言建模而设计。SAMBA结合了状态空间模型（State Space Model，简称SSM）和滑动窗口注意力机制（Sliding Window Attention，简称SWA），旨在解决传统语言模型在处理极长文本时面临的性能和... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Google DeepMind推出结合了Transformer和神经算法推理器的混合模型TransNAR

AI

推荐人：暴走AI 标签：Google DeepMind TransNAR AI

10个月前 (06-16)AI

Google DeepMind推出一种结合了Transformer和神经算法推理器（Neural Algorithmic Reasoners，简称NARs）的混合模型，称为TransNAR。这种模型旨在提升机器学习在处理自然语言理解（NLU）任务时的算法推理能力。通过在CLRS-Text基准测试上的实验表明，Trans... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在线工具「AI 时间线」：通过输入关键字快速生成时间轴图表

AI

推荐人：暴走AI 标签：AI 时间线 AI

10个月前 (06-15)AI

「AI 时间线」是由友开发的在线工具，允许用户通过输入关键字快速生成时间轴图表。用户只需开启网页、输入相关关键字，AI 便能进行处理并生成视觉吸引的时间线图表。支持的关键字类型包括人名、公司名、地名等。功能特点 🔍 智能处理：AI 技术准确判断并生成时间线。 ⏱️ 快速生成：短时间内完成图表的创建。 🖼️ 图片导出：... 阅读全文

直达链接好 0 不好 0 已关闭评论