优惠提升语言模型在视觉常识推理方面的能力

AI

推荐人：暴走AI 标签：视觉常识推理语言模型 AI

10个月前 (06-23)AI

耶路撒冷希伯来大学和巴伊兰大学的研究人员发布论文，论文的主题是关于如何提升语言模型在视觉常识推理方面的能力。简单来说，就是教会计算机如何更好地理解图片，并结合文字信息来做出更准确的判断。论文中提出的方法通过在训练时使用图像和文本的配对数据，并在推理时生成多个图像并集成它们的预测结果，有效地提高了语言模型在视觉常识任务上... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MIRAGE：利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档

AI

推荐人：暴走AI 标签：MIRAGE 大语言模型 AI

10个月前 (06-23)AI

格罗宁根大学语言与认知中心 (CLCG)和阿姆斯特丹大学逻辑、语言与计算研究所 (ILLC)的研究人员推出MIRAGE（Model Internals-based RAG Explanations），它利用模型内部信息来确保大语言模型（LLMs）生成的答案能够准确引用支持文档。关于提高检索增强型生成（Retrieval... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Latent Diffusion Models：用于在极短的时间内从2D图像数据高效生成3D场景

AI

推荐人：暴走AI 标签：Latent Diffusion Models AI

10个月前 (06-23)AI

格拉斯哥大学和爱丁堡大学的研究人员推出新技术Latent Diffusion Models，用于在极短的时间内从2D图像数据高效生成3D场景。这项技术的核心是一种自编码器，它能够将多视角的2D图像映射到3D高斯Splats，同时构建这些Splats的压缩潜在表示。简单来说，就是通过一个智能的转换过程，把平面的多角度图片... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型自主强化学习方法DigiRL：专门用于训练能够在现实世界环境控制设备（如智能手机等）的智能代理

AI

推荐人：暴走AI 标签：DigiRL AI

10个月前 (06-22)AI

加州大学伯克利分校、伊利诺伊大学伯克利分校和谷歌 DeepMind的研究人员推出新型自主强化学习方法DigiRL，它专门用于训练能够在野外（即现实世界环境）控制设备（如智能手机等）的智能代理。这些智能代理可以通过图形用户界面（GUI）执行各种任务，比如网上购物、预订旅行或者操作移动设备等。项目主页：https://d... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新基准测试工具τ-bench：专门用来评估语言代理（智能助手或聊天机器人）在真实世界应用场景中与人类用户互动的能力

AI

推荐人：暴走AI 标签：τ-bench 智能助手聊天机器人 AI

10个月前 (06-22)AI

Sierra推出新基准测试工具τ-bench，它专门用来评估语言代理（也就是我们通常所说的智能助手或聊天机器人）在真实世界应用场景中与人类用户互动的能力。这就像是给智能助手们进行一次全面的“模拟考试”，看看它们在实际工作中的表现如何。例如，你是一个航空公司的智能助手，用户想要更改他们的航班预订。你需要通过与用户的对话了... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型基准测试工具REPOEXEC：用于评估代码生成模型在处理整个代码库级别的任务时的能力

AI

推荐人：暴走AI 标签：REPOEXEC 代码生成模型 AI

10个月前 (06-22)AI

越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型基准测试工具REPOEXEC，它用于评估代码生成模型（CodeLLMs）在处理整个代码库级别的任务时的能力。REPOEXEC的核心目标是测试这些模型生成的代码是否可执行、功能正确，并且能够准确利用跨文件的上下文信息。实验结果表明，尽管预训练的大型语言模型（LL... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型预训练方法“指令预训练（Instruction Pre-Training）”：通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程

AI

推荐人：暴走AI 标签：指令预训练 AI

10个月前 (06-22)AI

微软研究院和清华大学的研究人员推出一种新型的预训练方法，名为“指令预训练”（Instruction Pre-Training），这种方法通过在原始语料库中加入指令-响应对来增强传统的语言模型（LMs）的预训练过程。指令-响应对是由一个高效的指令合成器生成的，该合成器基于开源模型构建。论文的实验结果表明，指令预训练在多种... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大语言模型中实现“忘却”（unlearning）的能力，即从模型中移除特定概念或信息

AI

推荐人：暴走AI 标签：大语言模型 AI

10个月前 (06-22)AI

华南理工大学、多伦多大学、巴伊兰大学、中国国际数字经济学院 (IDEA) 和特拉维夫大学的研究人员发布论文，论文的主题是探讨在大语言模型（LLMs）中实现“忘却”（unlearning）的能力，即从模型中移除特定概念或信息。这项研究非常重要，因为它有助于减轻模型可能产生的不良影响，例如生成有害、私密或错误的信息。主要... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠自监督语音模型的接口设计

AI

推荐人：暴走AI 标签：自监督语音模型 AI

10个月前 (06-22)AI

美国德克萨斯大学奥斯汀分校计算机科学系的研究人员发布论文，论文的主题是关于自监督语音模型（Self-Supervised Speech Learning, SSL）的接口设计。自监督语音模型是一种通过大量未标记数据进行预训练，然后在少量标记数据上进行微调，以完成特定下游任务的模型。这些模型在自动语音识别等语音处理任务中... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠模型编辑技术对跨语言性能的影响，特别是在多语言环境中的表现

AI

推荐人：暴走AI 标签：模型编辑技术 AI

10个月前 (06-22)AI

印度理工学院、美国国家标准与技术研究所和新加坡科技设计大学的研究人员发布论文，论文的主题是探讨模型编辑技术对跨语言性能的影响，特别是在多语言环境中的表现。模型编辑技术允许我们对预训练语言模型（PLMs）进行微调，以便它们能够更好地适应特定的输入和需求。这项技术在英文环境中已经取得了显著的成果，但同时也暴露了语言间的不平... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型大语言模型Self-MoE：将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统

AI

推荐人：暴走AI 标签：Self-MoE AI

10个月前 (06-22)AI

佐治亚理工学院、MIT-IBM Watson AI 实验室、麻省理工学院、加州大学圣地亚哥分校和MBZUAI的研究人员发布新型大语言模型Self-MoE，它将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统，这些专家被称为MiXSE（MiXture of Self-specialized Experts，即自... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠免费图库Moveast：旅行图库，带你探索世界各地的美丽风光

工具

推荐人：暴走AI 标签：Moveast 免费图库工具

10个月前 (06-22)工具

葡萄牙设计师João Pacheco 创立的Moveast，是一个与众不同的免费图库。它不仅记录了João即将移居杜拜前的旅行足迹，更以CC0授权方式，开放给全球使用者免费下载和使用这些相片，无论是个人或商业用途。Moveast的私人图库特点，保证了相片的独特性和原创性，远离了大型商业图库的重复感。这些相片更像是一般旅... 阅读全文

直达链接好 0 不好 0 已关闭评论