优惠轻量级大语言模型GEB-1.3B：为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计

AI

推荐人：暴走AI 标签：GEB-1.3B AI

10个月前 (06-17)AI

GEB推出新型轻量级大语言模型GEB-1.3B，这个模型是为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计的。GEB-1.3B特别优化了在普通CPU上的运行效率，使其能够部署在更易于访问的设备上，如笔记本电脑和智能手机。例如，你需要一个能够快速回应用户指令并提供准确信息的智能助手，GEB-1.3B... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 GaussianSR：将低分辨率的输入视图转换成高分辨率的新视图

AI

推荐人：暴走AI 标签：GaussianSR AI

10个月前 (06-17)AI

中国科学技术大学和微软亚洲研究院的研究人员推出GaussianSR，它能够将低分辨率的输入视图转换成高分辨率的新视图。这项技术在计算机视觉和图形学领域尤为重要，因为它可以用于生成高质量的视觉效果，例如在虚拟现实、增强现实或3D电影制作中。例如，你是一位电影制作人，需要将一些旧的低分辨率电影片段升级为高分辨率以适应现代大... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型基准测试BABILong：专门用来评估大语言模型处理超长文本上下文的能力

AI

推荐人：暴走AI 标签：BABILong 大语言模型 AI

10个月前 (06-17)AI

新型基准测试BABILong，它专门用来评估大语言模型（LLMs）处理超长文本上下文的能力。想象一下，你有一款智能助手，它需要阅读一篇非常长的文档，然后根据文档内容回答一些非常具体的问题。但是，文档中只有一小部分信息是真正需要用来回答问题的，其余的都是干扰信息。BABILong就是用来测试智能助手是否能够准确地从海量文... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型大型多模态模型SliME：能够处理和理解高分辨率的图像和文本信息

AI

推荐人：暴走AI 标签：SliME 多模态模型 AI

10个月前 (06-17)AI

中国科学院自动化研究所多模态人工智能系统国家重点实验室、中国科学院大学人工智能学院、松鼠AI、阿里巴巴集团和Meta AI的研究人员推出新型大型多模态模型SliME，这些模型能够处理和理解高分辨率的图像和文本信息。例如，你有一个智能助手，它不仅能读懂你给它的任何图片，还能理解图片中的细节，并回答你关于图片内容的问题。 ... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型视觉变换器家族Hibou：专门用于病理学领域

AI

推荐人：暴走AI 标签：Hibou 病理学 AI

10个月前 (06-17)AI

HistAI推出新型视觉变换器（Vision Transformers，简称ViTs）家族Hibou，它们专门用于病理学领域。病理学是研究疾病组织的科学，通过显微镜检查来诊断各种疾病，尤其是癌症。传统的病理学方法既耗时又容易出错，而数字病理学通过将玻片扫描成高分辨率的数字图像，让计算机算法进行分析，从而彻底改变了这一领... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大型多任务语言理解（MMLU）基准测试进行深入分析和纠错

AI

推荐人：暴走AI 标签：MMLU 大型多任务语言 AI

10个月前 (06-17)AI

爱丁堡大学、罗马大学、巴里理工大学、伦敦大学学院、特伦托大学、 AssemblyAI和英国卫生安全局的研究人员对一个流行的大型多任务语言理解（MMLU）基准测试进行深入分析和纠错，MMLU是用来评估大型语言模型（LLMs）在多种语言任务上的表现，比如历史、数学、计算机科学等领域。但论文作者发现，尽管MMLU被广泛使... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ECO：让大语言模型“忘记”它们所学到的某些知识

AI

推荐人：暴走AI 标签：ECO AI

10个月前 (06-17)AI

加州大学圣克鲁斯分校发布论文，论文的主题是关于如何让大语言模型（LLMs）“忘记”它们所学到的某些知识。例如，我们有一个聊天机器人，它通过学习大量的文本数据变得很聪明。但有一天，我们发现它学会了一些不应该被分享的秘密，比如某个人的个人信息。使用ECO方法，我们可以训练一个分类器来识别包含这个人信息的输入，然后在这些输入... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型生成模型MD4：专注于离散数据的生成，比如文本和像素级别的图像数据

AI

推荐人：暴走AI 标签：MD4 AI

10个月前 (06-17)AI

Google DeepMind推出一种新型的生成模型——被称为“Simplified and Generalized Masked Diffusion”（简化和通用化的掩蔽扩散，简称MD4）的模型。这个模型专注于离散数据的生成，比如文本和像素级别的图像数据。了MD4模型在OpenWebText数据集上的表现超过了之前的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视觉字幕恢复VCR：挑战现有的视觉-语言模型，以准确恢复图像中部分被遮挡的文本

AI

推荐人：暴走AI 标签：VCR 视觉字幕恢复 AI

10个月前 (06-17)AI

魁北克 Mila 人工智能研究所、ServiceNow Research、蒙特利尔大学、宾夕法尼亚大学、滑铁卢大学和香港科技大学的研究人员推出新任务Visual Caption Restoration（VCR，视觉字幕恢复），它挑战现有的视觉-语言模型，以准确恢复图像中部分被遮挡的文本。这项任务的灵感来自于观察到图像中... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠字节跳动推出增强语言模型Mistral-C2F：增强小规模语言模型在对话和分析推理方面的能力

AI

推荐人：暴走AI 标签：Mistral-C2F 字节跳动 AI

10个月前 (06-17)AI

字节跳动推出一种新型的大语言模型（LLM）——Mistral-C2F，它是为了增强小规模语言模型在对话和分析推理方面的能力的。想象一下，如果你有一个智能助手，它可以帮你写邮件、回答问题，甚至帮你分析复杂问题，但有时候它给出的回答可能不够深入或者不够个性化。Mistral-C2F模型就是为了解决这些问题而设计的。例如，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠英伟达发布的Nemotron-4 340B系列模型家族

AI

推荐人：暴走AI 标签：Nemotron-4 340B 英伟达 AI

10个月前 (06-17)AI

英伟达发布的Nemotron-4 340B系列模型家族，包括Nemotron-4-340B-Base、Nemotron-4-340B-Instruct和Nemotron-4-340B-Reward。这些模型在多种任务上展现出了强大的性能，并且可以在单个DGX H100系统上的8个GPU中以FP8精度部署。模型的安全性评... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠英伟达推出开源数据集HelpSteer2：为了训练能够指导大语言模型（LLMs）生成符合人类偏好的高质量回应的奖励模型而设计

AI

推荐人：暴走AI 标签：HelpSteer2 英伟达 AI

10个月前 (06-17)AI

英伟达推出开源数据集HelpSteer2，它是为了训练能够指导大语言模型（LLMs）生成符合人类偏好的高质量回应的奖励模型而设计的。HelpSteer2数据集的特点是它包含了对回应的多属性评分，这有助于训练出能够更好地符合人类偏好的奖励模型。例如，你是一个在线客服聊天机器人的开发者，你希望机器人能够提供既准确又有帮助的... 阅读全文

直达链接好 0 不好 0 已关闭评论