推荐类别

栏目分类

优惠 评估框架HPT:更精确地评估大语言模型在处理不同任务时的有效性

  • 评估框架HPT:更精确地评估大语言模型在处理不同任务时的有效性
    AI
  • 印度理工学院、美国南卡罗来纳大学人工智能研究所、美国罗彻斯特理工学院、美国亚马逊 GenAI和美国斯坦福大学推出评估框架“Hierarchical Prompting Taxonomy (HPT)”,用于更精确地评估大语言模型(LLMs)在处理不同任务时的有效性。这个框架特别关注了如何根据不同任务的复杂性,采用不同层次... 阅读全文

    优惠 在线偏好学习算法“行为临近偏好优化(BPO)”:改善大语言模型与人类期望的一致性

  • 在线偏好学习算法“行为临近偏好优化(BPO)”:改善大语言模型与人类期望的一致性
    AI
  • 加州大学圣巴巴拉分校和卡内基梅隆大学的研究人员推出新的在线偏好学习算法,名为“行为临近偏好优化”(BPO),它用于改善大语言模型(LLMs)与人类期望的一致性。BPO算法的核心思想是在模型训练过程中,使学习到的语言模型尽可能地接近行为模型(即生成训练样本的模型),以此来构建一个更合适的信任域,从而提高模型的性能。 例如... 阅读全文

    优惠 自对齐使用DPO隐式奖励DICE:利用了直接偏好优化(DPO)训练后的隐式奖励模型来进一步优化语言模型

  • 自对齐使用DPO隐式奖励DICE:利用了直接偏好优化(DPO)训练后的隐式奖励模型来进一步优化语言模型
    AI
  • ···q新加坡管理大学、新加坡Sea AI实验室、新加坡国立大学和罗格斯大学的研究人员推出自对齐使用DPO隐式奖励DICE,这个方法利用了直接偏好优化(DPO)训练后的隐式奖励模型来进一步优化语言模型。实验结果表明,DICE在保持模型大小不变的情况下,显著提高了语言模型的性能,甚至在某些方面超过了需要额外人类反馈的封闭... 阅读全文

    优惠 多图像关系基准新评估工具 MIRB:用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型在理解多图像方面的能力

  • 多图像关系基准新评估工具 MIRB:用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型在理解多图像方面的能力
    AI
  • 爱丁堡大学和同济大学的研究人员推出新评估工具 MIRB(Multi-Image Relational Benchmark, 多图像关系基准),用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型(VLMs)在理解多图像方面的能力。论文通过广泛的评估发现,尽管在单图像任务中一些开源的视觉语言模型能够与一些... 阅读全文

    优惠 分词的诅咒:在大语言模型中,文本分词(tokenization)这一预处理步骤存在的问题,以及这些问题对模型性能的影响

  • 分词的诅咒:在大语言模型中,文本分词(tokenization)这一预处理步骤存在的问题,以及这些问题对模型性能的影响
    AI
  • 百度、ModelBest和UCPH的研究人员发布论文 ,论文的主题是探讨了在大语言模型(LLMs)中,文本分词(tokenization)这一预处理步骤存在的问题,以及这些问题对模型性能的影响。分词是将原始文本转换成一系列子词(subword)标识符的过程,这个过程对拼写错误、文本长度变化非常敏感,并且往往忽略了词内结... 阅读全文

    优惠 新型二值化技术“Mixture of Scales”:用于压缩大语言模型

  • 新型二值化技术“Mixture of Scales”:用于压缩大语言模型
    AI
  • 首尔国立大学、 SqueezeBits和成均馆大学的研究人员推出新型二值化技术“Mixture of Scales”(简称BinaryMoS),它主要用于压缩大语言模型(LLMs)。二值化是一种将模型中的权重参数转换为二进制值的方法,可以显著减少模型的大小,但传统的二值化技术会牺牲模型的语言能力。BinaryMoS通过... 阅读全文

    优惠 HumanSplat:通过单张图片来预测任何人的3D高斯Splatting属性

  • HumanSplat:通过单张图片来预测任何人的3D高斯Splatting属性
    AI
  • 字节跳动、北京大学、厦门大学和清华大学的研究人员推出新技术HumanSplat,它能够通过单张图片来预测任何人的3D高斯Splatting属性。简单来说,就是利用人工智能技术,从一张照片中重建出一个逼真的3D人体模型。这项技术的出现,不仅推动了计算机视觉领域的发展,也为3D内容的创建和展示提供了新的可能性。 项目主页:... 阅读全文

    优惠 新型大语言模型TABULA-8B:专门用于处理表格数据

  • 新型大语言模型TABULA-8B:专门用于处理表格数据
    AI
  • 华盛顿大学、哈佛大学和斯坦福大学的研究人员推出新型大语言模型TABULA-8B,它专门用于处理表格数据(Tabular Data)。表格数据是一种结构化、异构的、类似电子表格的数据形式,它在许多领域中都有广泛应用,比如医疗、金融、政府和自然科学等。 例如,你有一大堆来自不同地方的数据表,这些数据表里充满了数字、文字和日... 阅读全文

    优惠 评估平台OlympicArena:专门用来测试和衡量AI模型在解决高难度问题时的认知推理能力

  • 评估平台OlympicArena:专门用来测试和衡量AI模型在解决高难度问题时的认知推理能力
    AI
  • 上海交通大学、上海人工智能实验室、 生成式人工智能研究实验室(GAIR)的研究人员推出评估平台OlympicArena,它专门用来测试和衡量人工智能(AI)模型在解决高难度问题时的认知推理能力。这些问题的难度级别相当于奥林匹克竞赛水平,涵盖了多个学科领域。 项目主页:https://gair-nlp.github.io... 阅读全文

    优惠 智谱AI发布论文介绍了大语言模型家族ChatGLM:由GLM-130B发展到GLM-4系列,包括GLM-4、GLM-4-Air和GLM-4-9B

  • 智谱AI发布论文介绍了大语言模型家族ChatGLM:由GLM-130B发展到GLM-4系列,包括GLM-4、GLM-4-Air和GLM-4-9B
    AI
  • 智谱AI发布论文介绍了大语言模型家族ChatGLM,这些模型由GLM-130B发展到GLM-4系列,包括GLM-4、GLM-4-Air和GLM-4-9B。这些模型代表了该家族中最强大的版本,它们结合了之前几代ChatGLM的经验和技术。总的来说,ChatGLM是一个多功能、高性能的大型语言模型,它通过不断学习和适应,能... 阅读全文

    优惠 新型视觉压缩技术VoCo-LLaMA:专门为视觉-语言模型设计

  • 新型视觉压缩技术VoCo-LLaMA:专门为视觉-语言模型设计
    AI
  • 清华大学、腾讯 PCG ARC 实验室和加州大学圣克鲁斯分校的研究人员推出新型视觉压缩技术VoCo-LLaMA,这项技术是专门为视觉-语言模型(Vision-Language Models,简称VLMs)设计的,目的是解决这些模型在处理高分辨率图像输入和视频时遇到的两个主要问题:有限的上下文窗口和高昂的计算成本。 项目... 阅读全文

    优惠 日本大学开发在线AI 应用「CatsMe!」: 猫咪表情分析,关爱宠物健康

  • 日本大学开发在线AI 应用「CatsMe!」: 猫咪表情分析,关爱宠物健康
    AI
  • 对于爱猫人士来说,最令人心痛的莫过于看到自家猫咪精神不振、病态明显。由于猫咪天生忍耐力强,病情往往在严重时才被发现,错过了最佳治疗时机。现在,日本大学农兽医学部的科研人员开发的「CatsMe!」,一个利用AI技术分析猫咪表情的网页程序,可以帮助猫主人更早发现爱宠的不适。 「CatsMe!」如何工作? AI表情分析:通过... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?