大语言模型

优惠 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务

  • 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务
    AI
  • 越南FPT软件AI中心推出新型通用软件工程代理系统HyperAgent,这个系统能够自动执行多种编程任务,比如修复软件中的错误、添加新功能、改进代码质量等。与现有的基于LLM的软件代理不同,后者通常专注于特定任务,HyperAgent模仿人类开发者的工作流程,以应对多样化的SE挑战。它由四个专业代理组成(规划者、导航器... 阅读全文

    优惠 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力

  • 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力
    AI
  • 韩国科学院推出新型大型语言和视觉模型Phantom,它旨在通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力。例如,你是一名教师,需要向学生解释一个复杂的科学概念,你可以上传一个相关的图表并给出描述,Phantom能够生成一个详细的图像,帮助学生更好地理解这个概念。或者,如果你是一... 阅读全文

    优惠 NASA推出新型人工智能模型Prithvi WxC:为了天气预报和气候研究而设计

  • NASA推出新型人工智能模型Prithvi WxC:为了天气预报和气候研究而设计
    AI
  • NASA推出新型人工智能模型Prithvi WxC,它是为了天气预报和气候研究而设计的。Prithvi WxC是一个大型的、多用途的模型,可以理解和预测天气模式。Prithvi WxC通过大量的数据训练,学习了天气变化的复杂模式,使其能够进行高质量的预测。这个模型的出现可能会改变我们进行天气预报和气候研究的方式。 Gi... 阅读全文

    优惠 CLAIRA:利用大语言模型来评估音频字幕质量的方法

  • CLAIRA:利用大语言模型来评估音频字幕质量的方法
    AI
  • 加州大学伯克利分校的研究人员推出了一个名为CLAIRA的系统,它是一个利用大语言模型来评估音频字幕质量的方法。例如,你有一段下雨和车辆驶过的音频,一个良好的音频字幕可能是“车辆在雨中驶过,水花四溅”。CLAIRA会评估这个字幕与参考字幕(如“雨中车辆驶过,伴有水花声”)的语义相似度,并给出一个高分和解释,说明为什么这个... 阅读全文

    优惠 MURI:为低资源语言生成高质量的指令调整(instruction tuning)数据集

  • MURI:为低资源语言生成高质量的指令调整(instruction tuning)数据集
    AI
  • 慕尼黑大学 CIS 、慕尼黑机器学习中心、Cohere for AI 和剑桥大学语言技术实验室的研究人员推出一个名为MURI(Multilingual Reverse Instructions)的方法,它用于为低资源语言生成高质量的指令调整(instruction tuning)数据集。指令调整是一种优化大型语言模型(... 阅读全文

    优惠 HyperCloning:用于加速大语言模型预训练的新策略

  • HyperCloning:用于加速大语言模型预训练的新策略
    AI
  • 苹果推出了一个名为HyperCloning的方法,这是一种用于加速大语言模型预训练的新策略。它通过利用小型预训练模型的参数来初始化一个更大的模型,从而提高了训练效率和最终的准确性。因此,在训练开始之前,较大模型就已经继承了较小模型的预测能力和准确性。我们展示了训练这样一个初始化后的模型,在预训练大型语言模型所需的 GP... 阅读全文

    优惠 MMSEARCH:旨在探索大型多模态模型(LMMs)作为多模态搜索引擎的潜力

  • MMSEARCH:旨在探索大型多模态模型(LMMs)作为多模态搜索引擎的潜力
    AI
  • 香港中文大学MMLab、字节跳动、香港中文大学MiuLar实验室、上海人工智能实验室、北京大学、斯坦福大学和商汤研究院的研究人员推出 MMSEARCH 项目,它旨在探索大型多模态模型(LMMs)作为多模态搜索引擎的潜力。多模态搜索引擎能够处理包含图像和文本的查询,这对于传统的仅支持文本的搜索引擎来说是一个重大进步。 项... 阅读全文

    优惠 Google DeepMind发布论文:如何训练大语言模型(LLMs)进行自我纠错

  • Google DeepMind发布论文:如何训练大语言模型(LLMs)进行自我纠错
    AI
  • Google DeepMind发布论文,论文的主题是关于如何训练大语言模型(LLMs)进行自我纠错。自我纠错是指模型在生成回答后,能够检测并修正自己的错误,以提供更准确的信息。这项能力对于提高模型在复杂任务中的性能至关重要,尤其是在需要精确推理的领域,如数学问题解答。例如,你在使用一个智能助手来帮助解决数学问题。你输入... 阅读全文

    优惠 大规模多模态预训练数据集 InfiMM-WebMath-40B:提升大语言模型在数学推理方面的能力

  • 大规模多模态预训练数据集 InfiMM-WebMath-40B:提升大语言模型在数学推理方面的能力
    AI
  • 字节跳动和中国科学院的研究人员推出大规模多模态预训练数据集 InfiMM-WebMath-40B,它旨在提升大语言模型(LLMs)在数学推理方面的能力。这个数据集特别为多模态学习环境设计,包含了图像和文本的结合,以帮助模型更好地理解和处理数学概念。 数据:https://huggingface.co/datasets/... 阅读全文

    优惠 生成心理测量(GPV):更准确地理解和评估人类和AI的价值观

  • 生成心理测量(GPV):更准确地理解和评估人类和AI的价值观
    AI
  • 北京大学智能科学与技术学院通用人工智能国家重点实验室、北京大学软件与微电子学院、北京大学社会学系、北京大学心理与认知科学学院和北大武汉人工智能研究院的研究人员推出GPV,利用大语言模型(LLM)来测量人类和人工智能(AI)的价值观。简单来说,研究者们希望通过一种新方法,称为“生成心理测量”(Generative Psy... 阅读全文

    优惠 微软推出新型机器学习模型GRIN:对现有的“专家混合”(MoE)模型的一种改进

  • 微软推出新型机器学习模型GRIN:对现有的“专家混合”(MoE)模型的一种改进
    AI
  • 微软推出新型机器学习模型GRIN,它是对现有的“专家混合”(Mixture-of-Experts,简称MoE)模型的一种改进。MoE模型是一种特殊的深度学习模型,它通过将任务分配给不同的“专家”子模块来处理,每个专家只处理它擅长的特定类型的输入。这种方法可以让模型在保持高效的同时,处理更大规模的数据。 GitHub:h... 阅读全文

    优惠 “链式思考(CoT)”技术在大语言模型中的应用效果

  • “链式思考(CoT)”技术在大语言模型中的应用效果
    AI
  • 德克萨斯大学奥斯汀分校、约翰霍普金斯大学和普林斯顿大学的研究人员发布论文,探讨了一个名为“链式思考(Chain-of-Thought,简称CoT)”的技术在大型语言模型(Large Language Models,简称LLMs)中的应用效果。链式思考是一种通过提示(prompting)来激发语言模型进行推理的方法。简单... 阅读全文