大语言模型

优惠 新型优化器Adam-mini:可以将优化器想象成一位老师,它指导模型在大量数据中找到正确的答案

  • 新型优化器Adam-mini:可以将优化器想象成一位老师,它指导模型在大量数据中找到正确的答案
    AI
  • 香港中文大学、深圳大数据研究院、杜克大学和斯坦福大学的研究人员推出新型优化器Adam-mini,在机器学习和人工智能领域,优化器是一种帮助模型在学习过程中找到最佳参数的算法。你可以将优化器想象成一位老师,它指导模型在大量数据中找到正确的答案。在训练一个大型的语言模型时,如果使用传统的优化器,可能需要大量的内存和计算资源... 阅读全文

    优惠 自动化框架WILDTEAMING:专门用来挖掘和测试大语言模型的安全性漏洞

  • 自动化框架WILDTEAMING:专门用来挖掘和测试大语言模型的安全性漏洞
    AI
  • 华盛顿大学、艾伦人工智能研究所、首尔国立大学和卡内基梅隆大学推出自动化框架WILDTEAMING,它专门用来挖掘和测试大语言模型(LLMs)的安全性漏洞。简单来说,WILDTEAMING能够自动从真实的用户-聊天机器人交互中发现新的“越狱”(jailbreak)策略,这些策略是用户用来绕过语言模型的安全防护的技巧。然后... 阅读全文

    优惠 新型大语言模型基准测试工具LiveBench:克服现有基准测试中常见的问题,如测试数据集污染(即新模型训练时不小心包含了测试集中的数据)以及评判过程中的偏见和错误

  • 新型大语言模型基准测试工具LiveBench:克服现有基准测试中常见的问题,如测试数据集污染(即新模型训练时不小心包含了测试集中的数据)以及评判过程中的偏见和错误
    AI
  • Abacus.AI推出新型大语言模型基准测试工具LiveBench,它旨在克服现有基准测试中常见的问题,如测试数据集污染(即新模型训练时不小心包含了测试集中的数据)以及评判过程中的偏见和错误。简而言之,LiveBench是一个创新的基准测试工具,它通过提供更新频繁、自动评分和多样化任务的测试环境,帮助评估和推动LLM技... 阅读全文

    优惠 ResumeAtlas:使用人工智能技术来提高简历分类的效率和准确性

  • ResumeAtlas:使用人工智能技术来提高简历分类的效率和准确性
    AI
  • 这篇论文的主题是关于如何使用人工智能技术来提高简历分类的效率和准确性。在这个数字化和网络化的时代,在线招聘变得越来越普遍,而简历分类是招聘过程中的一个重要环节。例如,一个大型公司发布了一个职位,可能会收到成千上万份简历,手动分类这些简历是一项非常耗时且容易出错的工作。这就是人工智能可以大显身手的地方。 主要功能: 自动... 阅读全文

    优惠 数据集大小恢复DSiRe:从模型的权重中直接确定训练模型时使用的样本数量

  • 数据集大小恢复DSiRe:从模型的权重中直接确定训练模型时使用的样本数量
    AI
  • 耶路撒冷希伯来大学的研究人员推出DSiRe(数据集大小恢复,Dataset Size Recovery),旨在从模型的权重中直接确定训练模型时使用的样本数量。具体来说,研究者们专注于在使用低秩适应(LoRA)微调模型的情况下,恢复用于微调的数据集大小。LoRA是一种流行的微调技术,它通过添加低秩权重矩阵来调整预训练模型... 阅读全文

    优惠 新技术框架DPA-RAG:解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题

  • 新技术框架DPA-RAG:解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题
    AI
  • 中国人民大学高岭人工智能学院和北京邮电大学人工智能学院的研究人员推出新技术框架DPA-RAG(Dual Preference Alignment for Retrieval-Augmented Generation),旨在解决大语言模型(LLMs)在进行检索增强型生成任务时面临的知识偏好不一致问题。简单来说,大型语言模... 阅读全文

    优惠 T-FREE:解决大语言模型在文本编码方面的一些固有问题

  • T-FREE:解决大语言模型在文本编码方面的一些固有问题
    AI
  • 达姆施塔特工业大学、黑森人工智能中心 (hessian.AI)和德国人工智能中心 (DFKI)的研究人员推出新技术T-FREE(Tokenizer-Free Generative Large Language Models via Sparse Representations),它旨在解决大语言模型(LLMs)在文本编... 阅读全文

    优惠 AUTOHALLUSION:为视觉-语言模型自动生成幻觉基准测试

  • AUTOHALLUSION:为视觉-语言模型自动生成幻觉基准测试
    AI
  • 马里兰大学帕克分校的研究人员推出AUTOHALLUSION,这是一种为视觉-语言模型(Vision-Language Models,简称LVLMs)自动生成幻觉基准测试的方法。简单来说,LVLMs是一种人工智能,它们可以同时处理图像和语言信息,比如理解图片内容并根据图片生成描述文字。但问题是,这些模型有时会"幻想"出一... 阅读全文

    优惠 MoA:用于自动压缩大语言模型的新方法

  • MoA:用于自动压缩大语言模型的新方法
    AI
  • 清华大学、无问芯穹、斯坦福大学和上海交通大学的研究人员推出MoA(Mixture of Sparse Attention),它是一种用于自动压缩大语言模型(LLMs)的新方法。MoA的核心思想是通过稀疏注意力机制来减轻大型语言模型在处理长文本时对内存和吞吐量的高需求。以往的稀疏注意力方法通常采用统一的模式,对所有注意力... 阅读全文

    优惠 自感知知识检索SEAKR:为大语言模型设计的自适应检索增强生成策略,减少大型语言模型在生成文本时出现的幻觉问题

  • 自感知知识检索SEAKR:为大语言模型设计的自适应检索增强生成策略,减少大型语言模型在生成文本时出现的幻觉问题
    AI
  • 来自清华大学人工智能研究所、加州大学圣巴巴拉分校、北京理工大学和西门子科技数据与人工智能集团的研究人员推出“SEAKR”,即自感知知识检索(Self-aware Knowledge Retrieval),这是一种为大语言模型(LLMs)设计的自适应检索增强生成(Adaptive Retrieval-Augmented ... 阅读全文

    优惠 STEP-DPO:解决大语言模型在进行长链条数学推理时所面临的挑战

  • STEP-DPO:解决大语言模型在进行长链条数学推理时所面临的挑战
    AI
  • 香港中文大学、哈尔滨工业大学(深圳)和SmartMore的研究人员推出新方法STEP-DPO(Step-wise Preference Optimization),它旨在解决大语言模型(LLMs)在进行长链条数学推理时所面临的挑战。长链条数学推理要求模型进行一系列精确且连贯的逻辑步骤,以确保最终答案的正确性。然而,现有... 阅读全文

    优惠 新型人工智能框架OMG-LLaVA:能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起

  • 新型人工智能框架OMG-LLaVA:能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起
    AI
  • 武汉大学、天工AI和南洋理工大学的研究人员推出新型人工智能框架OMG-LLaVA,它能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起。简单来说,OMG-LLaVA就像是一个超级聪明的图像处理助手,它不仅能看懂图片里有什么,还能理解图片中物体之间的关系,甚至能根据文字指令来处理图片。 项目主页:https:... 阅读全文