大语言模型

优惠 新型参数高效微调方法MoSLoRA:适用于大语言模型、多模态模型和扩散模型,旨在通过一种计算效率高、易于实现的方式,提高模型对特定任务的适应性

  • 新型参数高效微调方法MoSLoRA:适用于大语言模型、多模态模型和扩散模型,旨在通过一种计算效率高、易于实现的方式,提高模型对特定任务的适应性
    AI
  • 香港大学和腾讯人工智能实验室的研究人员推出新型参数高效微调方法Mixture-of-Subspaces LoRA(简称MoSLoRA),这种方法适用于大语言模型、多模态模型和扩散模型,旨在通过一种计算效率高、易于实现的方式,提高模型对特定任务的适应性。MoSLoRA是一种既节省资源又能够提升大型模型性能的有效微调方法,... 阅读全文

    优惠 加州大学伯克利分校推出BenchBuilder的系统:自动从众包平台收集的数据中筛选出高质量的测试题目

  • 加州大学伯克利分校推出BenchBuilder的系统:自动从众包平台收集的数据中筛选出高质量的测试题目
    AI
  • 加州大学伯克利分校推出BenchBuilder的系统,它的主要功能是自动从众包平台(如Chatbot Arena)收集的数据中筛选出高质量的测试题目。这些测试题目能够很好地区分不同模型的能力,并且与人类的评价标准保持一致。例如,我们想测试一个语言模型是否能够很好地理解医学领域的术语,BenchBuilder可以筛选出需... 阅读全文

    优惠 attack-agent:多模态智能体的安全性研究,特别是探讨了这些智能体在面对对抗性攻击时的脆弱性

  • attack-agent:多模态智能体的安全性研究,特别是探讨了这些智能体在面对对抗性攻击时的脆弱性
    AI
  • 卡内基·梅隆大学的研究人员发布论文,论文的主题是关于对多模态智能体(能够处理视觉和语言信息的AI系统)的安全性研究,特别是探讨了这些智能体在面对对抗性攻击时的脆弱性。多模态智能体被设计用来在真实环境中执行任务,比如网上购物代理,它们可以根据用户的指令来选择商品。论文通过实验表明,即使在对抗性攻击下,通过适当的防御措施,... 阅读全文

    优惠 Safety Arithmetic:确保大语言模型在各种使用场景下的安全性

  • Safety Arithmetic:确保大语言模型在各种使用场景下的安全性
    AI
  • 新加坡科技设计大学和印度理工学院 Kharagpur 分校的研究人员发布论文,论文的主题是关于如何确保大型语言模型(LLMs)在各种使用场景下的安全性。随着这些模型在翻译、问答等应用中的广泛使用,确保它们与人类价值观保持一致,不产生有害内容,变得尤为重要。通过这种方法,研究人员能够在不牺牲模型实用性的前提下,显著提高模... 阅读全文

    优惠 Humor in AI:关于AI在幽默创作领域的研究,特别是针对卡通漫画的标题生成

  • Humor in AI:关于AI在幽默创作领域的研究,特别是针对卡通漫画的标题生成
    AI
  • 威斯康星大学麦迪逊分校和华盛顿大学西雅图分校的研究人员发布论文,论文的主题是关于人工智能(AI)在幽默创作领域的研究,特别是针对卡通漫画的标题生成。研究人员通过收集和分析大量的人类对漫画标题的评价,来训练和评估AI模型在创作幽默标题方面的能力。 例如,《纽约客》杂志发布了一幅漫画,展示了一个穿着宇航服的骑士骑着马,手持... 阅读全文

    优惠 BAL-PM:在大语言模型中通过偏好建模来引导模型的行为,使其更符合人类的偏好

  • BAL-PM:在大语言模型中通过偏好建模来引导模型的行为,使其更符合人类的偏好
    AI
  • 这篇论文的主题是关于如何在大语言模型(Large Language Models,简称LLMs)中通过偏好建模来引导模型的行为,使其更符合人类的偏好。简单来说,就是教一个大型的人工智能模型如何更好地理解并满足人们的需求。论文中提出的BAL-PM(Bayesian Active Learner for Preferenc... 阅读全文

    优惠 ServiceNow推出新型问题回答数据集REPLIQA:专门设计用来评估大语言模型在处理未见过的参考内容时的性能

  • ServiceNow推出新型问题回答数据集REPLIQA:专门设计用来评估大语言模型在处理未见过的参考内容时的性能
    AI
  • ServiceNow推出新型问题回答数据集REPLIQA,它专门设计用来评估大语言模型(LLMs)在处理未见过的参考内容时的性能。这个数据集的创建是为了解决现有评估方法可能存在的数据泄露问题,即模型可能在训练阶段就已经接触过测试数据,这样就不能准确评估模型的真正能力。 数据集地址:https://huggingface... 阅读全文

    优惠 数据集RABBITS:大语言模型在生物医学领域应用时的一个特定问题:对药物名称的脆弱性

  • 数据集RABBITS:大语言模型在生物医学领域应用时的一个特定问题:对药物名称的脆弱性
    AI
  • 麻省理工学院、哈佛大学、麻省总医院、波士顿儿童医院、奥胡斯大学、弗吉尼亚大学、马斯特里赫特大学、庞培法布拉大学和贝斯以色列女执事医疗中心的研究人员发布论文,讨论了大语言模型(LLMs)在生物医学领域应用时的一个特定问题:对药物名称的脆弱性。特别是在处理品牌名和通用名之间的替换时,模型的性能可能会显著下降。研究者们创建了... 阅读全文

    优惠 韩国科学技术研究院推出新方法TroL:提升大型语言和视觉模型(LLVMs)的效率和性能

  • 韩国科学技术研究院推出新方法TroL:提升大型语言和视觉模型(LLVMs)的效率和性能
    AI
  • 韩国科学技术研究院推出新方法TroL(Traversal of Layers,即层次遍历),它用于提升大型语言和视觉模型(LLVMs)的效率和性能。TroL的核心思想是通过在模型中重复使用层(即“层次遍历”),来模拟人类在回答问题时回顾和重新审视信息的过程,从而在不增加额外计算负担的情况下提高模型的理解和生成能力。论文... 阅读全文

    优惠 深度求索推出开源代码模型DeepSeek-Coder-V2:专门用于理解代码和解决编程问题

  • 深度求索推出开源代码模型DeepSeek-Coder-V2:专门用于理解代码和解决编程问题
    AI
  • 深度求索推出开源代码模型DeepSeek-Coder-V2,这是一个专门用于理解代码和解决编程问题的人工智能系统。它通过大量的训练,能够执行与编程相关的多种任务,比如编写代码、修复错误、甚至进行数学推理。尽管DeepSeek-Coder-V2在多个标准基准测试中表现出色,与一些封闭源代码模型相比具有竞争力,但在遵循复杂... 阅读全文

    优惠 新型多智能体软件开发框架AGILECODER:基于敏捷方法论,通过模拟人类软件开发流程来自动化软件的开发过程

  • 新型多智能体软件开发框架AGILECODER:基于敏捷方法论,通过模拟人类软件开发流程来自动化软件的开发过程
    AI
  • 越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型多智能体软件开发框架AGILECODER,它基于敏捷方法论(Agile Methodology,简称AM),旨在通过模拟人类软件开发流程来自动化软件的开发过程。这个框架通过分配不同的敏捷角色(如产品经理、开发者和测试员)给不同的智能体,让它们协作完成软件开发任... 阅读全文

    优惠 在RAG系统中是如何依赖外部检索到的上下文信息来回答问题

  • 在RAG系统中是如何依赖外部检索到的上下文信息来回答问题
    AI
  • 马萨诸塞大学阿默斯特分校、微软和马里兰大学帕克分校的研究人员发布论文,论文的主题是探讨在检索增强生成(Retrieval-Augmented Generation, RAG)系统中,语言模型在回答事实性问题时,是如何利用外部知识与模型内部参数信息的。RAG系统通过引入外部上下文来增强语言模型的推理能力,这在搜索、问答和... 阅读全文