大语言模型

优惠 个性化大语言模型PPlug:让语言模型能够根据每个用户的独特偏好和习惯来生成定制化的文本输出

  • 个性化大语言模型PPlug:让语言模型能够根据每个用户的独特偏好和习惯来生成定制化的文本输出
    AI
  • 中国人民大学高岭人工智能学院和百度的研究人员推出一种新型的个性化大语言模型(LLM),名为PPlug(Persona-Plug)。这个模型的目的是让语言模型能够根据每个用户的独特偏好和习惯来生成定制化的文本输出。总的来说,PPlug通过将用户的历史行为和偏好编码成一个嵌入向量,并在生成文本时使用这个向量,使得语言模型能... 阅读全文

    优惠 阿里推出新型多模态大语言模型Ovis

  • 阿里推出新型多模态大语言模型Ovis
    AI
  • 阿里巴巴集团人工智能业务、南京大学人工智能学院、南京大学计算机软件新技术国家重点实验室的研究人员推出新型多模态大语言模型Ovis。多模态意味着这个模型能够同时处理和理解文本和视觉信息,比如图片。你可以把它想象成一个能够“看图说话”的智能系统。 GitHub:https://github.com/AIDC-AI/Ovis... 阅读全文

    优惠 新型检索模型Promptriever:能够像语言模型一样响应指令,为用户提供更自然的搜索体验

  • 新型检索模型Promptriever:能够像语言模型一样响应指令,为用户提供更自然的搜索体验
    AI
  • 约翰·霍普金斯大学和Samaya AI的研究人员推出新型检索模型Promptriever,它能够像语言模型一样响应指令,为用户提供更自然的搜索体验。简单来说,就像你和一位图书管理员对话,告诉他你想找什么书,他会根据你的描述帮你找到正确的书籍。总的来说,Promptriever通过理解和响应用户的自然语言指令,使得信息检... 阅读全文

    优惠 英伟达推出多模态大语言模型NVLM 1.0

  • 英伟达推出多模态大语言模型NVLM 1.0
    AI
  • 英伟达推出多模态大语言模型NVLM 1.0,它在视觉-语言任务上取得了突破性成果,与业界领先的专有模型(比如GPT-4o)和开源模型(比如Llama 3-V 405B和InternVL 2)相媲美。NVLM 1.0不仅在多模态任务上表现出色,还在文本任务上超越了其基础的大语言模型。 项目主页:https://nvlm-... 阅读全文

    优惠 Breaking-reCAPTCHAv2:如何破解 Google 的 reCAPTCHA v2 系统

  • Breaking-reCAPTCHAv2:如何破解 Google 的 reCAPTCHA v2 系统
    AI
  • 苏黎世联邦理工学院的研究人员发布论文,论文的主题是关于如何破解 Google 的 reCAPTCHA v2 系统。reCAPTCHA 是一种广泛使用的网络安全工具,它通过一系列挑战(也就是我们常说的验证码)来区分用户是真人还是自动程序(比如机器人)。Google 的 reCAPTCHA v2 是其中一种,它会用一些图像... 阅读全文

    优惠 AudioBERT:通过基于检索的方法增强 BERT 的听觉知识的新方法

  • AudioBERT:通过基于检索的方法增强 BERT 的听觉知识的新方法
    AI
  • AudioBERT是一种通过基于检索的方法增强 BERT 的听觉知识的新方法,它专门设计来增强传统语言模型在听觉知识方面的不足。传统上,语言模型主要在文本数据上进行预训练,这可能导致它们在处理与声音相关的任务时缺乏一些基本的听觉常识。例如,你正在开发一个教育应用程序,旨在帮助儿童学习动物和它们的声音。使用AudioBE... 阅读全文

    优惠 新型大语言模型推理框架DoT:通过构建一个有向无环图(DAG)来模拟迭代推理过程

  • 新型大语言模型推理框架DoT:通过构建一个有向无环图(DAG)来模拟迭代推理过程
    AI
  • 清华大学创新研究院、上海人工智能实验室和上海启智研究院的研究人员推出DoT框架,它是一种新型大语言模型推理框架。DoT通过构建一个有向无环图(DAG)来模拟迭代推理过程,这种结构比传统的线性或树形结构更能捕捉人类推理的复杂性。 GitHub:https://github.com/diagram-of-thought/d... 阅读全文

    优惠 Ferret算法:用于大语言模型的联邦学习(FL)方法

  • Ferret算法:用于大语言模型的联邦学习(FL)方法
    AI
  • 广东人工智能与数字经济实验室、新加坡国立大学计算机科学系、新加坡国立大学数据科学研究所和加拿大卡尔顿大学的研究人员推出一个名为Ferret的算法,它是一种用于大语言模型(LLMs)的联邦学习(FL)方法。联邦学习是一种允许在多个分散的数据源上训练模型的技术,同时保持数据隐私和减少通信开销。 GitHub:https:/... 阅读全文

    优惠 漫画理解(Comics Understanding):利用人工智能(AI)来分析和理解漫画内容

  • 漫画理解(Comics Understanding):利用人工智能(AI)来分析和理解漫画内容
    AI
  • 西班牙巴塞罗那自治大学和意大利佛罗伦萨大学的研究人员发布论文,论文的主题是关于漫画理解(Comics Understanding),它探讨了如何利用人工智能(AI)来分析和理解漫画内容。漫画不仅包含图像,还有文字,它们共同讲述故事,这使得漫画理解成为一个跨视觉和语言的复杂任务。 GitHub:https://githu... 阅读全文

    优惠 英伟达推出小型语言模型Nemotron-Mini-4B-Instruct :专为角色扮演、增强式检索生成(RAG)和功能调用等任务设计

  • 英伟达推出小型语言模型Nemotron-Mini-4B-Instruct :专为角色扮演、增强式检索生成(RAG)和功能调用等任务设计
    AI
  • 英伟达最新推出了一款名为 Nemotron-Mini-4B-Instruct的小型语言模型(SLM),这在公司长期致力于人工智能创新的历程中开启了新的篇章。这款专为角色扮演、增强式检索生成(RAG)和功能调用等任务设计的模型,是 英伟达 更大型模型的精简而高效版本。现在,让我们深入了解 Nemotron-Mini-4B... 阅读全文

    优惠 SyncOOD:用于改善目标检测模型在面对未知或非训练集中类别(即“离群点”或“OOD”对象)时的性能的技术

  • SyncOOD:用于改善目标检测模型在面对未知或非训练集中类别(即“离群点”或“OOD”对象)时的性能的技术
    AI
  • 香港大学的研究人员推出SyncOOD,它是一种用于改善目标检测模型在面对未知或非训练集中类别(即“离群点”或“OOD”对象)时的性能的技术。SyncOOD通过利用大规模开放数据集训练的生成模型来合成OOD样本,从而增强OOD目标检测。 GitHub:https://github.com/CVMI-Lab/SyncOOD... 阅读全文

    优惠 新型大型视频-语言模型PiTe:通过一种称为“像素-时间对齐”的技术,提高了模型理解和生成视频内容的能力

  • 新型大型视频-语言模型PiTe:通过一种称为“像素-时间对齐”的技术,提高了模型理解和生成视频内容的能力
    AI
  • 西湖大学和苏州大学的研究人员推出新型大型视频-语言模型PiTe,它通过一种称为“像素-时间对齐”的技术,提高了模型理解和生成视频内容的能力。PiTe模型的目标是通过精细的时空对齐,让机器更好地理解和回应与视频内容相关的语言指令。 论文地址:https://arxiv.org/abs/2409.07239 例如,你正在看... 阅读全文