人工智能

优惠 新框架ALPHALLM:帮助大语言模型通过自我评估和学习来提高其在复杂推理和规划任务上的表现,而不需要额外的人工标注数据

  • 新框架ALPHALLM:帮助大语言模型通过自我评估和学习来提高其在复杂推理和规划任务上的表现,而不需要额外的人工标注数据
    AI
  • 腾讯AI实验室发布新框架ALPHALLM,它可以帮助大语言模型通过自我评估和学习来提高其在复杂推理和规划任务上的表现,而不需要额外的人工标注数据。 主要功能和特点: 自我改进:ALPHALLM使语言模型能够自我评估,找出回答中的不足,并据此改进。 集成蒙特卡洛树搜索(MCTS):借鉴了AlphaGo的成功经验,ALPH... 阅读全文

    优惠 Cross-lingual Reward Model Transfer:用于自然语言处理(NLP)中的零样本(Zero-Shot)跨语言对齐技术

  • Cross-lingual Reward Model Transfer:用于自然语言处理(NLP)中的零样本(Zero-Shot)跨语言对齐技术
    AI
  • 来自MIT和谷歌的研究人员发布论文介绍了“跨语言奖励模型迁移(Cross-lingual Reward Model Transfer)”,这是一种用于自然语言处理(NLP)中的零样本(Zero-Shot)跨语言对齐技术。简单来说,这项技术可以让一个已经在某种语言(源语言)上训练好的奖励模型(Reward Model,简... 阅读全文

    优惠 Meta推出基于Llama3打造的AI助手Meta AI

  • Meta推出基于Llama3打造的AI助手Meta AI
    AI
  • Meta还发布了基于Llama3打造的AI助手Meta AI,大家可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI,同时还推出了Meta AI官网,Meta AI 无缝搜索集成于Facebook、Instagram、WhatsApp 和 Messenger ... 阅读全文

    优惠 超级重磅!Meta发布开源大语言模型Llama 3系列

  • 超级重磅!Meta发布开源大语言模型Llama 3系列
    AI
  • 说到开源大语言模型,最重要的就是Meta的Llama系列,尤其是去年发布的Llama2,成了很多大学、研究机构、甚至初创公司研究及开发大语言模型的基础。大家一直都在期待Meta发布Llama 3,原本预计会在今年6月发布,但Meta在当地时间4月18日就无预警的发布了Llama 3系列大语言模型,目前发布的有Llama... 阅读全文

    优惠 Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store,在手机上使用各种开源大模型

  • Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store,在手机上使用各种开源大模型
    AI
  • Hugging Face推出了旗下AI聊天应用Hugging Chat的 iOS客户端,大家可以方便的在手机上使用各种开源大模型,目前支持的模型有6款: Command R+ Zephyr-14b Mixtral 8x7B Gemma-1.1-7b Nous-hermes-mixtral 8x7B Mistral 7B... 阅读全文

    优惠 Stability AI发布Stable Audio 2.0技术论文

  • Stability AI发布Stable Audio 2.0技术论文
    AI
  • Stability AI之前推出Stable Audio 2.0,只需要一句提示词,即可生成长达三分钟的44.1 kHz立体声、结构连贯且音质上乘的完整曲目,还支持音频到音频转换能力,以及上传任意音乐对其进行风格转换。官方在昨天发布该模型的技术论文,由Stability A通过训练一个基于扩散变换器(diffusion... 阅读全文

    优惠 基于 LLM 大语言模型的知识库问答系统MaxKB

  • 基于 LLM 大语言模型的知识库问答系统MaxKB
    AI
  • MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base,旨在成为企业的最强大脑。 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化,智能问答交互体验好; 无缝嵌入:支持零编码快速嵌入到第三方业务系统; 多模型支持:支持对接主流的大模型,包括... 阅读全文

    优惠 SIMA:创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理

  • SIMA:创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理
    AI
  • 由Google DeepMind团队开发的项目SIMA(Scalable, Instructable, Multiworld Agent),SIMA的目标是创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理。这个代理可以用于执行各种任务,比如在虚拟环境中导航、收集资源、建造物品或者与环境互动。想象一下,你告诉... 阅读全文

    优惠 TR-DPO:用于改进大语言模型(LLMs)的对齐问题

  • TR-DPO:用于改进大语言模型(LLMs)的对齐问题
    AI
  • Tinkoff推出新方法Trust Region Direct Preference Optimization(TR-DPO),它用于改进大语言模型(LLMs)的对齐问题。在自然语言处理(NLP)中,对齐问题是指训练模型以生成不仅有效而且安全、可控的输出。例如,当你使用聊天机器人时,你希望它提供有帮助、准确且不会造成伤... 阅读全文

    优惠 3D场景修复MALD-NeRF,针对那些在图像中不可见或需要编辑的区域

  • 3D场景修复MALD-NeRF,针对那些在图像中不可见或需要编辑的区域
    AI
  • 来自Meta、 加州大学默塞德分校和马里兰大学学院公园分校的研究人员推出MALD-NeRF,它是一种用于3D场景修复的方法,特别是针对那些在图像中不可见或需要编辑的区域。例如,你有一张包含某个物体的照片,但你想在不改变背景的情况下移除这个物体。使用MALD-NeRF,就可以在不留下任何痕迹的情况下,如魔法般地移除或替换... 阅读全文

    优惠 新型神经网络架构TransformerFAM:为了解决大语言模型处理极长输入序列时的挑战而设计

  • 新型神经网络架构TransformerFAM:为了解决大语言模型处理极长输入序列时的挑战而设计
    AI
  • 谷歌推出新型神经网络架构TransformerFAM,它是为了解决大语言模型(LLMs)处理极长输入序列时的挑战而设计的。例如,你有一个非常长的故事,需要一个能够记住故事中所有细节的超级大脑。传统的神经网络(比如Transformer)在处理这样的故事时会遇到麻烦,因为它们的记忆能力有限,而且处理起来非常慢。Trans... 阅读全文

    优惠 新型神经网络架构MEGALODON,为了更高效地处理长序列数据而设计

  • 新型神经网络架构MEGALODON,为了更高效地处理长序列数据而设计
    AI
  • 来自Meta、南加州大学、卡内基梅隆大学 和加州大学圣地亚哥分校的研究人员推出新型神经网络架构MEGALODON,它是为了更高效地处理长序列数据而设计的。想象一下,你有一个非常长的故事,需要一个能够记住故事中所有细节的超级大脑。传统的神经网络(比如Transformer)在处理这样的故事时会遇到麻烦,因为它们的记忆能力... 阅读全文