大语言模型

优惠 Meta推出基于Llama3打造的AI助手Meta AI

  • Meta推出基于Llama3打造的AI助手Meta AI
    AI
  • Meta还发布了基于Llama3打造的AI助手Meta AI,大家可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI,同时还推出了Meta AI官网,Meta AI 无缝搜索集成于Facebook、Instagram、WhatsApp 和 Messenger ... 阅读全文

    优惠 超级重磅!Meta发布开源大语言模型Llama 3系列

  • 超级重磅!Meta发布开源大语言模型Llama 3系列
    AI
  • 说到开源大语言模型,最重要的就是Meta的Llama系列,尤其是去年发布的Llama2,成了很多大学、研究机构、甚至初创公司研究及开发大语言模型的基础。大家一直都在期待Meta发布Llama 3,原本预计会在今年6月发布,但Meta在当地时间4月18日就无预警的发布了Llama 3系列大语言模型,目前发布的有Llama... 阅读全文

    优惠 Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store,在手机上使用各种开源大模型

  • Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store,在手机上使用各种开源大模型
    AI
  • Hugging Face推出了旗下AI聊天应用Hugging Chat的 iOS客户端,大家可以方便的在手机上使用各种开源大模型,目前支持的模型有6款: Command R+ Zephyr-14b Mixtral 8x7B Gemma-1.1-7b Nous-hermes-mixtral 8x7B Mistral 7B... 阅读全文

    优惠 基于 LLM 大语言模型的知识库问答系统MaxKB

  • 基于 LLM 大语言模型的知识库问答系统MaxKB
    AI
  • MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base,旨在成为企业的最强大脑。 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化,智能问答交互体验好; 无缝嵌入:支持零编码快速嵌入到第三方业务系统; 多模型支持:支持对接主流的大模型,包括... 阅读全文

    优惠 SIMA:创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理

  • SIMA:创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理
    AI
  • 由Google DeepMind团队开发的项目SIMA(Scalable, Instructable, Multiworld Agent),SIMA的目标是创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理。这个代理可以用于执行各种任务,比如在虚拟环境中导航、收集资源、建造物品或者与环境互动。想象一下,你告诉... 阅读全文

    优惠 TR-DPO:用于改进大语言模型(LLMs)的对齐问题

  • TR-DPO:用于改进大语言模型(LLMs)的对齐问题
    AI
  • Tinkoff推出新方法Trust Region Direct Preference Optimization(TR-DPO),它用于改进大语言模型(LLMs)的对齐问题。在自然语言处理(NLP)中,对齐问题是指训练模型以生成不仅有效而且安全、可控的输出。例如,当你使用聊天机器人时,你希望它提供有帮助、准确且不会造成伤... 阅读全文

    优惠 新型神经网络架构TransformerFAM:为了解决大语言模型处理极长输入序列时的挑战而设计

  • 新型神经网络架构TransformerFAM:为了解决大语言模型处理极长输入序列时的挑战而设计
    AI
  • 谷歌推出新型神经网络架构TransformerFAM,它是为了解决大语言模型(LLMs)处理极长输入序列时的挑战而设计的。例如,你有一个非常长的故事,需要一个能够记住故事中所有细节的超级大脑。传统的神经网络(比如Transformer)在处理这样的故事时会遇到麻烦,因为它们的记忆能力有限,而且处理起来非常慢。Trans... 阅读全文

    优惠 新型神经网络架构MEGALODON,为了更高效地处理长序列数据而设计

  • 新型神经网络架构MEGALODON,为了更高效地处理长序列数据而设计
    AI
  • 来自Meta、南加州大学、卡内基梅隆大学 和加州大学圣地亚哥分校的研究人员推出新型神经网络架构MEGALODON,它是为了更高效地处理长序列数据而设计的。想象一下,你有一个非常长的故事,需要一个能够记住故事中所有细节的超级大脑。传统的神经网络(比如Transformer)在处理这样的故事时会遇到麻烦,因为它们的记忆能力... 阅读全文

    优惠 压缩能力和智能之间的关系:一个语言模型能够以更少的比特无损地压缩文本,这是否意味着它具有更高的智能?

  • 压缩能力和智能之间的关系:一个语言模型能够以更少的比特无损地压缩文本,这是否意味着它具有更高的智能?
    AI
  • 香港科技大学和腾讯的研究人员发布论文探讨了压缩能力和智能之间的关系。作者提出了一个问题:如果一个语言模型能够以更少的比特无损地压缩文本,这是否意味着它具有更高的智能?为了回答这个问题,论文对大语言模型(LLMs)进行了实证研究,将这些模型视为数据压缩器,并评估了它们在不同基准测试中的表现。 主要功能和特点: 智能与压缩... 阅读全文

    优惠 如何提高多模态大语言模型(MLLMs)推理(inference)效率

  • 如何提高多模态大语言模型(MLLMs)推理(inference)效率
    AI
  • 高通发布论文探讨了如何提高多模态大语言模型(MLLMs)推理(inference)效率的问题。MLLMs是一类能够处理包括文本和图像在内的多种模态数据的模型,它们在现实世界中非常有用,因为我们的数据通常包含多种形式,如文本、图片等。然而,这些模型在处理数据时往往速度较慢,因为它们需要逐个生成令牌(tokens),并且受... 阅读全文

    优惠 华为推出多模态大语言模型TextHawk:专门设计用于处理文档导向的任务,同时保持了处理多种模态任务的通用能力

  • 华为推出多模态大语言模型TextHawk:专门设计用于处理文档导向的任务,同时保持了处理多种模态任务的通用能力
    AI
  • 华为推出多模态大语言模型TextHawk,它专门设计用于处理文档导向的任务,同时保持了处理多种模态任务的通用能力。TextHawk在处理文档图像时表现出色,这些图像通常包含高分辨率和高信息密度,这对于传统的语言模型来说是一个挑战。例如,如果你有一张包含复杂表格的图像,TextHawk可以帮助你理解表格中的数据,并回答有... 阅读全文

    优惠 斯坦福大学发布《2024人工智能指数报告》:揭示AI领域最新趋势与挑战

  • 斯坦福大学发布《2024人工智能指数报告》:揭示AI领域最新趋势与挑战
    AI
  • 斯坦福大学人类中心人工智能研究所发布《2024人工智能指数报告》,这已经是该研究所第七年发布《人工智能指数报告》,2024年版指数报告是该研究所迄今为止最为全面的报告,它诞生于人工智能对社会影响日益凸显的重要时刻。该报告详细分析了2023 年人工智能(AI)技术的最新进展、社会影响、以及经济和政策方面的趋势。 此版报告... 阅读全文