大语言模型

优惠 新型语言模型Octopus v2:在智能代理中实现自动化工作流程而设计

  • 新型语言模型Octopus v2:在智能代理中实现自动化工作流程而设计
    AI
  • 斯坦福大学的研究人员推出新型在设备语言模型Octopus v2,它是为了在智能代理中实现自动化工作流程而设计的。这个模型特别适用于在智能手机、汽车、虚拟现实头盔和个人电脑等边缘设备上运行,以提供快速、准确的AI代理服务。总的来说,Octopus v2是一个强大的在设备语言模型,它通过优化模型大小和运行效率,使得在边缘设... 阅读全文

    优惠 韩国NAVER推出大语言模型HyperCLOVA X,专门针对韩语和韩国文化进行了优化

  • 韩国NAVER推出大语言模型HyperCLOVA X,专门针对韩语和韩国文化进行了优化
    AI
  • NAVER Cloud的HyperCLOVA X团队开发的大语言模型HyperCLOVA X,这个模型专门针对韩语和韩国文化进行了优化,并且在处理英语、数学和编程数据方面也具有很强的能力。HyperCLOVA X通过结合高质量的人类注释数据进行指令调整,同时遵循严格的安全指南,以确保负责任的AI实践。 论文地址:htt... 阅读全文

    优惠 国内首个千亿级MoE架构大模型APUS-xDAN-4.0开源

  • 国内首个千亿级MoE架构大模型APUS-xDAN-4.0开源
    AI
  • APUS与新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型APUS-xDAN-4.0,在GitHub上正式开源,该模型可以在低端算力芯片4090上运行,综合性能达到了GPT-4 的90%。APUS-xDAN大模型4.0(MoE)采用GPT4类似的MoE架构,特点是多专家模型组合,同时... 阅读全文

    优惠 DPO:提升多模态模型(LMMs)在处理视频指令跟随任务时的表现

  • DPO:提升多模态模型(LMMs)在处理视频指令跟随任务时的表现
    AI
  • 这篇论文介绍了一个名为Direct Preference Optimization (DPO) 的新技术,它旨在提升大型多模态模型(LMMs)在处理视频指令跟随任务时的表现。想象一下,你正在观看一个教学视频,而一个AI模型需要根据视频内容回答关于视频的问题。这项技术可以帮助AI更准确地理解视频内容,并提供更相关、更准确... 阅读全文

    优惠 重磅来袭!无需注册,即刻体验ChatGPT!

  • 重磅来袭!无需注册,即刻体验ChatGPT!
    AI
  • OpenAI,这家引领人工智能潮流的公司,今日宣布了一项激动人心的消息:ChatGPT现已支持无需创建账户即可立即使用!是的,您没听错,无需繁琐的注册流程,即可轻松体验这一人工智能界的“黑马”。 无论是想要学习新知识、寻找创意灵感,还是解答日常生活中的疑问,ChatGPT都能为您提供智能化的帮助。现在,只需打开chat... 阅读全文

    优惠 苹果发布ReALM:理解用户的指令和问题,并且能够根据上下文给出正确的回应

  • 苹果发布ReALM:理解用户的指令和问题,并且能够根据上下文给出正确的回应
    AI
  • 苹果发布论文的主题是“ReALM: Reference Resolution As Language Modeling”,即“作为语言建模的参考解析”。参考解析是一个理解语言中指代问题的重要任务,它帮助系统理解句子中的“它”或“那个”指的是什么。这对于虚拟助手来说尤其重要,因为它们需要理解用户的指令和问题,并且能够根据... 阅读全文

    优惠 针对视觉语言模型的新挑战“Unsolvable Problem Detection (UPD)”

  • 针对视觉语言模型的新挑战“Unsolvable Problem Detection (UPD)”
    AI
  • 这篇论文介绍了一个名为“Unsolvable Problem Detection (UPD)”的新挑战,主要针对视觉语言模型(Vision Language Models,简称VLMs)。视觉语言模型是一种人工智能技术,它能够理解和解释图像和文本之间的关系。想象一下,你有一个问题,比如“图片中的物体是什么颜色的?”而V... 阅读全文

    优惠 A21推出新型大型语言模型Jamba:结合了Transformer和Mamba(一种状态空间模型)以及专家混合(Mixture-of-Experts,MoE)技术

  • A21推出新型大型语言模型Jamba:结合了Transformer和Mamba(一种状态空间模型)以及专家混合(Mixture-of-Experts,MoE)技术
    AI
  • A21推出新型大型语言模型Jamba,它基于一种创新的混合架构,结合了Transformer和Mamba(一种状态空间模型)以及专家混合(Mixture-of-Experts,MoE)技术。Jamba的设计旨在充分利用这三种技术的优势,以提高性能、提升吞吐量,并保持较低的内存占用。例如,想象一个场景,用户需要一个AI助... 阅读全文

    优惠 谷歌推出新型文本嵌入模型Gecko:从大语言模型(LLMs)中提取知识,以提高文本检索的性能

  • 谷歌推出新型文本嵌入模型Gecko:从大语言模型(LLMs)中提取知识,以提高文本检索的性能
    AI
  • Google DeepMind推出新型文本嵌入模型Gecko,它的设计目的是从大语言模型(LLMs)中提取知识,以提高文本检索的性能。文本嵌入模型可以将文本数据转换为密集的向量形式,这样语义上相似的文本在嵌入空间中就会彼此靠近。这种模型广泛应用于文档检索、句子相似性比较、分类和聚类等任务。例如,假设用户在搜索引擎中输入... 阅读全文

    优惠 华为推出新型高效大语言模型DiJiang:减少传统Transformer模型在处理长序列数据时所需的计算资源

  • 华为推出新型高效大语言模型DiJiang:减少传统Transformer模型在处理长序列数据时所需的计算资源
    AI
  • 华为推出新型高效大语言模型DiJiang,DiJiang的核心目标是减少传统Transformer模型在处理长序列数据时所需的计算资源。Transformer模型在自然语言处理(NLP)领域取得了巨大成功,但其注意力机制(attention mechanism)需要大量的计算资源,尤其是在处理大量参数的大型语言模型时。... 阅读全文

    优惠 新型深度学习架构MambaMixer,专门设计用于高效处理长序列数据

  • 新型深度学习架构MambaMixer,专门设计用于高效处理长序列数据
    AI
  • 这篇论文介绍了一种名为MambaMixer的新型深度学习架构,它专门设计用于高效处理长序列数据。MambaMixer的核心特点是它能够在数据中选择性地混合(mix)和过滤(filter)信息,无论是在时间序列还是图像数据中。这种选择性的能力是通过所谓的“双选择机制”实现的,即同时在数据的“tokens”(类似于序列中的... 阅读全文

    优惠 OPPO发布推出Transformer-Lite:如何在智能手机上高效部署大语言模型

  • OPPO发布推出Transformer-Lite:如何在智能手机上高效部署大语言模型
    AI
  • OPPO发布推出Transformer-Lite,探讨如何在智能手机上高效部署大语言模型(LLM)。大语言模型是一种人工智能技术,广泛应用于智能助手、文本摘要、翻译和多模态任务等。然而,由于这些模型通常需要大量的计算能力和内存带宽,因此在移动设备上直接部署这些模型会面临一些挑战,比如速度慢和用户体验差。例如,想象一下你... 阅读全文