大语言模型

优惠 阿里巴巴推出多模态大语言模型mPLUG-Owl3

  • 阿里巴巴推出多模态大语言模型mPLUG-Owl3
    AI
  • 阿里巴巴推出多模态大语言模型mPLUG-Owl3,它在处理单图像、多图像和视频任务方面取得了显著的进展。例如,你向mPLUG-Owl3展示一系列图片,并询问其中的天气情况,模型可以分析这些图片并告诉你哪一张是雪天。或者,如果你展示一段视频,并要求模型按时间顺序描述视频中的事件,mPLUG-Owl3可以准确地按照视频中的... 阅读全文

    优惠 OpenResearcher:利用人工智能(AI)技术来加速科学研究进程

  • OpenResearcher:利用人工智能(AI)技术来加速科学研究进程
    AI
  • 创新平台OpenResearcher,它利用人工智能(AI)技术来加速科学研究进程。想象一下,研究人员每天都在与成堆的学术论文打交道,试图跟上他们领域内的最新进展,这既耗时又费力。OpenResearcher就像一个智能助手,可以帮助研究人员快速找到他们需要的信息,节省时间,提高研究效率。例如,如果一个生物医学研究人员... 阅读全文

    优惠 新型大语言模型LongWriter:能够生成超过10,000个词的超长文本

  • 新型大语言模型LongWriter:能够生成超过10,000个词的超长文本
    AI
  • 清华大学和智谱AI的研究人员推出新型大语言模型LongWriter,它能够生成超过10,000个词的超长文本。这在人工智能领域是一个重要的突破,因为现有的大型语言模型虽然能够处理长达100,000个词的输入,但在生成文本时却难以超过2,000个词的限制。例如,你是一位历史学家,需要写一篇关于罗马帝国历史的深入分析文章。... 阅读全文

    优惠 深度求索推出开源语言模型DeepSeek-Prover-V1.5:专门为在Lean 4环境中进行定理证明而设计

  • 深度求索推出开源语言模型DeepSeek-Prover-V1.5:专门为在Lean 4环境中进行定理证明而设计
    AI
  • 深度求索推出开源语言模型DeepSeek-Prover-V1.5,它专门为在Lean 4环境中进行定理证明而设计。Lean 4是一种用于数学和逻辑推理的正式证明助手。想象一下,你有一道非常复杂的数学证明题,需要一步步严格推导,DeepSeek-Prover-V1.5就像一个超级助手,可以帮助你更快更准确地完成这个过程。... 阅读全文

    优惠 LG推出大语言模型EXAONE 3.0:经过了“指令调优”,意味着它能够更好地理解和执行人类的指令

  • LG推出大语言模型EXAONE 3.0:经过了“指令调优”,意味着它能够更好地理解和执行人类的指令
    AI
  • LG AI Research团队开发的大语言模型EXAONE 3.0,这个模型特别之处在于它经过了“指令调优”,意味着它能够更好地理解和执行人类的指令。EXAONE 3.0是首个公开的大型语言模型家族中的一员,公开发布的是7.8B(即7.8十亿参数)的版本,目的是为了推动开放的研究和创新。 GitHub:https:/... 阅读全文

    优惠 多模态智能体Optimus-1:能够在像《我的世界》这样的开放世界环境中执行长期任务

  • 多模态智能体Optimus-1:能够在像《我的世界》这样的开放世界环境中执行长期任务
    AI
  • 哈尔滨工业大学和鹏城实验室的研究人员推出多模态智能体“Optimus-1”,它能够在像《我的世界》这样的开放世界环境中执行长期任务。Optimus-1的核心是一个混合多模态记忆模块,这个模块由两个主要部分组成:分层指导知识图谱(HDKG)和抽象多模态经验池(AMEP)。这个智能体的设计灵感来源于人类如何利用长期记忆来完... 阅读全文

    优惠 LLM-DetectAIve:专门设计用来精细地检测机器生成的文本(MGTs)

  • LLM-DetectAIve:专门设计用来精细地检测机器生成的文本(MGTs)
    AI
  • 这篇论文介绍了一个名为“LLM-DetectAIve”的工具,它专门设计用来精细地检测机器生成的文本(MGTs)。随着大语言模型(LLMs)的普及,人们越来越难以区分文本是人类写的还是机器生成的。这在教育和学术领域尤其令人担忧,因为可能会有不正当使用机器生成文本的情况。论文还提到了这个工具的一些限制,比如它目前只支持英... 阅读全文

    优惠 交互式可视化工具TRANSFORMER EXPLAINER:帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型

  • 交互式可视化工具TRANSFORMER EXPLAINER:帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型
    AI
  • TRANSFORMER EXPLAINER是一个交互式可视化工具,它旨在帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型。Transformer是一种在机器学习领域非常流行的神经网络架构,广泛应用于从文本到视觉的多种任务中。但Transformer的内部工作原理对许多人来说还是一个黑箱,... 阅读全文

    优惠 阿里发布新一代数学模型Qwen2-Math

  • 阿里发布新一代数学模型Qwen2-Math
    AI
  • 阿里通义千问 Qwen2 家族的新成员 Qwen2-Math,以其强大的数学解题能力,为开源语言模型领域带来了新的突破。以下是对 Qwen2-Math 的简介和性能概述,以及其多语言模型开发计划的介绍。 项目主页:https://qwenlm.github.io/zh/blog/qwen2-math GitHub:ht... 阅读全文

    优惠 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力

  • 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力
    AI
  • 这篇论文介绍了一个名为LLaVA-OneVision的新型大型多模态模型(LMMs),它是由多个机构共同开发的,包括字节跳动、南洋理工大学、香港中文大学和香港科技大学。这个模型的核心目标是提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力。例如,你正在使用一个智能助手,你给它发送了一张你在旅行中拍摄... 阅读全文

    优惠 评估基准测试MMIU:专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能

  • 评估基准测试MMIU:专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能
    AI
  • 上海人工智能实验室、上海交通大学、香港大学、商汤科技研究部和清华大学的研究人员推出评估基准测试MMIU(Multimodal Multi-image Understanding),它专门用于测试和评估大型视觉-语言模型(LVLMs)在处理多图像任务时的性能。简单来说,MMIU是一个全面的测试套件,它可以检验这些模型是否... 阅读全文

    优惠 ExoViP系统:用于组合视觉推理的验证和探索工具

  • ExoViP系统:用于组合视觉推理的验证和探索工具
    AI
  • 北京国家通用人工智能重点实验室和约翰霍普金斯大学的研究人员推出ExoViP系统,它是一个用于组合视觉推理的验证和探索工具。ExoViP的核心思想是提高复杂视觉任务中人工智能的推理能力,特别是当这些任务需要将复杂的查询转化为一系列可执行的视觉任务时。ExoViP在多个视觉推理任务上的应用,包括视觉问答、图像编辑和视频推理... 阅读全文