人工智能

优惠 SuperAGI推出新型多模态模型Veagle:如何将语言和视觉信息结合起来,以便更好地理解和处理包含文本的图像

  • SuperAGI推出新型多模态模型Veagle:如何将语言和视觉信息结合起来,以便更好地理解和处理包含文本的图像
    AI
  • SuperAGI推出新型多模态模型Veagle,它专注于如何将语言和视觉信息结合起来,以便更好地理解和处理包含文本的图像。在现实世界中,我们经常遇到包含文本的图像,比如路标、菜单或者商品包装,理解和解释这些图像中的文本对于人工智能来说是一个挑战。 GitHub:https://github.com/superagi/V... 阅读全文

    优惠 新型高分辨率多模态感知模型Griffon v2:在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位

  • 新型高分辨率多模态感知模型Griffon v2:在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位
    AI
  • 来自中国科学院自动化研究所基础模型研究中心、中国科学院大学人工智能学院、鹏城实验室和武汉人工智能研究院的研究团队推出新型高分辨率多模态感知模型Griffon v2,这个模型旨在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位。Griffon v2通过视觉和文... 阅读全文

    优惠 新型分布式注意力框架BurstAttention:专门设计来处理极长序列的数据

  • 新型分布式注意力框架BurstAttention:专门设计来处理极长序列的数据
    AI
  • 这篇论文介绍了一个名为BurstAttention的新型分布式注意力框架,它专门设计来处理极长序列的数据。在大语言模型(LLMs)中,注意力模块是理解复杂文本和生成响应的关键部分,但是随着序列长度的增加,这些模块在计算时间和内存消耗上的复杂度也会呈二次方增长,这就成了一个挑战。BurstAttention通过在多个设备... 阅读全文

    优惠 新型视觉模型GiT:通过一个通用的语言接口来处理各种视觉任务,从而实现一个视觉领域的通用模型

  • 新型视觉模型GiT:通过一个通用的语言接口来处理各种视觉任务,从而实现一个视觉领域的通用模型
    AI
  • 来自北京大学、马克斯·普朗克信息学研究所、香港中文大学(深圳)、苏黎世联邦理工学院、香港中文大学的研究团队推出新型视觉模型GiT(Generalist Vision Transformer),它的目标是通过一个通用的语言接口来处理各种视觉任务,从而实现一个视觉领域的通用模型。想象一下,有一个智能助手,它可以看一张图片,... 阅读全文

    优惠 新型语言模型Quiet-STaR:能够自己“思考”以提高对文本的理解能力

  • 新型语言模型Quiet-STaR:能够自己“思考”以提高对文本的理解能力
    AI
  • 来自斯坦福大学和Notbad AI的研究团队推出新型语言模型Quiet-STaR(Quiet Self-Taught Reasoner),它能够自己“思考”以提高对文本的理解能力。想象一下,当你在写作或说话时,有时会停下来思考一下,这是因为我们在大脑中构建了一种逻辑或推理过程,帮助我们更好地表达或解决问题。Quiet-... 阅读全文

    优惠 新型人工智能模型3D-VLA:能够理解三维视觉信息、语言指令,并在此基础上进行行动规划的生成式世界模型

  • 新型人工智能模型3D-VLA:能够理解三维视觉信息、语言指令,并在此基础上进行行动规划的生成式世界模型
    AI
  • 来自马萨诸塞大学阿默斯特分校、上海交通大学、华南理工大学、武汉大学、麻省理工学院和IBM Watson AI 实验室的研究团队推出新型人工智能模型3D-VLA(3D Vision-Language-Action),它是一个能够理解三维视觉信息、语言指令,并在此基础上进行行动规划的生成式世界模型。想象一下,你有一个机器人... 阅读全文

    优惠 零一万物发布了Yi大模型API,支持输入30万汉字

  • 零一万物发布了Yi大模型API,支持输入30万汉字
    AI
  • 零一万物发布了Yi大模型API(应用程序接口)开放平台。据悉,此次 API 开放平台提供以下模型:Yi-34B-Chat-0205,支持通用聊天、问答、对话、写作、翻译等功能;Yi-34B-Chat-200K,支持200K 上下文,多文档阅读理解、超长知识库构建;Yi-VL-Plus多模态模型,支持文本、视觉多模态输入... 阅读全文

    优惠 你游戏中的“神队友”!谷歌发布通用游戏AI智能体SIMA

  • 你游戏中的“神队友”!谷歌发布通用游戏AI智能体SIMA
    AI
  • 谷歌DeepMind团队发布了可扩展、可指导的多世界智能体SIMA(Scalable Instructable Multiworld Agent),该智能体可以遵循自然语言指令在各种视频游戏环境中执行任务,从个别游戏转向通用的、可指导的游戏AI智能体。据介绍,SIMA适用于3D虚拟环境,可通过语言接口将先进的AI模型能... 阅读全文

    优惠 AI大模型创企Anthropic发布了Claude 3 Haiku

  • AI大模型创企Anthropic发布了Claude 3 Haiku
    AI
  • 今日,AI大模型创企Anthropic发布了Claude 3 Haiku,这是同系列中速度最快且最实惠的型号,该模型现已与Sonnet和Opus一起在Claude API和claude.ai上为Claude Pro订阅者提供。 以下是官方全文翻译: 今天,我们隆重发布Claude 3 Haiku,这款模型在其智能等级中... 阅读全文

    优惠 上海AI实验室开源发布高质量语料“万卷CC”

  • 上海AI实验室开源发布高质量语料“万卷CC”
    AI
  • 上海人工智能实验室(上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”(WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符(100B token),约400GB的高质量英文数据。作为“大模型语料数据联盟”今年首发的开源语料,WanJuan-CC将为学界和业界提供大规模、高质量... 阅读全文

    优惠 16x Prompt :帮助开发人员使用 ChatGPT 的源代码和上下文编写完美的提示

  • 16x Prompt :帮助开发人员使用 ChatGPT 的源代码和上下文编写完美的提示
    AI
  • 16x Prompt 是一款桌面应用程序,它帮助您从各种输入中创建提示。这些提示是基于任务说明、源代码文件和格式指示生成的。随后,您可以将这些提示输入到ChatGPT或其他大型语言模型中,以生成所需的代码。首先,下载并安装16x Prompt。然后,打开应用程序并开始编写您的提示。在此过程中,您可以输入任务说明并选择相... 阅读全文

    优惠 老牌图库Freepik 推出AI绘画工具,轻松生成独特图片,每日可生成20张图片

  • 老牌图库Freepik 推出AI绘画工具,轻松生成独特图片,每日可生成20张图片
    AI
  • 你是否正在寻找一款方便易用的AI图片生成工具?Freepik,这家老字号免费图库,近期推出的AI Image Generator或许能满足你的需求。Freepik早期以向量图、相片、图示和影片素材为主打,如今已发展成为线上相片编辑工具和应用程式的领先者。不仅如此,Flaticon、Slidesgo和Videvo等知名产... 阅读全文