人工智能

优惠 腾讯优图研究团队发布论文总结了小参数的多模态模型的发展历程

  • 腾讯优图研究团队发布论文总结了小参数的多模态模型的发展历程
    AI
  • 腾讯优图研究团队发布论文总结了小参数的多模态模型的发展历程,多模态大型语言模型结合了视觉和语言处理的能力,在诸如视觉问答、视觉理解和推理等任务中表现出色。但是,这些模型往往因为模型体积庞大、训练和推理成本高昂,限制了它们在学术界和工业界的广泛应用。因此,研究高效且轻量级的MLLMs具有巨大潜力,尤其是在边缘计算场景中。... 阅读全文

    优惠 新型商品推荐系统RDRec:利用大语言模型来理解和生成推荐理由,从而提高推荐的相关性和准确性

  • 新型商品推荐系统RDRec:利用大语言模型来理解和生成推荐理由,从而提高推荐的相关性和准确性
    AI
  • 日本山梨大学的研究人员推出新型推荐系统RDRec(Rationale Distillation for LLM-based Recommendation),这个推荐系统的核心思想是利用大语言模型(LLM)来理解和生成推荐理由,从而提高推荐的相关性和准确性。总的来说,RDRec是一个先进的推荐系统,它通过深入理解用户的选... 阅读全文

    优惠 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量

  • 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量
    AI
  • 来自澳大利亚悉尼大学电气工程学院、香港中文大学电子工程学系、香港中文大学深圳研究院、山东大学齐鲁医院的研究人员推出新型低光照增强技术LighTDiff,它专门用于改善手术内窥镜图像的质量。在进行微创手术时,内窥镜提供的图像质量对于医生来说是至关重要的,但在低光照条件下,图像往往难以提供足够的细节,影响手术的精确性和安全... 阅读全文

    优惠 Awesome-Text-to-Video-Generation:AI视频生成项目收集列表

  • Awesome-Text-to-Video-Generation:AI视频生成项目收集列表
    AI
  • GitHub上的一个项目收集列表,以OpenAI的Sora为线索,对文本到视频领域的现有研究进行了全面的探索,并总结了该领域的24个数据集和9个评估指标。还发布论文梳理了文生视频的发展历程,结合Sora的优势和相关领域的特点,探讨了该研究领域及Sora本身存在的问题,并为未来的研究方向提供了建议。如果我们的工作能够给予... 阅读全文

    优惠 如何使用大语言模型来自动生成规划领域的模型

  • 如何使用大语言模型来自动生成规划领域的模型
    AI
  • IBM Research发布论文,探讨如何使用大语言模型(LLMs)来自动生成规划领域的模型。在人工智能规划领域,创建领域模型通常需要人工手动完成,这限制了规划技术的普及和应用。为了使规划过程更加自动化和易于访问,研究者们希望能够自动从简单的文本描述中生成这些领域模型。 例如,你有一个物流公司,需要规划无人机的送货路线... 阅读全文

    优惠 Layer-Condensed KV Cache:如何高效地部署和运行大语言模型,以便在真实世界的应用中实现高吞吐量和低延迟

  • Layer-Condensed KV Cache:如何高效地部署和运行大语言模型,以便在真实世界的应用中实现高吞吐量和低延迟
    AI
  • 上海科技大学与上海市智能视觉与成像工程技术研究中心的研究人员推出Layer-Condensed KV Cache,如何高效地部署和运行大型语言模型(LLMs),以便在真实世界的应用中实现高吞吐量和低延迟。大型语言模型因其庞大的参数数量和深度的网络结构,在自然语言处理(NLP)任务中表现出色,但它们在部署时面临着巨大的内... 阅读全文

    优惠 三维场景理解模型Grounded 3D-LLM:通过结合三维视觉和语言模型,来处理和理解复杂的三维场景

  • 三维场景理解模型Grounded 3D-LLM:通过结合三维视觉和语言模型,来处理和理解复杂的三维场景
    AI
  • 来自上海人工智能实验室、浙江大学和香港中文大学的研究人员推出新型的三维场景理解模型——Grounded 3D-LLM(Grounded 3D Large Language Model)。这个模型旨在通过结合三维视觉和语言模型,来处理和理解复杂的三维场景。下面我将用通俗易懂的语言来介绍这个模型的主要功能、特点、工作原理以... 阅读全文

    优惠 ChatFlow:低成本效益的方式训练大语言模型,特别是针对中文这样的非英语语言

  • ChatFlow:低成本效益的方式训练大语言模型,特别是针对中文这样的非英语语言
    AI
  • 来自深圳大学计算机科学与软件工程学院、腾讯AI实验室、 武汉大学和西交利物浦人工智能与先进计算学院的研究人员推出ChatFlow,这是一种成本效益的方式训练大型语言模型(LLMs),特别是针对中文这样的非英语语言。大型语言模型在自然语言处理(NLP)领域有着广泛的应用,但训练这些模型来处理除了英语之外的语言面临很多挑战... 阅读全文

    优惠 IBM推出INDUS:为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务

  • IBM推出INDUS:为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务
    AI
  • 由IBM Research AI和其他合作机构共同开发的一套大语言模型INDUS,这些模型专门为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务。 主题介绍: 想象一下,你有一个超级助手,它能够阅读和理解大量的科学文献,并且能够回答你关于这些领域的复杂问题。这就像是拥有... 阅读全文

    优惠 Two Platforms推出多语言大语言模型架构SUTRA,它能够理解、推理并用超过50种语言生成文本

  • Two Platforms推出多语言大语言模型架构SUTRA,它能够理解、推理并用超过50种语言生成文本
    AI
  • Two Platforms推出多语言大语言模型(LLM)架构SUTRA,它能够理解、推理并用超过50种语言生成文本。SUTRA的设计独特之处在于它将核心概念理解与语言特定处理分离开来,这有助于实现可扩展和高效的多语言对齐和学习。SUTRA采用了专家混合(Mixture of Experts,MoE)框架,既用于语言处理... 阅读全文

    优惠 腾讯推出全面基准测试Plot2Code:评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计

  • 腾讯推出全面基准测试Plot2Code:评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计
    AI
  • 腾讯推出全面基准测试Plot2Code,它是为了评估多模态大语言模型(MLLMs)在将科学图表转换为可执行代码方面的能力而设计的。MLLMs在视觉领域的应用取得了显著进展,但它们在将视觉图表转换为代码方面的能力尚未得到充分评估。Plot2Code旨在填补这一空白,提供一个公平且深入的评估框架。 通俗介绍: 想象一下,你... 阅读全文

    优惠 SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题

  • SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题
    AI
  • SambaNova推出新型AI加速器SambaNova SN40L,它通过采用数据流架构和专家组合(Composition of Experts,简称CoE)的方法,有效扩展了AI的内存容量。这种加速器旨在解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题。 通俗介绍: 想象一下,你有一... 阅读全文