人工智能

优惠 由 AI 大型语言模型(LLM)驱动的命令行生产力工具ShellGPT

  • 由 AI 大型语言模型(LLM)驱动的命令行生产力工具ShellGPT
    AI
  • ShellGPT是一个由 AI 大型语言模型(LLM)驱动的命令行生产力工具。该命令行工具提供了对 shell 命令、代码片段、文档 的简化生成,消除了对外部资源(如 Google 搜索)的需求。支持 Linux、macOS、Windows,并与 PowerShell、CMD、Bash、Zsh 等主要 Shell 兼容... 阅读全文

    优惠 文生视频平台Pika升级新功能:视频可集成AI生成音效

  • 文生视频平台Pika升级新功能:视频可集成AI生成音效
    AI
  • 今日凌晨,备受瞩目的文生视频平台Pika通过X平台宣布了一项令人振奋的新功能:视频现在可以集成AI生成的音效了。这一创新功能将为用户带来更加沉浸式的视频体验,让声音与画面完美融合。据悉,用户现在可以在Pika生成的视频中无缝生成、整合声音。用户只需通过简单的提示词来描述他们想要的声音,或者直接让Pika根据视频内容自动... 阅读全文

    优惠 AI 绘图工具「 Recraft.ai 」,快速生成图标与矢量插图

  • AI 绘图工具「 Recraft.ai 」,快速生成图标与矢量插图
    AI
  • 在数字化时代,图像生成工具层出不穷,但Recraft凭借其独特的功能和简洁的操作界面,成为了一款备受瞩目的AI图像生成工具。它不仅能够根据需求关键字自动生成多款图像,还支持多种画风切换,让创作变得更加丰富多彩。Recraft的操作相当直觉,用户只需输入需求关键字,系统便能自动生成数款图像供选择。不仅如此,它还支持插画、... 阅读全文

    优惠 新型的双向长距离DNA序列模型家族Caduceus

  • 新型的双向长距离DNA序列模型家族Caduceus
    AI
  • 这篇论文介绍了Caduceus,这是一个新型的双向长距离DNA序列模型家族,它能够处理DNA序列中的长距离相互作用,并且考虑了DNA的反向互补性(RC)。Caduceus模型在基因组学中的应用,特别是在预测基因变异对基因表达影响的任务上,表现出了优越的性能。例如,如果我们想要研究一个特定的遗传变异是否会导致某种疾病,C... 阅读全文

    优惠 用于视觉-语言模型的新型预训练范式S4

  • 用于视觉-语言模型的新型预训练范式S4
    AI
  • 这篇论文提出了一种名为S4(Strongly Supervised pre-training with ScreenShots)的新型预训练范式,用于视觉-语言模型(Vision-Language Models,简称VLMs)。S4利用大规模网络截图渲染数据,通过丰富的视觉和文本线索来提升模型的性能,这些线索在使用图像... 阅读全文

    优惠 训练大型语言模型新策略GaLore:解决训练过程中的显存挑战

  • 训练大型语言模型新策略GaLore:解决训练过程中的显存挑战
    AI
  • 这篇论文介绍了一种名为GaLore(Gradient Low-Rank Projection)的方法,它是一种训练大型语言模型(LLMs)的策略,旨在解决训练过程中的显存挑战。随着LLMs的规模不断增长,它们的权重和优化器状态所需的内存也越来越多,这限制了在有限硬件资源上进行训练的能力。 主要功能: GaLore的主要... 阅读全文

    优惠 ShortGPT:简化大语言模型,根据不同的需求调整删除的层数,以达到速度和性能之间的最佳平衡

  • ShortGPT:简化大语言模型,根据不同的需求调整删除的层数,以达到速度和性能之间的最佳平衡
    AI
  • 百川智能推出ShortGPT,它用于简化大语言模型(LLMs),比如我们熟知的GPT系列。随着LLMs在各种任务上的表现越来越出色,它们的规模也变得越来越大,有的甚至包含了数十亿甚至数万亿个参数。但是,这篇研究发现,LLMs中的许多层其实是非常相似的,有些层在模型功能中的作用几乎可以忽略不计。 举个例子,假设我们有一个... 阅读全文

    优惠 Co-LLM:教会多个大语言模型(LLM)如何协作

  • Co-LLM:教会多个大语言模型(LLM)如何协作
    AI
  • 这篇论文介绍了一种名为Co-LLM(Collaborative Language Model)的方法,它教会多个大语言模型(LLM)如何协作。假设我们有一个任务是回答医学问题。Co-LLM可以让一个通用的大型语言模型(比如LLAMA-7B)生成问题的回答框架,然后调用一个专门针对医学领域训练的模型(比如MEDITRON... 阅读全文

    优惠 专门为法律领域设计的大语言模型SaulLM-7B

  • 专门为法律领域设计的大语言模型SaulLM-7B
    AI
  • 这篇论文介绍了一个名为SaulLM-7B的大语言模型(LLM),它是专门为法律领域设计的。SaulLM-7B拥有70亿个参数,是第一个明确为法律文本理解和生成而设计的LLM。这个模型基于Mistral 7B架构,训练于一个超过300亿个token的英语法律语料库。SaulLM-7B在理解和处理法律文件方面表现出了最先进... 阅读全文

    优惠 新型视觉模仿学习方法3D Diffusion Policy (DP3):结合3D视觉表示和扩散策略,使得机器人能够在模拟和现实世界任务中高效地学习复杂技能

  • 新型视觉模仿学习方法3D Diffusion Policy (DP3):结合3D视觉表示和扩散策略,使得机器人能够在模拟和现实世界任务中高效地学习复杂技能
    AI
  • 来自上海启智研究院、上海交通大学、清华大学、上海人工智能实验室的研究人员推出新型视觉模仿学习方法3D Diffusion Policy (DP3),这种方法通过结合3D视觉表示和扩散策略,使得机器人能够在模拟和现实世界任务中高效地学习复杂技能。DP3的核心设计是利用从稀疏点云中提取的紧凑3D视觉表示,这些表示通过一个高... 阅读全文

    优惠 新型3D高斯点云模型X-Gaussian:用于X射线(X光)新视角合成(NVS)

  • 新型3D高斯点云模型X-Gaussian:用于X射线(X光)新视角合成(NVS)
    AI
  • 约翰·霍普金斯大学、香港科技大学(广州)、上海交通大学的研究人员推出新型3D高斯点云模型X-Gaussian,它用于X射线(X光)新视角合成(NVS)。X射线在医学成像等领域广泛应用,因为它能比自然光更深入地穿透物体。然而,X射线对人体有害,尤其是当X射线剂量增加时。提高NVS技术可以帮助减少X射线的暴露,为医生和下游... 阅读全文

    优惠 视觉-语言模型(VLMs)在RPMs智力测试表现如何

  • 视觉-语言模型(VLMs)在RPMs智力测试表现如何
    AI
  • 来自苹果的研究人员发布论文探讨了视觉-语言模型(VLMs)在视觉推理任务上的表现,特别是针对一种名为雷文进阶矩阵(Raven's Progressive Matrices,简称RPMs)的智力测试。RPMs是一种经典的智力测试工具,它要求参与者通过观察一系列图形,找出完成图案所需的正确图形。这项研究旨在评估VLMs在仅... 阅读全文