AI

优惠 新技术SnapKV:解决大语言模型在处理长文本输入时遇到的性能和内存效率问题

  • 新技术SnapKV:解决大语言模型在处理长文本输入时遇到的性能和内存效率问题
    AI
  • 伊利诺伊大学厄巴纳-香槟分校、Cohere 和普林斯顿大学的研究人员推出新技术SnapKV,,它是为了解决大语言模型(LLMs)在处理长文本输入时遇到的性能和内存效率问题。大型语言模型在生成文本时,会使用一种名为“键值(KV)缓存”的技术来提高性能,但随着输入长度的增加,KV缓存的大小也会增长,这会导致内存和时间效率问... 阅读全文

    优惠 昆仑万维推出新型音乐生成模型MusicCM

  • 昆仑万维推出新型音乐生成模型MusicCM
    AI
  • 昆仑万维推出新型音乐生成模型Music Consistency Models(MusicCM),MusicCM的目标是提高音乐生成的效率和质量,它借鉴了图像和视频生成中常用的一致性模型(consistency models)的概念,以更少的采样步骤高效地合成音乐片段。 主要功能和特点: 高效音乐生成:MusicCM能够... 阅读全文

    优惠 微软推出新型语言模型phi-3-mini:3.8亿参数,可在手机上运行

  • 微软推出新型语言模型phi-3-mini:3.8亿参数,可在手机上运行
    AI
  • 微软推出新型语言模型phi-3-mini,这是一个具有3.8亿参数的模型,它在性能上可以与一些大型模型相媲美,如Mixtral 8x7B和GPT-3.5,但大小却足以部署在手机上。这项技术的创新之处在于其训练数据集,这是phi-2数据集的一个扩展版本,包含了大量过滤过的网络数据和合成数据。例如。你有一个智能手机,上面安... 阅读全文

    优惠 MAIA:利用神经模型来自动化理解其他神经模型任务的系统,比如特征解释和故障模式发现

  • MAIA:利用神经模型来自动化理解其他神经模型任务的系统,比如特征解释和故障模式发现
    AI
  • 麻省理工学院计算机科学与人工智能实验室推出MAIA(Multimodal Automated Interpretability Agent,多模态自动可解释性代理)系统,MAIA是一个利用神经模型来自动化理解其他神经模型任务的系统,比如特征解释和故障模式发现。简而言之,MAIA就是一个能够“解释”神经网络的智能代理。 ... 阅读全文

    优惠 摩根大通人工智能研究推出FlowMind,利用大语言模型自动生成金融服务业工作流程

  • 摩根大通人工智能研究推出FlowMind,利用大语言模型自动生成金融服务业工作流程
    AI
  • 摩根大通人工智能研究推出FlowMind,它能够利用大语言模型自动生成工作流程。在许多行业中,尤其是金融服务业,自动化重复性任务已经取得了显著进展,但在处理需要即时或不可预测任务的场景中,传统的自动化方法可能就不够有效。FlowMind通过使用像GPT这样的大语言模型,来创建一个能够自动生成工作流程的系统,以应对这些挑... 阅读全文

    优惠 LLaMA3-Quantization:采用低比特权量化压缩LLAMA3模型大小,减少内存和计算需求,使模型能够在资源受限的设备上运行

  • LLaMA3-Quantization:采用低比特权量化压缩LLAMA3模型大小,减少内存和计算需求,使模型能够在资源受限的设备上运行
    AI
  • 由香港大学、北京航空航天大学和苏黎世联邦理工学院的研究人员推出LLaMA3-Quantization,其采用低比特权量化(low-bit quantization)压缩LLAMA3模型大小,减少内存和计算需求,使模型能够在资源受限的设备上运行。LLAMA3是Meta公司发布的一种大语言模型,它在大量数据上进行了预训练,... 阅读全文

    优惠 OpenAI发布论文:探讨如何提高大语言模型安全性

  • OpenAI发布论文:探讨如何提高大语言模型安全性
    AI
  • OpenAI发布关于如何提高大语言模型安全性的论文,特别是针对提示注入(prompt injections)、越狱(jailbreaks)和其他攻击手段,这些攻击可能允许攻击者覆盖模型的原始指令,执行恶意操作。研究者们提出了一个“指令层级”(instruction hierarchy)的概念,旨在训练LLMs区分不同优... 阅读全文

    优惠 ACE0:从2D图像中恢复出3D场景的结构

  • ACE0:从2D图像中恢复出3D场景的结构
    AI
  • Niantic和牛津大学的研究人员发布关于如何从一组图像中估计相机参数的论文,特别是在没有预先设定的相机姿态(即“未摆好姿势”的图像)的情况下。这个过程被称为结构从运动(Structure-from-Motion,简称SfM),是计算机视觉中的一个基础任务,它允许我们从2D图像中恢复出3D场景的结构。 例如,你是一名建... 阅读全文

    优惠 H-infinity:四足机器人在复杂环境中稳定运动控制

  • H-infinity:四足机器人在复杂环境中稳定运动控制
    AI
  • 来自上海人工智能实验室OpenRobotLab、上海交通大学、浙江大学和香港中文大学的研究人员发布关于四足机器人在复杂环境中稳定运动控制的研究论文。四足机器人在现实世界中的应用越来越广泛,比如在灾难救援或野外探索等场景中,它们需要在不平坦的地面上行走,同时还要能够抵抗各种外部干扰,比如强风或落石等。为了提高机器人的这种... 阅读全文

    优惠 3D场景重建和新视角合成方法3D Gaussian Splatting

  • 3D场景重建和新视角合成方法3D Gaussian Splatting
    AI
  • 来自西蒙弗雷泽大学、不列颠哥伦比亚大学、多伦多大学和谷歌 DeepMind的研究人员推出3D场景重建和新视角合成方法3D Gaussian Splatting,这种方法因其高质量的结果和与硬件光栅化的兼容性而受到关注。然而,Gaussian Splatting对高质量的点云初始化(通过结构从运动,Structure-f... 阅读全文

    优惠 基于文本的视觉问答模型TextSquare

  • 基于文本的视觉问答模型TextSquare
    AI
  • 来自字节跳动、华东师范大学和华中科技大学的研究人员推出TextSquare系统,这是一个基于文本的视觉问答(VQA)模型,它利用了大型多模态语言模型(MLLMs)。TextSquare通过一个新颖的方法生成了一个大规模、高质量的指令调整数据集,称为Square-10M,这个数据集是通过使用闭源的MLLMs生成的。这项工... 阅读全文

    优惠 LLM-R2:利用大语言模型增强的基于规则的查询重写系统,旨在提高查询效率

  • LLM-R2:利用大语言模型增强的基于规则的查询重写系统,旨在提高查询效率
    AI
  • 来自南洋理工大学和阿里巴巴的研究人员推出LLM-R2系统,这是一个利用大语言模型(LLM)增强的基于规则的查询重写系统,旨在提高查询效率。查询重写是一种数据库优化技术,它通过改变SQL查询的结构来生成更高效的查询,而不改变查询的结果。 主要功能: 查询重写:LLM-R2能够接收一个SQL查询,并生成一个执行效率更高但结... 阅读全文