人工智能

优惠 功能强大、易于使用的开源 RAG 工具kotaemon:为最终用户提供了与文档进行交互的可能,也为开发者提供了构建和定制 RAG 管道的平台

  • 功能强大、易于使用的开源 RAG 工具kotaemon:为最终用户提供了与文档进行交互的可能,也为开发者提供了构建和定制 RAG 管道的平台
    AI
  • kotaemon 是一个基于检索增强生成(RAG)技术的开源工具,它允许用户与文档进行交互式对话。kotaemon 的主要目的是提供一个简洁、可定制且功能丰富的用户界面,以便用户能够在其文档上进行问答,同时也为开发者提供了一个强大的框架来构建和定制自己的 RAG 管道。 主要功能特性 kotaemon 具备以下主要功能... 阅读全文

    优惠 微调大语言模型新方法CURLoRA

  • 微调大语言模型新方法CURLoRA
    AI
  • 这篇论文介绍了一种名为CURLoRA的新型方法,它用于对大语言模型(LLMs)进行微调。CURLoRA利用了CUR矩阵分解技术,并结合了低秩适应(LoRA)的概念。这种方法主要解决了在持续学习过程中,如何减少模型的灾难性遗忘以及如何减少可训练参数数量这两个关键挑战。 GitHub:https://github.com/... 阅读全文

    优惠 为了更好地理解和处理科学文献而设计的AI模型SciLitLLM

  • 为了更好地理解和处理科学文献而设计的AI模型SciLitLLM
    AI
  • 中国科学技术大学和深势科技的研究人员推出一个名为SciLitLLM的人工智能模型,它是为了更好地理解和处理科学文献而设计的。你可以把它想象成一个超级聪明的机器人,它阅读科学文章和论文的能力就像一个科学家或研究者一样。 主要功能: SciLitLLM的主要功能是理解科学文献的内容,然后根据这些内容回答问题或者执行特定的任... 阅读全文

    优惠 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份

  • 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份
    AI
  • 华盛顿大学和艾伦人工智能研究所的研究人员推出文本风格转换方法StyleRemix,它能够将文本重新编写,以故意模糊作者的身份。这项技术对于保护作者隐私非常重要,尤其是在需要匿名讨论、双盲审稿或健康服务等敏感情境中。总的来说,StyleRemix是一个强大的工具,它通过精细的风格元素控制和低计算成本,为用户提供了一种有效... 阅读全文

    优惠 三维重建方法Spann3R:能够从有序或无序的图像集合中重建出密集的三维几何结构

  • 三维重建方法Spann3R:能够从有序或无序的图像集合中重建出密集的三维几何结构
    AI
  • 伦敦大学学院的研究人员推出三维重建方法Spann3R,它能够从有序或无序的图像集合中重建出密集的三维几何结构。这个方法的核心在于使用一个基于变换器(transformer)的架构,直接从图像中回归点图(pointmap),而不需要事先知道场景或相机参数。 项目主页:https://hengyiwang.github.i... 阅读全文

    优惠 SAM2POINT系统:用于三维(3D)分割的先进框架

  • SAM2POINT系统:用于三维(3D)分割的先进框架
    AI
  • 香港中文大学MiuLar实验室、香港中文大学MMLab、字节跳动和上海人工智能实验室的研究人员推出SAM2POINT系统,它是一个用于三维(3D)分割的先进框架。三维分割是指在三维空间中识别和区分不同对象或场景的过程,类似于在照片中用标记笔圈出不同的物体。SAM2POINT利用了一种称为Segment Anything... 阅读全文

    优惠 新型音频编码模型WavTokenizer:能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理

  • 新型音频编码模型WavTokenizer:能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理
    AI
  • 浙江大学、阿里巴巴集团 和Meta的研究人员推出新型音频编码模型WavTokenizer,它能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理。简单来说,WavTokenizer就像是一个音频界的“压缩器”,能够把一段音频变成一串代码,这些代码既占用空间小,又能在需要的... 阅读全文

    优惠 新型三维场景重建框架ReconX:从稀疏的视角(比如只有几张图片)重建出详细的三维场景

  • 新型三维场景重建框架ReconX:从稀疏的视角(比如只有几张图片)重建出详细的三维场景
    AI
  • 清华大学和香港科技大学的研究人员推出新型三维场景重建框架ReconX,econX的目标是从稀疏的视角(比如只有几张图片)重建出详细的三维场景。这就像用几张风景照片,来构建一个可以360度观看的三维模型。 项目主页:https://liuff19.github.io/ReconX GitHub:https://githu... 阅读全文

    优惠 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2:专门设计用于理解和处理图像与视频内容

  • 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2:专门设计用于理解和处理图像与视频内容
    AI
  • 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2,它们专门设计用于理解和处理图像与视频内容。简单来说,这些模型就像是拥有超凡视觉能力的智能助手,它们不仅能“看到”图像和视频里的内容,还能理解这些内容背后的含义,并根据这些理解来回答问题或者执行任务。 GitHub:https://github.com/THU... 阅读全文

    优惠 AnythingLLM :可以在本地电脑一件运行大语言模型的跨平台桌面客户端

  • AnythingLLM :可以在本地电脑一件运行大语言模型的跨平台桌面客户端
    AI
  • AnythingLLM 是一款可以在本地电脑一件运行大语言模型的跨平台桌面客户端,支持 Windows、macOS、Linux,支持自选模型,也可以从软件内下载模型。它还支持嵌入模型、语音、转录,最重要的是可以实现完全离线,不依托任何云服务。@Appinn  ... 阅读全文

    优惠 TEDRA:让用户通过文本描述来编辑动态且逼真的3D角色模型

  • TEDRA:让用户通过文本描述来编辑动态且逼真的3D角色模型
    AI
  • 马克斯·普朗克信息学研究所,萨尔信息学校区、萨尔布吕肯视觉计算、交互和人工智能研究中心和弗莱堡大学的研究人员推出TEDRA,它可以让用户通过文本描述来编辑动态且逼真的3D角色模型。简单来说,TEDRA就是一个先进的“虚拟化妆师”,能够根据你提供的文本提示,比如“穿着卫衣的男人”,来改变3D角色的外观,同时保持角色的动作... 阅读全文

    优惠 新型机器人学习模型ICRT:通过一种新颖的“在上下文中学习”方法,让机器人能够在没有额外训练的情况下,通过理解输入的上下文信息来执行新任务

  • 新型机器人学习模型ICRT:通过一种新颖的“在上下文中学习”方法,让机器人能够在没有额外训练的情况下,通过理解输入的上下文信息来执行新任务
    AI
  • 加州大学伯克利分校和Autodesk的研究人员推出新型机器人学习模型ICRT,ICRT的核心目标是通过一种新颖的“在上下文中学习”(in-context learning)方法,让机器人能够在没有额外训练的情况下,通过理解输入的上下文信息来执行新任务。例如,我们有一个机器人,需要它在不同的环境中执行拾取和放置物体的任务... 阅读全文