推荐类别

栏目分类

优惠 为了更好地理解和处理科学文献而设计的AI模型SciLitLLM

  • 为了更好地理解和处理科学文献而设计的AI模型SciLitLLM
    AI
  • 中国科学技术大学和深势科技的研究人员推出一个名为SciLitLLM的人工智能模型,它是为了更好地理解和处理科学文献而设计的。你可以把它想象成一个超级聪明的机器人,它阅读科学文章和论文的能力就像一个科学家或研究者一样。 主要功能: SciLitLLM的主要功能是理解科学文献的内容,然后根据这些内容回答问题或者执行特定的任... 阅读全文

    优惠 免费的在线文字转语音服务Azure TTS Web:能够迅速将文本转换为自然流畅的语音输出

  • 免费的在线文字转语音服务Azure TTS Web:能够迅速将文本转换为自然流畅的语音输出
    工具
  • Azure TTS Web 是一款免费的在线文字转语音(Text-To-Speech,TTS)服务,能够迅速将文本转换为自然流畅的语音输出。这项服务不仅支持多种语言,还能在不同语言间正确转换,如在中文内容中准确处理英文单词。 服务特色 自然朗读:通过自然的口语方式,Azure TTS Web 能将文本内容流畅地朗读出来... 阅读全文

    优惠 B站空降助手:自动识别和跳过视频中的赞助内容

  • B站空降助手:自动识别和跳过视频中的赞助内容
    工具
  • BilibiliSponsorBlock是一个专为哔哩哔哩(Bilibili)视频平台设计的开源项目,旨在自动识别和跳过视频中的赞助内容。该项目由用户 hanydd 在 GitHub 上发起并维护,目的是提升观看体验,让用户能够更加专注于视频本身而非商业广告。 功能特点 根据 GitHub 上的项目描述,Bilibil... 阅读全文

    优惠 专为成人内容收藏者设计的多媒体媒体管理器Stash

  • 专为成人内容收藏者设计的多媒体媒体管理器Stash
    工具
  • Stash 是一个功能强大的媒体管理器,专为成人内容收藏者设计。它允许用户从多个来源下载、管理和同步成人媒体内容,包括视频、图片和漫画等。作为一个开源项目,Stash 由社区驱动,不断更新和完善以满足用户的多样化需求。 官网:https://stashapp.cc GitHub:https://github.com/s... 阅读全文

    优惠 一键获取网站图标「Favicon.im」:能够快速帮助用户获取任何网站的 Favicon

  • 一键获取网站图标「Favicon.im」:能够快速帮助用户获取任何网站的 Favicon
    工具
  • 「Favicon.im」是一个简单而实用的在线工具,它能够快速帮助用户获取任何网站的 Favicon。无论是开发人员、设计师还是需要获取网站图标的普通用户,只需输入网站的域名或网址,即可轻松获取结果。Favicon.im 提供两种尺寸的 Favicon:预设尺寸和较大尺寸,满足不同需求。 Favicon 是什么? Fa... 阅读全文

    优惠 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份

  • 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份
    AI
  • 华盛顿大学和艾伦人工智能研究所的研究人员推出文本风格转换方法StyleRemix,它能够将文本重新编写,以故意模糊作者的身份。这项技术对于保护作者隐私非常重要,尤其是在需要匿名讨论、双盲审稿或健康服务等敏感情境中。总的来说,StyleRemix是一个强大的工具,它通过精细的风格元素控制和低计算成本,为用户提供了一种有效... 阅读全文

    优惠 三维重建方法Spann3R:能够从有序或无序的图像集合中重建出密集的三维几何结构

  • 三维重建方法Spann3R:能够从有序或无序的图像集合中重建出密集的三维几何结构
    AI
  • 伦敦大学学院的研究人员推出三维重建方法Spann3R,它能够从有序或无序的图像集合中重建出密集的三维几何结构。这个方法的核心在于使用一个基于变换器(transformer)的架构,直接从图像中回归点图(pointmap),而不需要事先知道场景或相机参数。 项目主页:https://hengyiwang.github.i... 阅读全文

    优惠 SAM2POINT系统:用于三维(3D)分割的先进框架

  • SAM2POINT系统:用于三维(3D)分割的先进框架
    AI
  • 香港中文大学MiuLar实验室、香港中文大学MMLab、字节跳动和上海人工智能实验室的研究人员推出SAM2POINT系统,它是一个用于三维(3D)分割的先进框架。三维分割是指在三维空间中识别和区分不同对象或场景的过程,类似于在照片中用标记笔圈出不同的物体。SAM2POINT利用了一种称为Segment Anything... 阅读全文

    优惠 新型音频编码模型WavTokenizer:能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理

  • 新型音频编码模型WavTokenizer:能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理
    AI
  • 浙江大学、阿里巴巴集团 和Meta的研究人员推出新型音频编码模型WavTokenizer,它能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理。简单来说,WavTokenizer就像是一个音频界的“压缩器”,能够把一段音频变成一串代码,这些代码既占用空间小,又能在需要的... 阅读全文

    优惠 新型三维场景重建框架ReconX:从稀疏的视角(比如只有几张图片)重建出详细的三维场景

  • 新型三维场景重建框架ReconX:从稀疏的视角(比如只有几张图片)重建出详细的三维场景
    AI
  • 清华大学和香港科技大学的研究人员推出新型三维场景重建框架ReconX,econX的目标是从稀疏的视角(比如只有几张图片)重建出详细的三维场景。这就像用几张风景照片,来构建一个可以360度观看的三维模型。 项目主页:https://liuff19.github.io/ReconX GitHub:https://githu... 阅读全文

    优惠 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2:专门设计用于理解和处理图像与视频内容

  • 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2:专门设计用于理解和处理图像与视频内容
    AI
  • 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2,它们专门设计用于理解和处理图像与视频内容。简单来说,这些模型就像是拥有超凡视觉能力的智能助手,它们不仅能“看到”图像和视频里的内容,还能理解这些内容背后的含义,并根据这些理解来回答问题或者执行任务。 GitHub:https://github.com/THU... 阅读全文

    优惠 AI 驱动的图片生成神器「PNG Maker」,根据你的文字描述快速生成透明背景 PNG 图片

  • AI 驱动的图片生成神器「PNG Maker」,根据你的文字描述快速生成透明背景 PNG 图片
    工具
  • 你是否曾为寻找完美匹配的PNG图片而烦恼?现在,有了「PNG Maker」,这个问题迎刃而解。这是一款利用 AI 技术,根据你的文字描述快速生成透明背景 PNG 图片的工具。 快速、简单、免费 快速生成:只需几秒钟,AI 就能将你的描述转换成图片。 自定义设计:文字、颜色、形状...一切尽在你的掌控之中。 免费下载:所... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?