AI

优惠 有道推出小采样数字人平台,一键定制你的专属虚拟形象!

  • 有道推出小采样数字人平台,一键定制你的专属虚拟形象!
    AI
  • 根据有道智云平台公众号,有道今日推出小采样数字人平台,该平台结合了智能化和个性化的特性,让用户可以轻松地创建自己的虚拟形象。有道数字人也支持照片说话和唱歌功能,可以让静态的照片和图像通过语音或旋律更生动地表达。... 阅读全文

    优惠 开源引擎dstack,用于在任意云平台上运行GPU工作负载

  • 开源引擎dstack,用于在任意云平台上运行GPU工作负载
    AI
  • dstack是一个开源引擎,用于在任意云平台上运行GPU工作负载。它支持多种云GPU提供商(如AWS、GCP、Azure、Lambda、TensorDock、Vast.ai等),并且也适用于内部服务器。 为什么要使用dstack? dstack专为通用AI模型的开发、训练和部署而设计。它具有以下优势: 高效利用跨地区和... 阅读全文

    优惠 谷歌发布了Gemini 1.5 Pro的技术论文

  • 谷歌发布了Gemini 1.5 Pro的技术论文
    AI
  • 谷歌发布了Gemini 1.5 Pro的技术论文,此模型特别擅长理解和处理大量的信息,比如长篇文章、视频和音频。想象一下,你有一个包含数百万字的长篇小说,或者几个小时的视频和音频文件,Gemini 1.5 Pro能够像阅读短文一样轻松地理解这些内容,并回答有关这些问题的复杂问题。 主要功能和特点: 多模态理解: Gem... 阅读全文

    优惠 知谱AI发布了旗下文生图系统CogView3的技术论文

  • 知谱AI发布了旗下文生图系统CogView3的技术论文
    AI
  • 知谱AI发布了旗下文生图系统CogView3的技术论文,这是一个基于接力扩散模型的创新框架。CogView3的核心思想是先生成低分辨率的图像,然后通过接力扩散的方式逐步提高图像的分辨率,最终生成高分辨率、细节丰富的图像。这种方法不仅提高了生成图像的质量,而且大幅降低了训练和推理的成本。 论文地址:https://arx... 阅读全文

    优惠 深度求索推出推出开源视觉语言(VL)模型DeepSeek-VL系列

  • 深度求索推出推出开源视觉语言(VL)模型DeepSeek-VL系列
    AI
  • 深度求索推出开源的视觉语言(VL)模型DeepSeek-VL系列。该模型专为现实世界的视觉和语言理解应用而设计,围绕数据构建、模型架构、训练策略三大方面展开。报告显示,DeepSeek-VL系列有1.7B和7B两个参数规模,均在同规模的视觉语言基准测试中在多个方面超越了LLaVA-Next、Qwen-VL-Chat等模... 阅读全文

    优惠 卷积重建模型CRM:将一张普通的2D图片转换成一个带有纹理的3D模型

  • 卷积重建模型CRM:将一张普通的2D图片转换成一个带有纹理的3D模型
    AI
  • 清华大学、中国人民大学等团队研究人员在预印本平台arXiv平台推出一个卷积重建模型CRM。根据论文,该模型可用于将单图像转换为3D纹理网格,可在短短10秒内就从图像中提供了高保真纹理网格,无需任何优化测试。该模型在图像峰值信噪比上,相较于常规的方法提升约23%。它能够将一张普通的2D图片转换成一个带有纹理的3D模型。这... 阅读全文

    优惠 Spotify推出推荐系统2T-HGNN:精准的为用户推荐有声读物

  • Spotify推出推荐系统2T-HGNN:精准的为用户推荐有声读物
    AI
  • 这篇论文的主题是“通过图神经网络在Spotify上实现个性化有声读物推荐”。简单来说,Spotify想要在其平台上引入有声读物,并希望为用户提供个性化的推荐服务。由于有声读物与Spotify现有的音乐和播客内容不同,用户对这种新内容类型的互动较少,因此推荐系统面临了数据稀疏和冷启动的挑战。为了解决这些问题,Spotif... 阅读全文

    优惠 百度推出AI 编程助手 Comate:开放邀测,注册即送30天VIP

  • 百度推出AI 编程助手 Comate:开放邀测,注册即送30天VIP
    AI
  • 百度推出了新一代智能代码编程助手——Codemate,该工具深度融合了百度多年积累的编程大数据以及丰富的外部开源数据资源,致力于为开发者提供贴近实际研发场景的高质量代码生成服务。相较于国外竞品,Codemate 的代码提示与自动生成功能更注重本土化和实用性,以“贴地气”的方式更好地服务于中国开发者。 类似于 Codei... 阅读全文

    优惠 由 AI 大型语言模型(LLM)驱动的命令行生产力工具ShellGPT

  • 由 AI 大型语言模型(LLM)驱动的命令行生产力工具ShellGPT
    AI
  • ShellGPT是一个由 AI 大型语言模型(LLM)驱动的命令行生产力工具。该命令行工具提供了对 shell 命令、代码片段、文档 的简化生成,消除了对外部资源(如 Google 搜索)的需求。支持 Linux、macOS、Windows,并与 PowerShell、CMD、Bash、Zsh 等主要 Shell 兼容... 阅读全文

    优惠 文生视频平台Pika升级新功能:视频可集成AI生成音效

  • 文生视频平台Pika升级新功能:视频可集成AI生成音效
    AI
  • 今日凌晨,备受瞩目的文生视频平台Pika通过X平台宣布了一项令人振奋的新功能:视频现在可以集成AI生成的音效了。这一创新功能将为用户带来更加沉浸式的视频体验,让声音与画面完美融合。据悉,用户现在可以在Pika生成的视频中无缝生成、整合声音。用户只需通过简单的提示词来描述他们想要的声音,或者直接让Pika根据视频内容自动... 阅读全文

    优惠 AI 绘图工具「 Recraft.ai 」,快速生成图标与矢量插图

  • AI 绘图工具「 Recraft.ai 」,快速生成图标与矢量插图
    AI
  • 在数字化时代,图像生成工具层出不穷,但Recraft凭借其独特的功能和简洁的操作界面,成为了一款备受瞩目的AI图像生成工具。它不仅能够根据需求关键字自动生成多款图像,还支持多种画风切换,让创作变得更加丰富多彩。Recraft的操作相当直觉,用户只需输入需求关键字,系统便能自动生成数款图像供选择。不仅如此,它还支持插画、... 阅读全文

    优惠 新型的双向长距离DNA序列模型家族Caduceus

  • 新型的双向长距离DNA序列模型家族Caduceus
    AI
  • 这篇论文介绍了Caduceus,这是一个新型的双向长距离DNA序列模型家族,它能够处理DNA序列中的长距离相互作用,并且考虑了DNA的反向互补性(RC)。Caduceus模型在基因组学中的应用,特别是在预测基因变异对基因表达影响的任务上,表现出了优越的性能。例如,如果我们想要研究一个特定的遗传变异是否会导致某种疾病,C... 阅读全文