推荐类别

栏目分类

优惠 CLAIRA:利用大语言模型来评估音频字幕质量的方法

  • CLAIRA:利用大语言模型来评估音频字幕质量的方法
    AI
  • 加州大学伯克利分校的研究人员推出了一个名为CLAIRA的系统,它是一个利用大语言模型来评估音频字幕质量的方法。例如,你有一段下雨和车辆驶过的音频,一个良好的音频字幕可能是“车辆在雨中驶过,水花四溅”。CLAIRA会评估这个字幕与参考字幕(如“雨中车辆驶过,伴有水花声”)的语义相似度,并给出一个高分和解释,说明为什么这个... 阅读全文

    优惠 开源封面图制作工具Mini-Cover,为你提供一站式免费线上封面生成服务

  • 开源封面图制作工具Mini-Cover,为你提供一站式免费线上封面生成服务
    工具
  • 你是否在为微信公众号寻找一款简单易用的封面图制作工具?「Mini-Cover」,由JLinMr精心打造,为你提供一站式免费线上封面生成服务。 GitHub:https://github.com/JLinMr/Mini-Cover 特点概览: 无需安装:告别繁琐的软件安装,直接在浏览器中编辑。 图示库接入:内置Yesic... 阅读全文

    优惠 由AI驱动的电话应用程序AI Phone,具有实时翻译和转译功能

  • 由AI驱动的电话应用程序AI Phone,具有实时翻译和转译功能
    AI
  • AI Phone是一款创新的电话应用,结合了实时翻译和电话功能,旨在实现全球无障碍跨语言沟通。打电话实时翻译,打破跨语言沟通障碍,再也不怕“听不懂”和“不会讲”。打电话实时转文字,即使有口音或语速快也能一字不漏,不再错过任何通话细节。无论是移民留学日常生活,还是国际贸易、全球商旅,都能确保用户的跨语言电话沟通顺畅无误。... 阅读全文

    优惠 基于人工智能的工具Otto:为用户提供高效的数据分析和决策支持

  • 基于人工智能的工具Otto:为用户提供高效的数据分析和决策支持
    AI
  • Otto是一个基于人工智能的工具,旨在为用户提供高效的数据分析和决策支持。该平台利用先进的机器学习算法,帮助企业和个人处理大量数据,识别趋势和模式,从而优化运营和策略。它可以通过 AI 代理帮助用户快速完成数据充实、公司调研以及大量文档的阅读工作,操作界面则以表格形式呈现,使得处理大量信息变得更加高效和直观。 主要功能... 阅读全文

    优惠 Kyutai推出实时语音到语音模型Moshi:通过模拟人类的对话方式,使得机器与人类的交流更加自然和流畅

  • Kyutai推出实时语音到语音模型Moshi:通过模拟人类的对话方式,使得机器与人类的交流更加自然和流畅
    AI
  • Kyutai推出实时语音到语音模型Moshi,它可以连续地倾听和说话,无需明确地建模发言人的转换或中断。例如,你有一个智能助手,它能够像真人一样与你进行流畅的对话,不仅理解你的话,还能用自然的声音回应你,那么Moshi就是实现这一目标的模型。 GitHub:https://github.com/kyutai-labs/... 阅读全文

    优惠 FlexiTex:用于生成高质量3D纹理的方法

  • FlexiTex:用于生成高质量3D纹理的方法
    AI
  • 天津大学和腾讯混元团队推出了一个名为FlexiTex的系统,它是一个用于生成高质量3D纹理的方法。FlexiTex通过视觉引导来增强纹理生成,能够处理各种物体的纹理,生成高保真度的纹理效果。例如,你是一名游戏设计师,需要为游戏中的虚拟角色或场景生成逼真的纹理。使用FlexiTex,你可以通过提供简单的文本描述或直接上传... 阅读全文

    优惠 3DGS-LM:用于加速3D高斯散射的重建过程

  • 3DGS-LM:用于加速3D高斯散射的重建过程
    AI
  • 慕尼黑工业大学和Meta的研究人员推出3DGS-LM,它用于加速3D高斯散射(3D Gaussian Splatting,简称3DGS)的重建过程。3DGS是一种用于3D场景重建和新视角合成的技术,它通过将场景表示为一组3D高斯函数来实现。这些高斯函数描述了场景中各个点的颜色和位置信息,从而能够从新的视角渲染出高质量的... 阅读全文

    优惠 MURI:为低资源语言生成高质量的指令调整(instruction tuning)数据集

  • MURI:为低资源语言生成高质量的指令调整(instruction tuning)数据集
    AI
  • 慕尼黑大学 CIS 、慕尼黑机器学习中心、Cohere for AI 和剑桥大学语言技术实验室的研究人员推出一个名为MURI(Multilingual Reverse Instructions)的方法,它用于为低资源语言生成高质量的指令调整(instruction tuning)数据集。指令调整是一种优化大型语言模型(... 阅读全文

    优惠 HyperCloning:用于加速大语言模型预训练的新策略

  • HyperCloning:用于加速大语言模型预训练的新策略
    AI
  • 苹果推出了一个名为HyperCloning的方法,这是一种用于加速大语言模型预训练的新策略。它通过利用小型预训练模型的参数来初始化一个更大的模型,从而提高了训练效率和最终的准确性。因此,在训练开始之前,较大模型就已经继承了较小模型的预测能力和准确性。我们展示了训练这样一个初始化后的模型,在预训练大型语言模型所需的 GP... 阅读全文

    优惠 MMSEARCH:旨在探索大型多模态模型(LMMs)作为多模态搜索引擎的潜力

  • MMSEARCH:旨在探索大型多模态模型(LMMs)作为多模态搜索引擎的潜力
    AI
  • 香港中文大学MMLab、字节跳动、香港中文大学MiuLar实验室、上海人工智能实验室、北京大学、斯坦福大学和商汤研究院的研究人员推出 MMSEARCH 项目,它旨在探索大型多模态模型(LMMs)作为多模态搜索引擎的潜力。多模态搜索引擎能够处理包含图像和文本的查询,这对于传统的仅支持文本的搜索引擎来说是一个重大进步。 项... 阅读全文

    优惠 Google DeepMind发布论文:如何训练大语言模型(LLMs)进行自我纠错

  • Google DeepMind发布论文:如何训练大语言模型(LLMs)进行自我纠错
    AI
  • Google DeepMind发布论文,论文的主题是关于如何训练大语言模型(LLMs)进行自我纠错。自我纠错是指模型在生成回答后,能够检测并修正自己的错误,以提供更准确的信息。这项能力对于提高模型在复杂任务中的性能至关重要,尤其是在需要精确推理的领域,如数学问题解答。例如,你在使用一个智能助手来帮助解决数学问题。你输入... 阅读全文

    优惠 大规模多模态预训练数据集 InfiMM-WebMath-40B:提升大语言模型在数学推理方面的能力

  • 大规模多模态预训练数据集 InfiMM-WebMath-40B:提升大语言模型在数学推理方面的能力
    AI
  • 字节跳动和中国科学院的研究人员推出大规模多模态预训练数据集 InfiMM-WebMath-40B,它旨在提升大语言模型(LLMs)在数学推理方面的能力。这个数据集特别为多模态学习环境设计,包含了图像和文本的结合,以帮助模型更好地理解和处理数学概念。 数据:https://huggingface.co/datasets/... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?