优惠音乐编解码器MuCodec：能够在极低的比特率下压缩和重建音乐

AI

推荐人：暴走AI 标签：MuCodec AI

7个月前 (09-23)AI

清华大学深圳国际研究生院、腾讯人工智能实验室和香港中文大学的研究人员推出一个非常高效的音乐编解码器MuCodec，能够在极低的比特率下压缩和重建音乐。编解码器是一类软件，能够将音乐文件压缩成更小的体积进行存储或传输，同时保证在解压后尽可能保持音质。项目主页：https://xuyaoxun.github.io/MuC... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 CLAIRA：利用大语言模型来评估音频字幕质量的方法

AI

推荐人：暴走AI 标签：CLAIRA AI

7个月前 (09-21)AI

加州大学伯克利分校的研究人员推出了一个名为CLAIRA的系统，它是一个利用大语言模型来评估音频字幕质量的方法。例如，你有一段下雨和车辆驶过的音频，一个良好的音频字幕可能是“车辆在雨中驶过，水花四溅”。CLAIRA会评估这个字幕与参考字幕（如“雨中车辆驶过，伴有水花声”）的语义相似度，并给出一个高分和解释，说明为什么这个... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠由AI驱动的电话应用程序AI Phone，具有实时翻译和转译功能

AI

推荐人：暴走AI 标签：AI Phone AI

7个月前 (09-21)AI

AI Phone是一款创新的电话应用，结合了实时翻译和电话功能，旨在实现全球无障碍跨语言沟通。打电话实时翻译，打破跨语言沟通障碍，再也不怕“听不懂”和“不会讲”。打电话实时转文字，即使有口音或语速快也能一字不漏，不再错过任何通话细节。无论是移民留学日常生活，还是国际贸易、全球商旅，都能确保用户的跨语言电话沟通顺畅无误。... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于人工智能的工具Otto：为用户提供高效的数据分析和决策支持

AI

推荐人：暴走AI 标签：Otto AI

7个月前 (09-21)AI

Otto是一个基于人工智能的工具，旨在为用户提供高效的数据分析和决策支持。该平台利用先进的机器学习算法，帮助企业和个人处理大量数据，识别趋势和模式，从而优化运营和策略。它可以通过 AI 代理帮助用户快速完成数据充实、公司调研以及大量文档的阅读工作，操作界面则以表格形式呈现，使得处理大量信息变得更加高效和直观。主要功能... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Kyutai推出实时语音到语音模型Moshi：通过模拟人类的对话方式，使得机器与人类的交流更加自然和流畅

AI

推荐人：暴走AI 标签：Moshi AI

7个月前 (09-21)AI

Kyutai推出实时语音到语音模型Moshi，它可以连续地倾听和说话，无需明确地建模发言人的转换或中断。例如，你有一个智能助手，它能够像真人一样与你进行流畅的对话，不仅理解你的话，还能用自然的声音回应你，那么Moshi就是实现这一目标的模型。 GitHub：https://github.com/kyutai-labs/... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 FlexiTex：用于生成高质量3D纹理的方法

AI

推荐人：暴走AI 标签：FlexiTex AI

7个月前 (09-20)AI

天津大学和腾讯混元团队推出了一个名为FlexiTex的系统，它是一个用于生成高质量3D纹理的方法。FlexiTex通过视觉引导来增强纹理生成，能够处理各种物体的纹理，生成高保真度的纹理效果。例如，你是一名游戏设计师，需要为游戏中的虚拟角色或场景生成逼真的纹理。使用FlexiTex，你可以通过提供简单的文本描述或直接上传... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 3DGS-LM：用于加速3D高斯散射的重建过程

AI

推荐人：暴走AI 标签：3DGS-LM AI

7个月前 (09-20)AI

慕尼黑工业大学和Meta的研究人员推出3DGS-LM，它用于加速3D高斯散射（3D Gaussian Splatting，简称3DGS）的重建过程。3DGS是一种用于3D场景重建和新视角合成的技术，它通过将场景表示为一组3D高斯函数来实现。这些高斯函数描述了场景中各个点的颜色和位置信息，从而能够从新的视角渲染出高质量的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MURI：为低资源语言生成高质量的指令调整（instruction tuning）数据集

AI

推荐人：暴走AI 标签：MURI AI

7个月前 (09-20)AI

慕尼黑大学 CIS 、慕尼黑机器学习中心、Cohere for AI 和剑桥大学语言技术实验室的研究人员推出一个名为MURI（Multilingual Reverse Instructions）的方法，它用于为低资源语言生成高质量的指令调整（instruction tuning）数据集。指令调整是一种优化大型语言模型（... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 HyperCloning：用于加速大语言模型预训练的新策略

AI

推荐人：暴走AI 标签：HyperCloning AI

7个月前 (09-20)AI

苹果推出了一个名为HyperCloning的方法，这是一种用于加速大语言模型预训练的新策略。它通过利用小型预训练模型的参数来初始化一个更大的模型，从而提高了训练效率和最终的准确性。因此，在训练开始之前，较大模型就已经继承了较小模型的预测能力和准确性。我们展示了训练这样一个初始化后的模型，在预训练大型语言模型所需的 GP... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MMSEARCH：旨在探索大型多模态模型（LMMs）作为多模态搜索引擎的潜力

AI

推荐人：暴走AI 标签：MMSEARCH AI

7个月前 (09-20)AI

香港中文大学MMLab、字节跳动、香港中文大学MiuLar实验室、上海人工智能实验室、北京大学、斯坦福大学和商汤研究院的研究人员推出 MMSEARCH 项目，它旨在探索大型多模态模型（LMMs）作为多模态搜索引擎的潜力。多模态搜索引擎能够处理包含图像和文本的查询，这对于传统的仅支持文本的搜索引擎来说是一个重大进步。项... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Google DeepMind发布论文：如何训练大语言模型（LLMs）进行自我纠错

AI

推荐人：暴走AI 标签：自我纠错 AI

7个月前 (09-20)AI

Google DeepMind发布论文，论文的主题是关于如何训练大语言模型（LLMs）进行自我纠错。自我纠错是指模型在生成回答后，能够检测并修正自己的错误，以提供更准确的信息。这项能力对于提高模型在复杂任务中的性能至关重要，尤其是在需要精确推理的领域，如数学问题解答。例如，你在使用一个智能助手来帮助解决数学问题。你输入... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大规模多模态预训练数据集 InfiMM-WebMath-40B：提升大语言模型在数学推理方面的能力

AI

推荐人：暴走AI 标签：InfiMM-WebMath-40B AI

7个月前 (09-20)AI

字节跳动和中国科学院的研究人员推出大规模多模态预训练数据集 InfiMM-WebMath-40B，它旨在提升大语言模型（LLMs）在数学推理方面的能力。这个数据集特别为多模态学习环境设计，包含了图像和文本的结合，以帮助模型更好地理解和处理数学概念。数据：https://huggingface.co/datasets/... 阅读全文

直达链接好 0 不好 0 已关闭评论