优惠 XCoder：提高代码生成模型的性能，特别是通过优化代码指令调优数据的质量

AI

推荐人：暴走AI 标签：XCoder AI

2年前 (2024-09-09)AI

北京邮电大学和美团的研究人员发布论文，论文的主题是关于如何提高代码生成模型的性能，特别是通过优化代码指令调优数据的质量。代码生成模型，也就是那些能够根据人类指令生成代码的人工智能模型，近年来在软件开发 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠最强开源大语言模型？AI初创公司OthersideAI 推出Reflection 70B模型，能够识别推理过程中的错误并进行修正

AI

推荐人：暴走AI 标签：Reflection 70B AI

2年前 (2024-09-06)AI

AI初创公司OthersideAI 开源了Reflection 70B模型，号称是世界上最顶级的开源大语言模型，它采用了一种名为反射调优（Reflection-Tuning）的创新技术，使模型能够识别推理过程中的错误并进行修正。Reflection 70B 基 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型文本到三维（Text-to-3D）模型GIMDiffusion：能够根据文本描述生成高质量的三维对象，而且生成速度快，数据需求量小，并且能够有效处理复杂的三维表示

AI

推荐人：暴走AI 标签：GIMDiffusion AI

2年前 (2024-09-06)AI

Unity推出新型文本到三维（Text-to-3D）模型GIMDiffusion，这个模型能够根据文本描述生成高质量的三维对象，而且生成速度快，数据需求量小，并且能够有效处理复杂的三维表示。例如，你是一名游戏设计师，需要为即将 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多模态大语言模型mPLUG-DocOwl2：专门设计用于高效地理解高分辨率的多页文档，而无需依赖光学字符识别（OCR）技术

AI

推荐人：暴走AI 标签：mPLUG-DocOwl2 AI

2年前 (2024-09-06)AI

阿里巴巴和人民大学的研究人员推出新型多模态大语言模型mPLUG-DocOwl2，它专门设计用于高效地理解高分辨率的多页文档，而无需依赖光学字符识别（OCR）技术。这个模型通过压缩文档图像来减少处理所需的视觉标记数量， ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型公式识别评估指标CDM：为了更公平、准确地评估数学公式识别模型的性能

AI

推荐人：暴走AI 标签：CDM AI

2年前 (2024-09-06)AI

上海市人工智能实验室和上海交通大学的研究人员推出新型公式识别评估指标CDM，这个指标的目的是为了更公平、准确地评估数学公式识别模型的性能。例如，你有一个数学公式 (x+y)+z=x+(y+z)(x+y)+z=x+(y+z)，并且你使用 ...... 阅读全文

直达链接好 2 不好 0 已关闭评论

优惠开放混合专家语言模型OLMoE

AI

推荐人：暴走AI 标签：OLMoE AI

2年前 (2024-09-05)AI

艾伦人工智能研究所、华盛顿大学和普林斯顿大学的研究人员推出开源、先进的语言模型OLMoE，OLMoE-1B-7B是这个系列中的一个模型，它有70亿个参数，但每个输入令牌仅使用10亿个参数。研究者们在5万亿个令牌上预训练了 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型光学字符识别（OCR）模型GOT

AI

推荐人：暴走AI 标签：GOT AI

2年前 (2024-09-05)AI

阶跃星辰、旷视科技、中国科学院大学和清华大学的研究人员推出新型光学字符识别（OCR）模型GOT，它是迈向OCR-2.0时代的一个尝试。OCR技术简单来说，就是让计算机能够识别图片中的文字，并将其转换成可编辑的文本格式 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠日本NTT推出声音转换技术FastVoiceGrad

AI

推荐人：暴走AI 标签：FastVoiceGrad AI

2年前 (2024-09-05)AI

日本NTT推出一种声音转换技术FastVoiceGrad，声音转换技术能够将一个人的声音转换成另一个人的声音，同时不改变语言内容。这项技术在多个领域都有潜在的应用价值，比如在语音合成、语音识别和娱乐产业中。例如，你正 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 LongCite：旨在提升大语言模型在长文本环境下生成引用的能力

AI

推荐人：暴走AI 标签：LongCite AI

2年前 (2024-09-05)AI

清华大学和智谱AI的研究人员推出一个名为LongCite的系统，它旨在提升大语言模型（LLMs）在长文本环境下生成引用的能力。LongCite通过让模型能够生成带有精细句子级引用的回答，增强了模型输出的可信度和可验证性。例 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多模态大语言模型LongLLaVA：专门设计用于高效处理大量图像

AI

推荐人：暴走AI 标签：LongLLaVA AI

2年前 (2024-09-05)AI

香港中文大学（深圳）和深圳大数据研究院的研究人员推出新型多模态大语言模型LongLLaVA，它专门设计用于高效处理大量图像。这个模型的特点是能够在保持较低内存消耗的同时，处理高达1000张的图像，这在单个高性能GPU ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视频压缩方法OD-VAE：提高潜在视频扩散模型（LVDMs）的效率而设计

AI

推荐人：暴走AI 标签：OD-VAE 视频压缩 AI

2年前 (2024-09-04)AI

北京大学、程鹏实验室、兔展智能的研究人员推出视频压缩方法OD-VAE，它是为了提高潜在视频扩散模型（LVDMs）的效率而设计的。OD-VAE的核心目标是在保持视频重建质量的同时，尽可能地压缩视频数据，以便在生成视频时 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于扩散模型和Transformer架构的新型音乐生成模型FluxMusic

AI

推荐人：暴走AI 标签：FluxMusic 音乐生成模型 AI

2年前 (2024-09-04)AI

昆仑万维推出新型音乐生成模型FluxMusic，它基于扩散模型和Transformer架构，能够根据文本描述生成音乐。这个模型特别之处在于它使用了一种称为“修正流（Rectified Flow）”的技术，以及在潜在的变分自编码器（VAE） ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

AI

优惠 XCoder：提高代码生成模型的性能，特别是通过优化代码指令调优数据的质量

优惠最强开源大语言模型？AI初创公司OthersideAI 推出Reflection 70B模型，能够识别推理过程中的错误并进行修正

优惠新型文本到三维（Text-to-3D）模型GIMDiffusion：能够根据文本描述生成高质量的三维对象，而且生成速度快，数据需求量小，并且能够有效处理复杂的三维表示

优惠新型多模态大语言模型mPLUG-DocOwl2：专门设计用于高效地理解高分辨率的多页文档，而无需依赖光学字符识别（OCR）技术

优惠新型公式识别评估指标CDM：为了更公平、准确地评估数学公式识别模型的性能

优惠开放混合专家语言模型OLMoE

优惠新型光学字符识别（OCR）模型GOT

优惠日本NTT推出声音转换技术FastVoiceGrad

优惠 LongCite：旨在提升大语言模型在长文本环境下生成引用的能力

优惠新型多模态大语言模型LongLLaVA：专门设计用于高效处理大量图像

优惠视频压缩方法OD-VAE：提高潜在视频扩散模型（LVDMs）的效率而设计

优惠基于扩散模型和Transformer架构的新型音乐生成模型FluxMusic