优惠元象首个MoE大模型XVERSE-MoE-A4.2B开源：4.2B激活参数，效果堪比13B模型

AI

推荐人：暴走AI 标签：XVERSE-MoE-A4.2B AI

10个月前 (04-03)AI

元象发布XVERSE-MoE-A4.2B大模型，采用业界最前沿的混合专家模型架构，激活参数4.2B，效果即可达到13B模型水准。据介绍，XVERSE-MoE-A4.2B实现了极致压缩，相比XVERSE-13B-2仅用30%计算量，并减少50%训练时间。在多个权威评测中，元象MoE效果大幅超越Gemma-7B、Mist... 阅读全文

直达链接好 0 不好 0 0

优惠 langchain-extract：使用大语言模型（LLMs）从文本和文件中提取信息

AI

推荐人：暴走AI 标签：langchain-extract AI

10个月前 (04-03)AI

langchain-extract 是一个简单的网络服务器，它允许您使用大型语言模型（LLMs）从文本和文件中提取信息。该服务器基于 FastAPI、LangChain 和 Postgresql 构建。后端设计紧密遵循提取用例的文档，并提供了一个参考应用实现，帮助用户利用 LLMs 进行数据提取操作。这个仓库旨在作为构... 阅读全文

直达链接好 0 不好 0 0

优惠开源的OpenAI API 非官方 Go 客户端Go OpenAI

AI

推荐人：暴走AI 标签：Go OpenAI AI

10个月前 (04-03)AI

Go OpenAI是一个开源的OpenAI API 非官方 Go 客户端，目前支持： ChatGPT GPT-3, GPT-4 DALL·E 2 Whisper... 阅读全文

直达链接好 0 不好 0 0

优惠 vLLM：快速且易于使用的库，专为大语言模型推理和提供服务

AI

推荐人：暴走AI 标签：vLLM AI

10个月前 (04-03)AI

vLLM是一个快速且易于使用的库，专为大语言模型推理和提供服务，支持目前主流的开源大模型。 vLLM之所以快，是因为它具备以下特点：领先的服务吞吐量通过PagedAttention高效管理注意力键和值内存持续批量处理传入的请求使用CUDA/HIP图进行快速模型执行量化：GPTQ、AWQ、SqueezeLLM、... 阅读全文

直达链接好 0 不好 0 0

优惠谷歌推出新模型，用于解决视频中的密集字幕生成问题

AI

推荐人：暴走AI 标签：谷歌 AI

10个月前 (04-03)AI

谷歌发布论文介绍了一种新的模型，用于解决视频中的密集字幕生成问题，即在视频中预测字幕并将其定位在特定的时间段内。理想的字幕生成模型应该能够处理长时间的视频输入，生成丰富、详细的文本描述，并且在处理完整个视频之前就能够产生输出。然而，目前最先进的模型在处理视频时通常只查看少量的帧，并且在看完整个视频后才做出单一的完整预测... 阅读全文

直达链接好 0 不好 0 0

优惠腾讯推出新型视频理解模型ST-LLM

AI

推荐人：暴走AI 标签：ST-LLM 腾讯 AI

10个月前 (04-03)AI

腾讯推出新型视频理解模型ST-LLM。ST-LLM的核心思想是将视频内容转化为一系列的空间-时间（spatial-temporal）标记，并将这些标记直接输入到大型语言模型（LLM）中，让模型自己学习如何理解和建模视频序列。这种方法简化了视频处理的流程，因为传统的视频理解模型通常需要复杂的结构和大量的计算资源。总的来说... 阅读全文

直达链接好 0 不好 0 0

优惠新型开源多语言大语言模型AURORA-M

AI

推荐人：暴走AI 标签：Aurora-M AI

10个月前 (04-03)AI

这篇论文介绍了一个名为AURORA-M的新型开源多语言大型语言模型（LLM），它是为了解决现有开源预训练模型在多语言能力、持续预训练导致的灾难性遗忘问题，以及遵守人工智能安全和发展法规方面的挑战而设计的。总的来说，AURORA-M是一个强大的多语言模型，它通过持续预训练和安全性调整，提高了模型的性能和安全性，使其能够在... 阅读全文

直达链接好 0 不好 0 0

优惠谷歌发布论文探讨如何高效地训练能够理解和处理视觉丰富文档

AI

推荐人：暴走AI 标签：VRD AI

10个月前 (04-03)AI

这篇论文的主题是关于如何高效地训练能够理解和处理视觉丰富文档（Visually Rich Documents，简称VRD）的语言模型。VRD是指那些结合了视觉元素（如字体大小、颜色、布局等）和语言信息来传递内容的文档，比如发票、税表、水电费账单、信息图表和保险报价单等。这些文档在商业流程中非常常见，但是它们通常以PDF... 阅读全文

直达链接好 0 不好 0 0

优惠新型语音大语言模型WavLLM：提高语言模型在处理和理解语音方面的性能

AI

推荐人：暴走AI 标签：WavLLM AI

10个月前 (04-03)AI

微软发布新型语音大型语言模型WavLLM，它旨在提高语言模型在处理和理解语音方面的性能。WavLLM通过结合两个编码器（Whisper和WavLM）来分别处理语音的语义内容和说话者的身份特征。该模型采用分阶段的课程学习方法，先从简单的单一任务开始训练，逐步过渡到更复杂的多任务。例如，如果一个学生正在准备高考英语听力部... 阅读全文

直达链接好 0 不好 0 0

优惠基准测试集LongICLBench：大语言模型在处理长篇幅上下文学习任务时的表现

AI

推荐人：暴走AI 标签：LongICLBench AI

10个月前 (04-03)AI

来自滑铁卢大学、卡内基·梅隆大学和Vector Institute探讨了大语言模型（LLMs）在处理长篇幅上下文学习任务时的表现。研究者们发现，尽管LLMs在处理短上下文任务时表现出色，但当上下文长度增加时，它们的性能会显著下降。为了更全面地评估LLMs在长上下文学习中的能力，研究者们创建了一个专门的基准测试集Long... 阅读全文

直达链接好 0 不好 0 0

优惠英特尔推出多模态基础模型（MMFM）套件LLaVA-Gemma

AI

推荐人：暴走AI 标签：LLaVA-Gemma 英特尔 AI

10个月前 (04-03)AI

英特尔推出多模态基础模型（MMFM）套件LLaVA-Gemma，它利用了最近发布的Gemma系列大语言模型（LLMs）。特别是2B参数的Gemma模型，为构建能力强大的小型多模态基础模型提供了机会。LLaVA-Gemma模型在多种评估中表现中等，但未能超越当前类似规模的最先进模型。研究者们对三个设计特征进行了测试：预训... 阅读全文

直达链接好 0 不好 0 0

优惠新型大语言模型套件EURUS：针对推理任务进行了优化

AI

推荐人：暴走AI 标签：EURUS AI

10个月前 (04-03)AI

来自清华大学、伊利诺伊大学香槟分校、美国东北大学、ModelBest、中国人民大学、北京邮电大学和腾讯的研究人员推出新型大语言模型（LLM）套件EURUS，它专门针对推理任务进行了优化。这些模型在数学、代码生成和逻辑推理等多个复杂推理基准测试中取得了优异的表现，尤其是在LeetCode和TheoremQA这两个具有挑战... 阅读全文

直达链接好 0 不好 0 0