大语言模型
优惠 SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题
4个月前 (05-20)AI
SambaNova推出新型AI加速器SambaNova SN40L,它通过采用数据流架构和专家组合(Composition of Experts,简称CoE)的方法,有效扩展了AI的内存容量。这种加速器旨在解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题。 通俗介绍: 想象一下,你有一... 阅读全文
优惠 微软推出大型信息丰富的网络数据集MS MARCO Web Search
4个月前 (05-20)AI
微软推出大型信息丰富的网络数据集MS MARCO Web Search,它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试,旨在模拟现实世界中的网页文档和查询分布,为各种类型的下游任务提供丰富的信息,并鼓励在多个研究领域进行创新,例如通用的端到端神经索引器模型、通用嵌入模型,以及使用大型语言模型的下一代信息访... 阅读全文
优惠 亚马逊AWS推出新型大型多模态语言模型SpeechVerse:能够理解和执行自然语言指令,处理各种语音相关的任务
4个月前 (05-20)AI
亚马逊AWS推出新型大型多模态语言模型SpeechVerse,它能够理解和执行自然语言指令,处理各种语音相关的任务。SpeechVerse通过结合预训练的语音和文本基础模型,并在学习过程中保持这些模型的参数固定,实现了这一功能。它使用从语音基础模型中提取的连续潜在表示来进行指令微调,以在多种语音处理任务上实现最佳的零样... 阅读全文
优惠 SpeechGuard:集成语音和大语言模型(SLMs)的安全性和鲁棒性
标签:SpeechGuard
AI
4个月前 (05-20)AI
亚马逊AWS发布论文探讨集成语音和大语言模型(SLMs)的安全性和鲁棒性。SLMs是一类能够遵循语音指令并生成相关文本回答的AI系统,它们在最近变得越来越流行。然而,这些模型的安全防护和抵御恶意攻击的能力还不是很清楚。 主要功能: SLMs能够处理语音输入,并据此生成文本回答。 它们被设计来遵循用户的语音指令。 主要特... 阅读全文
优惠 Beyond Scaling Laws:探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态
4个月前 (05-20)AI
华为发布论文探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态。论文提出了一个理论框架,用于解释基于Transformer的语言模型的记忆力过程和性能表现。研究的核心问题是,为什么增加Transformer模型的大小并不总是导致性能提升,以及这些模型是如何通过记忆训练样本来提高泛... 阅读全文
优惠 华为诺亚方舟实验室推出轻量级视频理解网络SqueezeTime:专为移动设备上的视频理解任务设计
标签:SqueezeTime
AI
4个月前 (05-20)AI
华为诺亚方舟实验室推出一种新型的轻量级视频理解网络SqueezeTime,专为移动设备上的视频理解任务设计。在移动设备上进行视频分析面临着计算能力和内存的严格限制,而传统的视频理解方法,如3D卷积网络,通常需要大量的计算和内存资源,不适合在移动设备上运行。总的来说,SqueezeTime为移动设备上的视频理解提供了一种... 阅读全文
优惠 小多科技推出新型多模态视觉语言模型Xmodel-VLM
标签:Xmodel-VLM小多科技
AI
4个月前 (05-20)AI
小多科技推出新型多模态视觉语言模型Xmodel-VLM,这个模型的主要目标是为了在消费级GPU服务器上高效部署,解决大规模多模态系统由于高昂的服务成本而难以广泛采用的关键行业问题。例如,我们有一个智能助手,它可以看图片,理解文字,然后用自然语言和我们交流。这个助手就像是电影里的“贾维斯”(J.A.R.V.I.S.),但... 阅读全文