大语言模型
优惠 BaichuanSEED:通过精细的预训练和微调策略,实现了与行业领先模型相当的性能
标签:BaichuanSEED
AI
3个月前 (08-29)AI
大语言模型(LLM)的通用能力高度依赖于广泛预训练数据集的组成和选择,这些数据集通常被视为多个机构的商业机密。为了解决这一问题,百川开源了一种适用于所有场景的数据处理流程的细节,并通过引入一个竞争力强的LLM基线来验证其有效性和潜力。具体而言,数据处理流程包括广泛收集以扩大规模和重新加权以提高质量。我们接着使用我们的流... 阅读全文
优惠 新型多模态大语言模型LLaVaOLMoBitNet1B:首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型
3个月前 (08-28)AI
英特尔实验室推出新型多模态大语言模型LLaVaOLMoBitNet1B,它是首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型。这种模型通过使用三元权重量化技术,旨在实现在较小的计算成本上提供高效的人工智能服务。例如,你是一名社交媒体内容分析师,需要自动生成图片的描述或回答关于图片的... 阅读全文
优惠 量化新技术MobileQuant:解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题
标签:MobileQuant
AI
3个月前 (08-28)AI
三星剑桥人工智能中心推出量化新技术MobileQuant,它旨在解决在移动设备上部署大语言模型(LLMs)时面临的内存、能源和计算成本问题。大型语言模型虽然在多种应用中表现出色,但要在手机等边缘设备上使用它们却存在许多挑战。MobileQuant通过减少表示权重和激活所需的位数来降低这些成本,使得LLMs能够在移动设备... 阅读全文
优惠 多模态大语言模型基准评测MME-RealWorld:现实世界高分辨率场景下的性能评估
标签:MME-RealWorld
AI
3个月前 (08-26)AI
中科院人工智能研究所、南京大学、香港科技大学、南洋理工大学、中科院大学、松鼠AI和Meta AI的研究人员推出多模态大语言模型基准MME-RealWorld,在现实世界高分辨率场景下的性能评估。简单来说,就是研究当这些智能模型面对真实世界中的复杂图像和问题时,它们的表现如何。 项目主页:https://mme-real... 阅读全文
优惠 构建和深入理解视觉-语言模型!Hugging Face推出理解视觉-语言模型Idefics3-8B
3个月前 (08-26)AI
Hugging Face发布论文,论文的主题是关于构建和深入理解视觉-语言模型(VLMs)。VLMs是一种人工智能模型,它们能够处理和理解图像和文本,然后将这些信息综合起来输出文本。简单来说,这些模型就像一个能够“看”图片并“写”出描述的智能系统。它们还推出了Idefics3-8B,这是一个强大的VLM,它在开放数据集... 阅读全文