大语言模型
优惠 英伟达推出数据据Audio Dialogues:提升音频和音乐理解方面的对话能力
10个月前 (04-12)AI
英伟达推出数据据Audio Dialogues,旨在提升音频和音乐理解方面的对话能力。现有的音频理解数据集主要集中在单轮交互上,例如音频描述或音频问答,这些数据集限制了通过交互式对话理解音频的能力。Audio Dialogues是一个多轮对话数据集,包含了16.38万个样本,涵盖一般声音和音乐。除了对话样本,该数据集还... 阅读全文
优惠 谷歌推出新型开放语言模型RecurrentGemma
10个月前 (04-12)AI
谷歌推出新型开放语言模型RecurrentGemma,它使用了谷歌的Griffin架构。Griffin架构通过结合线性递归和局部注意力机制,在处理语言任务时表现出色。RecurrentGemma模型的一个显著特点是它具有固定大小的状态,这减少了内存使用,使得在长序列上进行高效推理成为可能。研究者们提供了一个预训练模型,... 阅读全文
优惠 新型车道检测方法Sparse Laneformer
10个月前 (04-12)AI
这篇论文介绍了一种名为Sparse Laneformer的新型车道检测方法,这是一种在自动驾驶领域中非常关键的技术。车道检测的主要任务是从给定的图像中预测车道的位置,这对于高级驾驶辅助系统(ADAS)或自动驾驶系统来说非常重要。 主要功能和特点: 使用稀疏锚点:与传统的基于密集锚点的车道检测方法不同,Sparse La... 阅读全文