AI
优惠 NeedleBench框架:用来测试大语言模型处理长文本的能力
标签:NeedleBench
AI
5个月前 (07-17)AI
上海人工智能实验室和清华大学的研究人员推测NeedleBench框架,它专门用来测试大语言模型处理长文本的能力。这个框架通过设计一系列越来越具挑战性的任务,评估模型在处理多语言长文本时的检索和推理能力。这些任务涵盖了不同的文本长度和深度范围,允许在不同文本深度区域中策略性地插入关键数据点,以严格测试模型在多样化的上下文... 阅读全文
优惠 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发
5个月前 (07-17)AI
阿里巴巴推出新型工具套件“Data-Juicer Sandbox”,它旨在促进多模态数据和生成模型的协同开发。多模态数据指的是包含文本、图像、视频和音频等多种类型的数据。生成模型则是指能够基于输入数据生成新内容的人工智能模型,例如根据文本描述生成图像或视频。 例如,你是一位厨师,需要准备一道复杂的菜肴,你需要各种食材(... 阅读全文
优惠 阿里巴巴集团Qwen团队推出大型音频-语言模型Qwen2-Audio
5个月前 (07-17)AI
阿里巴巴集团Qwen团队最新研发的大型音频-语言模型Qwen2-Audio。这个模型能够处理各种音频信号输入,并根据语音指令进行音频分析或直接文本回应。简单来说,Qwen2-Audio就像一个超级听力助手,不仅能听懂你说的话,还能根据你的声音指令做出反应。例如,你有一个智能助手,它不仅能听懂你说的话,还能分析你播放的音... 阅读全文
优惠 WildGaussians:用于在各种环境条件下进行高质量的3D场景重建
标签:WildGaussians
AI
5个月前 (07-13)AI
苏黎世联邦理工学院、布拉格 CTU的研究人员推出WildGaussians,它用于在各种环境条件下进行高质量的3D场景重建。这项技术特别擅长处理那些在野外捕获的数据,比如存在遮挡、动态物体和不同光照条件的场景。例如,你手上有一堆在不同时间、不同光照条件下拍摄的某个地标的照片,比如布拉格的查理大桥或者罗马的特雷维喷泉。现... 阅读全文
优惠 新型多模态大语言模型DenseFusion-1M:通过融合多种视觉专家的知识来增强对复杂视觉元素的理解能力
5个月前 (07-13)AI
北京大学、北京人工智能研究院和大连理工大学的研究人员推出一种新型多模态大型语言模型DenseFusion-1M,它通过融合多种视觉专家的知识来增强对复杂视觉元素的理解能力。这些模型能够理解图像中的多个对象、文本信息和空间关系,但它们的性能很大程度上受限于可用的高质量图像-文本数据集的质量。 GitHub:https:/... 阅读全文