优惠 统一框架AUTODETECT:专门设计来自动检测大语言模型中的弱点
标签:AUTODETECT
AI
9个月前 (06-25)AI
清华大学和智谱推出统一框架AUTODETECT,它专门设计来自动检测大语言模型(LLMs)中的弱点。例如,你有一个非常聪明的AI助手,它可以做很多复杂的事情,比如解决数学问题或者编写代码,但可能在某些看似简单的任务上犯错。AUTODETECT就像一个AI助手的教练,能够找出AI在哪些方面表现不佳,并提供改进的建议。 G... 阅读全文
优惠 ClotheDreamer:根据文本提示生成高保真的3D服装资产
9个月前 (06-25)AI
上海大学、上海交通大学、复旦大学和腾讯优图实验室的研究人员推出创新系统ClotheDreamer,它能够根据文本提示生成高保真的3D服装资产。你只需要用文字描述你想要的衣服样式,比如“一件银色的蓬松夹克和相配的裤子”,ClotheDreamer就能在虚拟空间中创造出这件衣服,甚至还能模拟衣服的穿着效果和动画。如果你是一... 阅读全文
优惠 字节跳动推出新型大语言模型video-SALMONN:专门设计用于增强视频理解能力,尤其是通过语音增强的音频-视觉模型
9个月前 (06-25)AI
字节跳动推出新型大语言模型video-SALMONN,它专门设计用于增强视频理解能力,尤其是通过语音增强的音频-视觉(av-LLM)模型。简单来说,video-SALMONN就像一个超级智能的“视频助手”,它不仅能“看”懂视频里的画面,还能“听”懂视频中的对话、音乐和其他声音,甚至能理解人们的讲话内容。 GitHub:... 阅读全文
优惠 拥有8亿参数的医疗语言模型Llama-3-Physician-8B-Instruct
9个月前 (06-25)AI
北京大学、香港科技大学和麻省理工学院-IBM Watson AI 实验室的研究人员推出Llama-3-Physician-8B-Instruct,这是一个拥有8亿参数的医疗语言模型。该模型是基于Llama 3构建的,并首先在RefinedWeb数据集中的高质量医学子语料库上进行持续预训练,然后用各种医学和普通指令进行调... 阅读全文
优惠 Google DeepMind推出新型策略WARP:用于通过人类反馈进行强化学习(RLHF)以对大语言模型进行对齐
9个月前 (06-25)AI
Google DeepMind推出新型策略WARP(Weight Averaged Rewarded Policies),用于通过人类反馈进行强化学习(RLHF)以对大型语言模型(LLMs)进行对齐。这种策略的目的是在使用人类偏好训练的奖励模型来优化语言模型时,平衡模型性能和保持预训练知识。论文通过一系列实验验证了WA... 阅读全文
优惠 以视觉为中心的方法设计!多模态大语言模型系列Cambrian-1
标签:Cambrian-1
AI
9个月前 (06-25)AI
纽约大学的研究人员推出多模态大语言模型系列Cambrian-1,这些模型采用以视觉为中心的方法设计。多模态大型语言模型结合了视觉和语言能力,旨在更好地理解和生成与图像和文本相关的信息。Cambrian-1的研究不仅达到了最先进的性能水平,而且还提供了一个全面的、开放的指令调整MLLM的“食谱”。研究团队提供了模型权重、... 阅读全文
优惠 D-MERIT数据集:信息检索(IR)模型的评估方法
标签:D-MERIT数据集
AI
9个月前 (06-25)AI
亚马逊研究院、巴伊兰大学和艾伦人工智能研究所推出D-MERIT数据集,关于信息检索(Information Retrieval,简称IR)模型的评估方法。信息检索模型的任务是在一个大型的文档集合中,根据用户提出的查询(query),找出与之相关的文档段落(passages)。这就像我们在互联网上搜索信息时,搜索引擎会返... 阅读全文
优惠 评估基准BigCodeBench:用来测试大型编程语言模型在代码生成方面的能力
标签:BigCodeBench
AI
9个月前 (06-25)AI
评估基准BigCodeBench,它专门用来测试大型编程语言模型(LLMs)在代码生成方面的能力。这个基准通过设计具有多种功能调用和复杂指令的编程任务,来挑战和评估这些模型是否能够像人类开发者一样解决实际的编程问题。通过这种评估,研究人员和开发人员可以更好地理解LLMs在编程任务中的表现,以及它们在实际应用中的潜力和局... 阅读全文