大语言模型
优惠 模型手术(Model Surgery):通过直接编辑大语言模型的一小部分参数来调节其行为的方法
4个月前 (07-17)AI
清华大学自动化系和卡内基梅隆大学的研究人员推出“模型手术”(Model Surgery),这是一种通过直接编辑大语言模型(LLM)的一小部分参数来调节其行为的方法。这种方法特别适用于希望模型展现出某些理想行为特征,比如无毒性(non-toxicity)和抵抗越狱(jailbreak)尝试的能力。 GitHub:http... 阅读全文
优惠 H2O.ai公司推出小型语言模型H2O-Danube3,可以在手机上运行
标签:H2O-Danube3
AI
4个月前 (07-17)AI
H2O-Danube3是由H2O.ai公司推出的一系列小型语言模型。这些模型包括H2O-Danube3-4B和H2O-Danube3-500M,分别在6万亿(T)和4万亿个词元上进行了训练。这些模型的设计理念是能够在现代智能手机等移动设备上高效运行,实现本地推理和快速处理能力。例如,你有一个智能手机应用,需要一个能够理... 阅读全文
优惠 开源工具包VLMEvalKit:用于评估大型多模态模型
标签:VLMEvalKit
AI
4个月前 (07-17)AI
开源工具包VLMEvalKit,它用于评估大型多模态模型。这些模型能够处理并理解多种类型的数据,比如图像、文本、音频等。VLMEvalKit基于PyTorch框架,旨在为研究人员和开发者提供一个友好、全面的框架,以便他们评估现有的多模态模型,并发布可复现的评估结果。例如,你是一名计算机视觉研究人员,你开发了一个能够识别... 阅读全文
优惠 谷歌推出大规模、开放式的多语种手语平行语料库YouTube-SL-25
4个月前 (07-17)AI
谷歌推出YouTube-SL-25,这是一个大规模、开放式的多语种手语平行语料库。简单来说,它包含了超过25种不同手语的视频,这些视频从YouTube上收集而来,并且配有相应的字幕。这个项目的目标是改善手语与文本之间的翻译,让机器更好地理解和生成手语。例如,一个听障人士想在视频会议上与他人交流,但不熟悉对方的手语,Yo... 阅读全文