大语言模型
优惠 Agent-FLAN:改进大语言模型(LLMs)作为智能代理(agents)的能力
标签:Agent-FLAN
AI
6个月前 (03-20)AI
中国科学技术大学和 上海人工智能实验室的研究团队推出Agent-FLAN,它旨在改进大语言模型(LLMs)作为智能代理(agents)的能力。智能代理是指能够理解环境、做出决策并采取行动的系统。尽管现有的LLMs在各种自然语言处理(NLP)任务中表现出色,但它们在作为代理时的性能仍然不如基于API的模型。Agent-F... 阅读全文
优惠 阿里推出DocOwl 1.5模型:用于理解文档图像的多模态大语言模型
6个月前 (03-20)AI
来自阿里巴巴和中国人民大学的研究团队推出DocOwl 1.5模型,它是一种用于理解文档图像的多模态大语言模型(MLLM)。DocOwl 1.5特别强调了结构信息在理解文本丰富图像(如文档、表格、图表等)中的重要性,并提出了一种统一结构学习方法来提升MLLM的性能。 GitHub地址:https://github.com... 阅读全文
优惠 用于压缩大语言模型提示词的新方法LLMLingua-2
标签:LLMLingua-2
AI
6个月前 (03-20)AI
来自清华和微软的研究团队推出LLMLingua-2,它是一种用于压缩大语言模型(LLMs)提示词(prompts)的新方法,目的是在不丢失关键信息的同时提高效率和泛化能力。在大语言模型的使用中,提示词通常是一段文本,用来引导模型生成特定的输出或完成特定的任务。然而,这些提示可能会非常长,导致计算成本增加和信息感知能力下... 阅读全文