大语言模型
优惠 Nexa AI推出新型语言模型框架Octopus v4:它使用了一种图结构来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化
标签:Octopus v4
AI
7个月前 (05-01)AI
Nexa AI推出新型语言模型框架Octopus v4,这个框架特别之处在于它使用了一种图结构(graph structure)来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化。Octopus v4模型使用功能令牌(functional tokens)来智能地将用户查询导向最合适的垂直模型(vertical... 阅读全文
优惠 大模型微调技术QLoRA:可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型
7个月前 (05-01)AI
北京人工智能研究院和中国人民大学高瓴人工智能学院推出微调技术QLoRA,可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型,上下文长度是指模型在生成回答时能够考虑的输入信息的最大长度。开发者成功地将Llama-3模型的上下文长度从8,000个令牌(tokens)扩展到80,000个... 阅读全文
优惠 基于Gemini模型!谷歌推出AI医疗模型Med-Gemini,专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型
标签:Med-Gemini谷歌
AI
7个月前 (05-01)AI
谷歌推出AI医疗模型Med-Gemini,它们是专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型。Med-Gemini模型基于Gemini模型,通过特殊的训练和定制,能够在医学领域表现出强大的能力,包括理解复杂的医疗文本、处理多模态医疗数据,以及处理长文本的上下文信息。 例如,医生需要分析... 阅读全文