AI
优惠 Nexa AI推出新型语言模型框架Octopus v4:它使用了一种图结构来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化
标签:Octopus v4
AI
7个月前 (05-01)AI
Nexa AI推出新型语言模型框架Octopus v4,这个框架特别之处在于它使用了一种图结构(graph structure)来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化。Octopus v4模型使用功能令牌(functional tokens)来智能地将用户查询导向最合适的垂直模型(vertical... 阅读全文
优惠 大模型微调技术QLoRA:可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型
7个月前 (05-01)AI
北京人工智能研究院和中国人民大学高瓴人工智能学院推出微调技术QLoRA,可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型,上下文长度是指模型在生成回答时能够考虑的输入信息的最大长度。开发者成功地将Llama-3模型的上下文长度从8,000个令牌(tokens)扩展到80,000个... 阅读全文
优惠 基于Gemini模型!谷歌推出AI医疗模型Med-Gemini,专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型
标签:Med-Gemini谷歌
AI
7个月前 (05-01)AI
谷歌推出AI医疗模型Med-Gemini,它们是专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型。Med-Gemini模型基于Gemini模型,通过特殊的训练和定制,能够在医学领域表现出强大的能力,包括理解复杂的医疗文本、处理多模态医疗数据,以及处理长文本的上下文信息。 例如,医生需要分析... 阅读全文
优惠 迭代推理偏好优化Iterative RPO:提高大语言模型(LLMs)在推理任务中的表现
标签:Iterative RPO
AI
7个月前 (05-01)AI
Meta和纽约大学的研究人员发布论文,这篇论文的主题是关于如何提高大语言模型(LLMs)在推理任务中的表现。研究者们开发了一种迭代推理偏好优化(Iterative Reasoning Preference Optimization,简称Iterative RPO)的方法,这种方法特别关注基于“思维链”(Chain-of... 阅读全文
优惠 更加高效和快速!多令牌预测(Multi-token Prediction):用于训练像GPT和Llama这样的大型语言模型
7个月前 (05-01)AI
这篇论文的主题是关于如何改进大语言模型(LLMs)的训练方法,使其更加高效和快速。研究者们提出了一种新的方法,叫做“多令牌预测”(Multi-token Prediction),用于训练像GPT和Llama这样的大型语言模型。这些模型通常通过预测文本序列中的下一个令牌(token)来进行训练,但这种方法在获取语言、世界... 阅读全文