大语言模型
优惠 Alignment Studio:帮助开发者将大语言模型调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等
1年前 (2024-03-21)AI
这篇论文介绍了一个名为“Alignment Studio”的系统,它旨在帮助开发者将大型语言模型(LLMs)调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等。这个系统特别适用于那些需要根据特定情境调整AI行为的场景,而不是仅仅依赖于模型提供商的通用调整。 介绍和举例说明: 想象一下,你是一家国际公司的I... 阅读全文
优惠 Recurrent Drafter:提高大语言模型的解码效率
1年前 (2024-03-21)AI
苹果发布论文介绍了一种名为“Recurrent Drafter”(简称ReDrafter)的新方法,旨在提高大语言模型(Large Language Models,简称LLMs)的解码效率。大型语言模型是人工智能领域的一种先进技术,它们通过学习大量文本数据,能够生成连贯、有意义的文本,就像人类写作一样。但是,这些模型通... 阅读全文
优惠 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念
1年前 (2024-03-21)AI
这篇论文探讨了一个有趣的问题:我们是否总是需要更大的视觉模型来获得更好的视觉理解?作者们提出了一种名为“Scaling on Scales”(S2)的方法,这是一种在图像尺度上进行扩展的策略,而不是简单地增加模型的大小。具体来说,他们使用了预训练的小型视觉模型(例如ViT-B或ViT-L),并在多个图像尺度上运行这些模... 阅读全文
优惠 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型
标签:LLAMAFACTORY
AI
1年前 (2024-03-21)AI
来自北航的研究团队推出大语言模型微调框架LLAMAFACTORY,它是一个用于高效微调大语言模型(LLMs)的统一平台。LLAMAFACTORY通过整合一系列最新的高效训练方法,使用户能够灵活地自定义微调100多个不同的LLMs,而无需编码,只需通过内置的Web界面LLAMABOARD即可完成。LLAMAFACTORY... 阅读全文
优惠 HyperLLaVA:用于增强多模态大语言模型(MLLMs)性能的技术
1年前 (2024-03-21)AI
来自浙江大学、上海科技大学、 重庆大学、 阿里巴巴集团和哈尔滨工业大学的研究团队推出HyperLLaVA,它是一种用于增强多模态大型语言模型(MLLMs)性能的技术。HyperLLaVA的目标是改进现有的MLLMs,如LLaVA,通过动态调整模型的视觉和语言处理部分,使其能够更好地理解和生成与视觉内容相关的文本。总的来... 阅读全文
优惠 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构
1年前 (2024-03-21)AI
来自悉尼大学的研究团队论文介绍了一种名为EfficientVMamba的轻量级视觉模型,它是一种结合了全局和局部特征提取能力的网络架构。想象一下,你有一个超级助手,它能够在保持图像细节的同时,快速地从大量图片中识别出不同的物体。EfficientVMamba就像这样一个助手,但它专注于图像处理和识别任务。 主要功能和特... 阅读全文