AI
优惠 Alignment Studio:帮助开发者将大语言模型调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等
8个月前 (03-21)AI
这篇论文介绍了一个名为“Alignment Studio”的系统,它旨在帮助开发者将大型语言模型(LLMs)调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等。这个系统特别适用于那些需要根据特定情境调整AI行为的场景,而不是仅仅依赖于模型提供商的通用调整。 介绍和举例说明: 想象一下,你是一家国际公司的I... 阅读全文
优惠 Recurrent Drafter:提高大语言模型的解码效率
8个月前 (03-21)AI
苹果发布论文介绍了一种名为“Recurrent Drafter”(简称ReDrafter)的新方法,旨在提高大语言模型(Large Language Models,简称LLMs)的解码效率。大型语言模型是人工智能领域的一种先进技术,它们通过学习大量文本数据,能够生成连贯、有意义的文本,就像人类写作一样。但是,这些模型通... 阅读全文
优惠 Meta发布室内场景重建方法SceneScript:能够直接从视频流中预测出室内场景的三维模型
8个月前 (03-21)AI
Meta发布了一种使用自回归结构化语言模型重建场景的方法SceneScript。该方法使用场景语言编码器-解码器架构,直接从编码的视觉数据中推断出一组结构化的语言命令。为了训练SceneScript,作者生成并发布了一个大规模的合成数据集,名为Aria Synthetic Environments,包含10万个高质量的... 阅读全文
优惠 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念
8个月前 (03-21)AI
这篇论文探讨了一个有趣的问题:我们是否总是需要更大的视觉模型来获得更好的视觉理解?作者们提出了一种名为“Scaling on Scales”(S2)的方法,这是一种在图像尺度上进行扩展的策略,而不是简单地增加模型的大小。具体来说,他们使用了预训练的小型视觉模型(例如ViT-B或ViT-L),并在多个图像尺度上运行这些模... 阅读全文
优惠 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型
标签:LLAMAFACTORY
AI
8个月前 (03-21)AI
来自北航的研究团队推出大语言模型微调框架LLAMAFACTORY,它是一个用于高效微调大语言模型(LLMs)的统一平台。LLAMAFACTORY通过整合一系列最新的高效训练方法,使用户能够灵活地自定义微调100多个不同的LLMs,而无需编码,只需通过内置的Web界面LLAMABOARD即可完成。LLAMAFACTORY... 阅读全文
优惠 HyperLLaVA:用于增强多模态大语言模型(MLLMs)性能的技术
8个月前 (03-21)AI
来自浙江大学、上海科技大学、 重庆大学、 阿里巴巴集团和哈尔滨工业大学的研究团队推出HyperLLaVA,它是一种用于增强多模态大型语言模型(MLLMs)性能的技术。HyperLLaVA的目标是改进现有的MLLMs,如LLaVA,通过动态调整模型的视觉和语言处理部分,使其能够更好地理解和生成与视觉内容相关的文本。总的来... 阅读全文