推荐类别

栏目分类

当前位置：首页 > 大语言模型

大语言模型

优惠线性变换器（Linear Transformers）在上下文学习（In-Context Learning，ICL）中的潜力

线性变换器（Linear Transformers）在上下文学习（In-Context Learning，ICL）中的潜力

AI

推荐人：暴走AI 标签：Linear Transformers AI

2年前 (2024-02-24)AI

这篇论文探讨了线性变换器（Linear Transformers）在上下文学习（In-Context Learning，ICL）中的潜力。研究者们发现，尽管线性变换器在结构上相对简单，但它们在处理复杂问题时表现出了惊人的能力。具体来说，线性 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠结合了行为变换器和对抗性模仿学习的方法BeTAIL

结合了行为变换器和对抗性模仿学习的方法BeTAIL

AI

推荐人：暴走AI 标签：BeTAIL AI

2年前 (2024-02-24)AI

加州大学伯克利分校、索尼的研究人员发布论文介绍了BeTAIL（Behavior Transformer Adversarial Imitation Learning），这是一种结合了行为变换器（Behavior Transformer，简称BeT）和对抗性模仿学习（Adversarial Im ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 LexC-Gen：解决低资源语言（即那些缺乏大量标注数据的语言）在自然语言处理（NLP）任务中的挑战

LexC-Gen：解决低资源语言（即那些缺乏大量标注数据的语言）在自然语言处理（NLP）任务中的挑战

AI

推荐人：暴走AI 标签：LexC-Gen AI

2年前 (2024-02-24)AI

布朗大学的研究人员发布论文介绍了一个名为LexC-Gen的方法，它旨在解决低资源语言（即那些缺乏大量标注数据的语言）在自然语言处理（NLP）任务中的挑战。LexC-Gen通过使用双语词典和大型语言模型（LLMs）来生成这些 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型Transformer模型Searchformer：训练Transformer来解决复杂的规划任务

新型Transformer模型Searchformer：训练Transformer来解决复杂的规划任务

AI

推荐人：暴走AI 标签：Beyond A Searchformer Transformer AI

2年前 (2024-02-24)AI

来自Meta的研究人员发布论文介绍了一种名为Searchformer的新型Transformer模型，它通过一种称为搜索动态引导（search dynamics bootstrapping）的方法，训练Transformer来解决复杂的规划任务。Transformer是一种深度 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠开源代码生成系统OpenCodeInterpreter

开源代码生成系统OpenCodeInterpreter

AI

推荐人：暴走AI 标签：OpenCodeInterpreter AI

2年前 (2024-02-23)AI

来自滑铁卢大学、艾伦人工智能研究所、香港科技大学的研究人员推出开源代码生成系统OpenCodeInterpreter。这个系统旨在通过结合代码执行和迭代精炼，提高代码生成的质量和实用性。它通过一个名为“CodeFeedback”的数 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠收录 250 亿个 Token！Hugging Face开源 AI 训练数据集“Cosmopedia”

收录 250 亿个 Token！Hugging Face开源 AI 训练数据集“Cosmopedia”

AI

推荐人：暴走AI 标签：Cosmopedia Hugging Face AI

2年前 (2024-02-23)AI

Hugging Face 近日开源了一款名为“Cosmopedia”的 AI 训练数据集，号称是目前世界上最大的合成数据集。该数据集内容均由 Mixtral 7b 模型汇总生成，其中收录 3000 万以上文本文件，包含大量教科书、博客文章、故事小 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 LongRoPE：显著扩展大语言模型（LLMs）的上下文窗口，达到了2048k个标记的惊人长度

LongRoPE：显著扩展大语言模型（LLMs）的上下文窗口，达到了2048k个标记的惊人长度

AI

推荐人：暴走AI 标签：大语言模型 AI

2年前 (2024-02-22)AI

来自微软的研究人员发布论文介绍了一种名为LongRoPE的技术，它能够显著扩展大语言模型（LLMs）的上下文窗口，达到了2048k个标记的惊人长度。这是首次实现这样的扩展，同时在保持原始短上下文窗口性能的同时，只需要1 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Meta推出多模态开放数据集AEA，通过Project Aria眼镜收集

Meta推出多模态开放数据集AEA，通过Project Aria眼镜收集

AI

推荐人：暴走AI 标签：AEA 数据集 AI

2年前 (2024-02-22)AI

Meta推出数据集Aria Everyday Activities (AEA) ，这是一个以第一人称视角记录的多模态开放数据集，通过Project Aria眼镜收集。AEA数据集包含了多个佩戴者在五个不同地理位置的室内环境中记录的143个日常活动序列。 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在深度强化学习中，如何通过修剪网络（pruning）来提高模型的性能

在深度强化学习中，如何通过修剪网络（pruning）来提高模型的性能

AI

推荐人：暴走AI 标签：修剪网络深度强化学习 AI

2年前 (2024-02-22)AI

来自Google DeepMind、魁北克人工智能研究所、蒙特利尔大学的研究人员发布论文探讨了在深度强化学习（Deep Reinforcement Learning, DRL）中，如何通过修剪网络（pruning）来提高模型的性能。修剪网络是一种优化技术 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 BBA：提高大型视觉-语言模型（LVLMs）在复杂多模态推理任务中的表现

BBA：提高大型视觉-语言模型（LVLMs）在复杂多模态推理任务中的表现

AI

推荐人：暴走AI 标签：BBA 大型视觉-语言模型 AI

2年前 (2024-02-22)AI

来自香港大学、腾讯AI实验室的研究人员发布论文介绍了一种名为Bi-Modal Behavioral Alignment (BBA) 的方法，它是为了提高大型视觉-语言模型（LVLMs）在复杂多模态推理任务中的表现。BBA方法的核心在于它能够更好地 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型解码框架Ouroboros：加速大语言模型（LLMs）的推理过程

新型解码框架Ouroboros：加速大语言模型（LLMs）的推理过程

AI

推荐人：暴走AI 标签：Ouroboros 大语言模型解码框架 AI

2年前 (2024-02-22)AI

这篇论文介绍了一种名为Ouroboros的新型解码框架，它旨在加速大语言模型（LLMs）的推理过程。Ouroboros通过一种称为“推测性解码”的方法，使用一个小型模型快速生成草稿，然后利用大型模型进行验证和修正，以减少时间 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 USER-LLM框架：用于改进大语言模型（LLMs）以更好地理解和适应用户交互数据

USER-LLM框架：用于改进大语言模型（LLMs）以更好地理解和适应用户交互数据

AI

推荐人：暴走AI 标签：USER-LLM AI

2年前 (2024-02-22)AI

来自谷歌的研究人员发布论文介绍了一个名为USER-LLM的框架，它是一个用于改进大语言模型（LLMs）以更好地理解和适应用户交互数据的系统。USER-LLM通过使用用户嵌入（user embeddings）来为LLMs提供上下文信息，这些 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

共 76 页« 第一页...«717273 74 »...最后 »

我要爆料我的收藏顶部

© Copyright2019-2026 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录