优惠 TriForce：为了提高大语言模型（LLMs）在生成长文本内容时的效率而设计

AI

推荐人：暴走AI 标签：TriForce AI

1年前 (2024-04-20)AI

卡内基梅隆大学和Meta的研究人员推出TriForce，它是为了提高大语言模型（LLMs）在生成长文本内容时的效率而设计的。大语言模型，比如我们熟知的GPT-4，已经在聊天机器人、视觉生成和金融分析等领域得到了广泛应用。但是，这些模型在生成长文本时面临着一些挑战，主要是因为它们需要存储大量的中间信息（称为键值（KV）缓... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MLCommons AI安全工作组推出AI安全基准测试（AI Safety Benchmark）v0.5版本

AI

推荐人：暴走AI 标签：AI安全基准测试 AI

1年前 (2024-04-20)AI

由MLCommons AI安全工作组（AI Safety Working Group）开发的AI安全基准测试（AI Safety Benchmark）的v0.5版本。这个基准测试的目标是评估使用聊天调优语言模型（chat-tuned language models）的AI系统的安全风险。v0.5版本的基准测试不应该用来... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新框架ALPHALLM：帮助大语言模型通过自我评估和学习来提高其在复杂推理和规划任务上的表现，而不需要额外的人工标注数据

AI

推荐人：暴走AI 标签：ALPHALLM AI

1年前 (2024-04-20)AI

腾讯AI实验室发布新框架ALPHALLM，它可以帮助大语言模型通过自我评估和学习来提高其在复杂推理和规划任务上的表现，而不需要额外的人工标注数据。主要功能和特点：自我改进：ALPHALLM使语言模型能够自我评估，找出回答中的不足，并据此改进。集成蒙特卡洛树搜索（MCTS）：借鉴了AlphaGo的成功经验，ALPH... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Cross-lingual Reward Model Transfer：用于自然语言处理（NLP）中的零样本（Zero-Shot）跨语言对齐技术

AI

推荐人：暴走AI 标签：Cross-lingual Reward Model Transfer AI

1年前 (2024-04-20)AI

来自MIT和谷歌的研究人员发布论文介绍了“跨语言奖励模型迁移（Cross-lingual Reward Model Transfer）”，这是一种用于自然语言处理（NLP）中的零样本（Zero-Shot）跨语言对齐技术。简单来说，这项技术可以让一个已经在某种语言（源语言）上训练好的奖励模型（Reward Model，简... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Meta推出基于Llama3打造的AI助手Meta AI

AI

推荐人：暴走AI 标签：Meta AI AI

1年前 (2024-04-19)AI

Meta还发布了基于Llama3打造的AI助手Meta AI，大家可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI，同时还推出了Meta AI官网，Meta AI 无缝搜索集成于Facebook、Instagram、WhatsApp 和 Messenger ... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠超级重磅！Meta发布开源大语言模型Llama 3系列

AI

推荐人：暴走AI 标签：Llama 3 Meta AI

1年前 (2024-04-19)AI

说到开源大语言模型，最重要的就是Meta的Llama系列，尤其是去年发布的Llama2，成了很多大学、研究机构、甚至初创公司研究及开发大语言模型的基础。大家一直都在期待Meta发布Llama 3，原本预计会在今年6月发布，但Meta在当地时间4月18日就无预警的发布了Llama 3系列大语言模型，目前发布的有Llama... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store，在手机上使用各种开源大模型

AI

推荐人：暴走AI 标签：Hugging Chat Hugging Face AI

1年前 (2024-04-18)AI

Hugging Face推出了旗下AI聊天应用Hugging Chat的 iOS客户端，大家可以方便的在手机上使用各种开源大模型，目前支持的模型有6款： Command R+ Zephyr-14b Mixtral 8x7B Gemma-1.1-7b Nous-hermes-mixtral 8x7B Mistral 7B... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于 LLM 大语言模型的知识库问答系统MaxKB

AI

推荐人：暴走AI 标签：MaxKB AI

1年前 (2024-04-17)AI

MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base，旨在成为企业的最强大脑。开箱即用：支持直接上传文档、自动爬取在线文档，支持文本自动拆分、向量化，智能问答交互体验好；无缝嵌入：支持零编码快速嵌入到第三方业务系统；多模型支持：支持对接主流的大模型，包括... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 SIMA：创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理

AI

推荐人：暴走AI 标签：SIMA AI

1年前 (2024-04-17)AI

由Google DeepMind团队开发的项目SIMA（Scalable, Instructable, Multiworld Agent），SIMA的目标是创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理。这个代理可以用于执行各种任务，比如在虚拟环境中导航、收集资源、建造物品或者与环境互动。想象一下，你告诉... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 TR-DPO：用于改进大语言模型（LLMs）的对齐问题

AI

推荐人：暴走AI 标签：TR-DPO AI

1年前 (2024-04-17)AI

Tinkoff推出新方法Trust Region Direct Preference Optimization（TR-DPO），它用于改进大语言模型（LLMs）的对齐问题。在自然语言处理（NLP）中，对齐问题是指训练模型以生成不仅有效而且安全、可控的输出。例如，当你使用聊天机器人时，你希望它提供有帮助、准确且不会造成伤... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型神经网络架构TransformerFAM：为了解决大语言模型处理极长输入序列时的挑战而设计

AI

推荐人：暴走AI 标签：TransformerFAM AI

1年前 (2024-04-17)AI

谷歌推出新型神经网络架构TransformerFAM，它是为了解决大语言模型（LLMs）处理极长输入序列时的挑战而设计的。例如，你有一个非常长的故事，需要一个能够记住故事中所有细节的超级大脑。传统的神经网络（比如Transformer）在处理这样的故事时会遇到麻烦，因为它们的记忆能力有限，而且处理起来非常慢。Trans... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型神经网络架构MEGALODON，为了更高效地处理长序列数据而设计

AI

推荐人：暴走AI 标签：MEGALODON AI

1年前 (2024-04-17)AI

来自Meta、南加州大学、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员推出新型神经网络架构MEGALODON，它是为了更高效地处理长序列数据而设计的。想象一下，你有一个非常长的故事，需要一个能够记住故事中所有细节的超级大脑。传统的神经网络（比如Transformer）在处理这样的故事时会遇到麻烦，因为它们的记忆能力... 阅读全文

直达链接好 0 不好 0 已关闭评论