优惠 REGMIX：将数据混合问题转化为一个回归问题来解决

AI

推荐人：暴走AI 标签：REGMIX AI

10个月前 (07-02)AI

Sea推出新方法REGMIX，它将数据混合问题转化为一个回归问题来解决。简单来说，就是通过训练多个小型模型，并观察它们在不同数据混合下的表现，然后基于这些表现来预测哪些数据混合对于训练大型模型最有效。例如，我们想训练一个能够回答各种问题的语言模型。我们有来自不同领域（如科学、历史、技术）的大量文本数据。使用REGMIX... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型树状搜索算法LiteSearch：为了提高大语言模型在复杂数学推理任务上的性能而设计

AI

推荐人：暴走AI 标签：LiteSearch AI

10个月前 (07-02)AI

厦门大学信息学院和腾讯人工智能实验室的研究人员推出一种新型的树状搜索算法——LiteSearch，它是为了提高大语言模型（LLMs）在复杂数学推理任务上的性能而设计的。在以往的研究中，树状搜索算法（例如蒙特卡洛树搜索，MCTS）已被证明可以显著提升LLMs的性能，但这些算法常常因为搜索策略上的浪费而需要超过贪婪解码10... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多模态评估基准MMEVALPRO：检验和校准大型多模态模型的评估方法，以确保评估结果既可靠又高效

AI

推荐人：暴走AI 标签：MMEVALPRO AI

10个月前 (07-02)AI

北京大学、国医学科学院、香港中文大学和阿里巴巴集团的研究人员推出新型多模态评估基准MMEVALPRO，它专门设计用来检验和校准大型多模态模型（LMMs）的评估方法，以确保评估结果既可靠又高效。例如，我们有一个问题：“图中的植物有几种不同的叶子形状？”原始答案可能是“三种”。但MMEVALPRO会进一步询问：“你能描述这... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠用于机器人编程的系统ROS-LLM：可以让没有专业机器人编程知识的普通人通过自然语言提示和上下文信息来指导机器人完成任务

AI

推荐人：暴走AI 标签：ROS-LLM AI

10个月前 (07-02)AI

华为诺亚方舟的研究人员推出ROS-LLM框架，它是一个用于机器人编程的系统，可以让没有专业机器人编程知识的普通人通过自然语言提示和上下文信息来指导机器人完成任务。简单来说，这个系统就像是一个能够理解人类语言的机器人大脑，它能够根据人们用日常语言描述的任务要求来控制机器人的动作。 GitHub：https://githu... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基准测试WE-MATH：专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则

$基准测试WE-MATH：专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则$

AI

推荐人：暴走AI 标签：WE-MATH AI

10个月前 (07-02)AI

北京邮电大学、腾讯、华中科技大学和北京技术研究院的研究人员推出基准测试WE-MATH，测试大型多模态模型（Large Multimodal Models，简称LMMs）在进行数学推理时是否能达到类似人类的水平，专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则，而不仅仅是最终结果。项目主页：https://w... 阅读全文

直达链接好 1 不好 0 已关闭评论

优惠仅 200KB！开源在线白板工具Kinopio

AI

推荐人：暴走AI 标签：Kinopio AI

10个月前 (07-02)AI

kinopio-client 是GitHub上的一个开源白板工具，该项目专注于在线白板工具的开发。Kinopio是一个允许用户以多种方式连接许多卡片的在线白板工具。在项目的五周年纪念日，开发者宣布了这个项目的开源，使得用户能够在本地运行并使用Kinopio。整个项目的代码大小仅为220KB，这使得即使在缺乏互联网连接的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估指标RaTEScore:专门用来衡量由AI模型生成的医学报告的质量

AI

推荐人：暴走AI 标签：RaTEScore AI

10个月前 (07-01)AI

上海交通大学和上海人工智能实验室的研究人员推出新的评估指标RaTEScore，专门用来衡量由AI模型生成的医学报告的质量。这个指标特别关注医学报告中的关键医疗实体，如诊断结果和解剖细节，并且对于复杂的医学同义词有很强的鲁棒性，对否定表达也很敏感。新基准测试RaTE-Eval，它包括三个子任务：句子级人类评分、段落级人类... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型智能体∆-IRIS：使用了一个高效的世界模型架构来模拟环境并学习新行为

AI

推荐人：暴走AI 标签：∆-IRIS AI

10个月前 (07-01)AI

新型智能体∆-IRIS，它使用了一个高效的世界模型架构来模拟环境并学习新行为。这个模型特别适合于深度强化学习（Deep Reinforcement Learning, RL），这是一种让机器通过与环境交互来自主学习的方法。∆-IRIS在训练速度上比之前的注意力机制方法快了一个数量级，这使得它在需要处理大量数据和复杂环境... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大型多模态数据集ARBORETUM：为了推动生物多样性应用的AI发展而设计

AI

推荐人：暴走AI 标签：ARBORETUM AI

10个月前 (07-01)AI

爱荷华州立大学、纽约大学和亚利桑那大学的研究人员推出大型多模态数据集ARBORETUM，它是为了推动生物多样性应用的AI发展而设计的。论文还提到了基于ARBORETUM数据集训练的一些新模型，称为ARBORCLIP，这些模型在多种图像分类任务上展现出了优秀的性能。研究者希望这个数据集能够激发更多AI模型的发展，以支持从... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新框架AutoRAG-HP：提高大语言模型在检索增强型生成（RAG）系统中的超参数调优效率而设计

AI

推荐人：暴走AI 标签：AutoRAG-HP AI

10个月前 (07-01)AI

中国科学院自动化研究所、中国科学院大学人工智能学院和微软的研究人员推出新框架AutoRAG-HP，它是为了提高大语言模型（LLMs）在检索增强型生成（RAG）系统中的超参数调优效率而设计的。例如，你有一个非常智能的助手，它可以写文章、回答问题，甚至帮你处理各种语言任务，但为了让它表现得更好，你需要调整一些设置，这些设置... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型框架GaussianDreamerPro：将文本转换成高质量的3D高斯资产，这些资产可以用于游戏、电影、XR等行业

AI

推荐人：暴走AI 标签：GaussianDreamerPro AI

10个月前 (07-01)AI

华中科技大学、华为公司和上海交通大学人工智能研究院的研究人员推出新型框架GaussianDreamerPro，它能够将文本转换成高质量的3D高斯资产（3D Gaussian assets），这些资产可以用于游戏、电影、扩展现实（XR）等行业。GaussianDreamerPro的核心思想是将高斯（Gaussians）与... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠直接偏好知识蒸馏DPKD：专门为大语言模型设计

AI

推荐人：暴走AI 标签：DPKD 知识蒸馏 AI

10个月前 (07-01)AI

上海交通大学、清华大学、微软研究院和香港中文大学的研究人员推出一种新型的知识蒸馏（Knowledge Distillation, KD）方法，称为直接偏好知识蒸馏（Direct Preference Knowledge Distillation, DPKD），专门为大型语言模型（Large Language Model... 阅读全文

直达链接好 1 不好 0 已关闭评论