优惠开放混合专家语言模型OLMoE

AI

推荐人：暴走AI 标签：OLMoE AI

1年前 (2024-09-05)AI

艾伦人工智能研究所、华盛顿大学和普林斯顿大学的研究人员推出开源、先进的语言模型OLMoE，OLMoE-1B-7B是这个系列中的一个模型，它有70亿个参数，但每个输入令牌仅使用10亿个参数。研究者们在5万亿个令牌上预训练了这个模型，并进一步调整，创建了OLMoE-1B-7B-INSTRUCT版本。这些模型在性能上超越了具... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型光学字符识别（OCR）模型GOT

AI

推荐人：暴走AI 标签：GOT AI

1年前 (2024-09-05)AI

阶跃星辰、旷视科技、中国科学院大学和清华大学的研究人员推出新型光学字符识别（OCR）模型GOT，它是迈向OCR-2.0时代的一个尝试。OCR技术简单来说，就是让计算机能够识别图片中的文字，并将其转换成可编辑的文本格式。就像你用手机拍一张图片，然后软件能识别出图片中的文字内容，这背后用到的就是OCR技术。 GitHub：... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 LongCite：旨在提升大语言模型在长文本环境下生成引用的能力

AI

推荐人：暴走AI 标签：LongCite AI

1年前 (2024-09-05)AI

清华大学和智谱AI的研究人员推出一个名为LongCite的系统，它旨在提升大语言模型（LLMs）在长文本环境下生成引用的能力。LongCite通过让模型能够生成带有精细句子级引用的回答，增强了模型输出的可信度和可验证性。例如，你是一名记者，需要写一篇关于环境政策的文章。你可以使用LongCite模型来分析政府发布的长篇... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多模态大语言模型LongLLaVA：专门设计用于高效处理大量图像

AI

推荐人：暴走AI 标签：LongLLaVA AI

1年前 (2024-09-05)AI

香港中文大学（深圳）和深圳大数据研究院的研究人员推出新型多模态大语言模型LongLLaVA，它专门设计用于高效处理大量图像。这个模型的特点是能够在保持较低内存消耗的同时，处理高达1000张的图像，这在单个高性能GPU上是非常了不起的。例如，你是一名医生，需要分析一张高分辨率的医学图像来诊断疾病。使用LongLLaVA，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型视频理解框架VideoLLaMB：专门设计来处理和理解长时间视频内容

AI

推荐人：暴走AI 标签：VideoLLaMB AI

1年前 (2024-09-04)AI

北京通用人工智能研究院 (BIGAI)、美国加州大学圣克鲁斯分校计算机科学与工程系、北京大学王选计算机技术研究所和通用人工智能国家重点实验室的研究人员推出新型视频理解框架VideoLLaMB，这个框架专门设计来处理和理解长时间视频内容，它通过一种特别的方式来编码整个视频序列，同时保留历史视觉数据，以此来提高模型在各种任... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于音频的端到端会话模型Mini-Omni：能够实现实时语音互动

AI

推荐人：暴走AI 标签：Mini-Omni 多模态语言模型 AI

1年前 (2024-09-03)AI

清华大学的研究人员推出多模态语言模型Mini-Omni，它能够实时地进行语音交互。想象一下，你有一个智能助手，不仅能理解你说的话，还能用语音回答你的问题，就像和真人对话一样自然。Mini-Omni就是这样一个模型，它能够“听”和“说”，同时还能进行思考。 GitHub：https://github.com/gpt-om... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠功能强大、易于使用的开源 RAG 工具kotaemon：为最终用户提供了与文档进行交互的可能，也为开发者提供了构建和定制 RAG 管道的平台

AI

推荐人：暴走AI 标签：kotaemon RAG 工具 AI

1年前 (2024-09-02)AI

kotaemon 是一个基于检索增强生成（RAG）技术的开源工具，它允许用户与文档进行交互式对话。kotaemon 的主要目的是提供一个简洁、可定制且功能丰富的用户界面，以便用户能够在其文档上进行问答，同时也为开发者提供了一个强大的框架来构建和定制自己的 RAG 管道。主要功能特性 kotaemon 具备以下主要功能... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠微调大语言模型新方法CURLoRA

AI

推荐人：暴走AI 标签：CURLoRA AI

1年前 (2024-09-02)AI

这篇论文介绍了一种名为CURLoRA的新型方法，它用于对大语言模型（LLMs）进行微调。CURLoRA利用了CUR矩阵分解技术，并结合了低秩适应（LoRA）的概念。这种方法主要解决了在持续学习过程中，如何减少模型的灾难性遗忘以及如何减少可训练参数数量这两个关键挑战。 GitHub：https://github.com/... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠为了更好地理解和处理科学文献而设计的AI模型SciLitLLM

AI

推荐人：暴走AI 标签：SciLitLLM AI

1年前 (2024-09-02)AI

中国科学技术大学和深势科技的研究人员推出一个名为SciLitLLM的人工智能模型，它是为了更好地理解和处理科学文献而设计的。你可以把它想象成一个超级聪明的机器人，它阅读科学文章和论文的能力就像一个科学家或研究者一样。主要功能： SciLitLLM的主要功能是理解科学文献的内容，然后根据这些内容回答问题或者执行特定的任... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠文本风格转换方法StyleRemix：能够将文本重新编写，以故意模糊作者的身份

AI

推荐人：暴走AI 标签：StyleRemix AI

1年前 (2024-08-30)AI

华盛顿大学和艾伦人工智能研究所的研究人员推出文本风格转换方法StyleRemix，它能够将文本重新编写，以故意模糊作者的身份。这项技术对于保护作者隐私非常重要，尤其是在需要匿名讨论、双盲审稿或健康服务等敏感情境中。总的来说，StyleRemix是一个强大的工具，它通过精细的风格元素控制和低计算成本，为用户提供了一种有效... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2：专门设计用于理解和处理图像与视频内容

AI

推荐人：暴走AI 标签：CogVLM2 智谱AI 清华大学 AI

1年前 (2024-08-30)AI

智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2，它们专门设计用于理解和处理图像与视频内容。简单来说，这些模型就像是拥有超凡视觉能力的智能助手，它们不仅能“看到”图像和视频里的内容，还能理解这些内容背后的含义，并根据这些理解来回答问题或者执行任务。 GitHub：https://github.com/THU... 阅读全文

直达链接好 0 不好 0 已关闭评论