大语言模型

优惠 基于文本的视觉问答模型TextSquare

  • 基于文本的视觉问答模型TextSquare
    AI
  • 来自字节跳动、华东师范大学和华中科技大学的研究人员推出TextSquare系统,这是一个基于文本的视觉问答(VQA)模型,它利用了大型多模态语言模型(MLLMs)。TextSquare通过一个新颖的方法生成了一个大规模、高质量的指令调整数据集,称为Square-10M,这个数据集是通过使用闭源的MLLMs生成的。这项工... 阅读全文

    优惠 LLM-R2:利用大语言模型增强的基于规则的查询重写系统,旨在提高查询效率

  • LLM-R2:利用大语言模型增强的基于规则的查询重写系统,旨在提高查询效率
    AI
  • 来自南洋理工大学和阿里巴巴的研究人员推出LLM-R2系统,这是一个利用大语言模型(LLM)增强的基于规则的查询重写系统,旨在提高查询效率。查询重写是一种数据库优化技术,它通过改变SQL查询的结构来生成更高效的查询,而不改变查询的结果。 主要功能: 查询重写:LLM-R2能够接收一个SQL查询,并生成一个执行效率更高但结... 阅读全文

    优惠 新型网络爬虫生成系统AUTOCRAWLER:自动化地从特定类型的垂直信息网页中提取数据

  • 新型网络爬虫生成系统AUTOCRAWLER:自动化地从特定类型的垂直信息网页中提取数据
    AI
  • 来自复旦大学和爱橙科技的研究人员推出新型网络爬虫生成系统AUTOCRAWLER,它是为了自动化地从特定类型的垂直信息网页中提取数据而设计的。垂直信息网页是指那些专注于特定主题或业务的网站,比如汽车、书籍、电影、NBA球员信息等。 GitHub:https://github.com/EZ-hwh/AutoCrawler ... 阅读全文

    优惠 SRepair:基于大语言模型的函数级别APR技术

  • SRepair:基于大语言模型的函数级别APR技术
    AI
  • 来自南方科技大学和快手的研究人员发布关于自动化程序修复(Automated Program Repair,简称APR)的研究,特别是基于大语言模型(Large Language Models,简称LLMs)的函数级别(function-level)APR技术。函数级别的APR意味着不仅仅是修复代码中的单个错误或一小段代... 阅读全文

    优惠 Firecrawl:一键转换网站为Markdown格式的API服务

  • Firecrawl:一键转换网站为Markdown格式的API服务
    AI
  • Firecrawl是一款专注于将网站内容转化为易于大语言模型处理的Markdown格式的API服务。它旨在简化网络数据抓取与整理流程,为用户提供一键式的网页内容提取解决方案。以下是Firecrawl的核心功能与使用特点: 一、核心功能 网站自动爬取与转化 URL输入:用户仅需提供目标网站的单一入口URL,无需其他复杂的... 阅读全文

    优惠 专为简化RAG代码库管理与部署而设计的开源框架Cognita

  • 专为简化RAG代码库管理与部署而设计的开源框架Cognita
    AI
  • Cognita是一款专为简化RAG(Retrieval-Augmented Generation)代码库管理与部署而设计的开源框架。它以用户友好的前端界面为核心,赋予用户便捷的RAG定制与实验功能,确保所构建的系统具备出色的可部署性。无论是本地测试还是大规模生产环境应用,Cognita都能无缝衔接,为RAG系统的高效运... 阅读全文

    优惠 Purple Llama:完备的工具集与评估体系,助力社区成员在开发过程中负责任地运用开放的生成式AI模型

  • Purple Llama:完备的工具集与评估体系,助力社区成员在开发过程中负责任地运用开放的生成式AI模型
    AI
  • Purple Llama,一个前瞻性的综合性项目,正逐步构建起一套完备的工具集与评估体系,助力社区成员在开发过程中负责任地运用开放的生成式AI模型。该项目以持续集成的方式,汇聚多元化的解决方案,以适应AI技术发展的步伐与挑战。 首个版本,聚焦网络防护 我们的首发版本,已锁定网络安全与输入/输出保护两大核心领域,为用户配... 阅读全文

    优惠 torchtune:为 PyTorch 用户设计的库,旨在简化大型语言模型(LLMs)的创作、微调和实验过程

  • torchtune:为 PyTorch 用户设计的库,旨在简化大型语言模型(LLMs)的创作、微调和实验过程
    AI
  • torchtune 是一个为 PyTorch 用户设计的库,旨在简化大型语言模型(LLMs)的创作、微调和实验过程。以下是关于 torchtune 的一些关键信息: 原生 PyTorch 实现:torchtune 提供了使用可组合和模块化构建块的流行大型语言模型的原生 PyTorch 实现。 支持 Meta Llama... 阅读全文

    优惠 gemma.cpp:一个轻量级的、独立的 C++ 推理引擎,专为 Google 的 Gemma 基础模型设计

  • gemma.cpp:一个轻量级的、独立的 C++ 推理引擎,专为 Google 的 Gemma 基础模型设计
    AI
  • gemma.cpp 是一个轻量级的、独立的 C++ 推理引擎,专为 Google 的 Gemma 基础模型设计。这个项目似乎是为了填补现代大型语言模型(LLM)推理引擎和实验性 C++ 推理运行时之间的空白。它旨在为研究人员和开发者提供一个简单、直观且易于嵌入其他项目的工具,以便进行实验和研究。 以下是关于 gemma... 阅读全文

    优惠 Reka推出多模态语言模型Reka Core

  • Reka推出多模态语言模型Reka Core
    AI
  • 由 Reka 团队开发的一系列强大的多模态语言模型:Reka Core、Reka Flash 和 Reka Edge。这些模型能够处理和推理文本、图像、视频和音频输入。报告详细讨论了这些模型的训练细节,并提供了全面的评估结果。Reka 模型的特点是,即使是较小的模型(如 Reka Edge 和 Reka Flash),... 阅读全文

    优惠 新型基准测试Blink:专门用于评估多模态大语言模型在核心视觉感知能力方面的表现

  • 新型基准测试Blink:专门用于评估多模态大语言模型在核心视觉感知能力方面的表现
    AI
  • 新型基准测试Blink,它专门用于评估多模态大型语言模型(LLMs)在核心视觉感知能力方面的表现。这些能力往往在其他评估中被忽视,但对于人类来说却是非常直观和本能的,例如相对深度估计、视觉对应、法医检测和多视图推理等任务。Blink基准测试包含14个经典计算机视觉任务,这些任务被重新构想为3,807个多项选择题,配以单... 阅读全文

    优惠 SurgeGlobal推出OpenBezoar模型:在多种指令数据上进行训练得到的,目的是为了提高预训练大语言模型在多种下游任务上的性能

  • SurgeGlobal推出OpenBezoar模型:在多种指令数据上进行训练得到的,目的是为了提高预训练大语言模型在多种下游任务上的性能
    AI
  • 这篇论文介绍了一个名为OpenBezoar的模型家族,这些模型是通过在多种指令数据上进行训练得到的,目的是为了提高预训练大语言模型(LLMs)在多种下游任务上的性能。这个过程就像是教一个机器人如何更好地理解人类的指令并做出合适的反应。OpenBezoar模型家族的特点是它们相对较小,但在性能上却能与更大的模型相媲美,甚... 阅读全文