Hugging Face

优惠 构建和深入理解视觉-语言模型!Hugging Face推出理解视觉-语言模型Idefics3-8B

  • 构建和深入理解视觉-语言模型!Hugging Face推出理解视觉-语言模型Idefics3-8B
    AI
  • Hugging Face发布论文,论文的主题是关于构建和深入理解视觉-语言模型(VLMs)。VLMs是一种人工智能模型,它们能够处理和理解图像和文本,然后将这些信息综合起来输出文本。简单来说,这些模型就像一个能够“看”图片并“写”出描述的智能系统。它们还推出了Idefics3-8B,这是一个强大的VLM,它在开放数据集... 阅读全文

    优惠 Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb

  • Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb
    AI
  • Hugging Face推出大规模文本数据集FineWeb,它是专门为训练大语言模型而设计的。FineWeb数据集来源于Common Crawl的96个快照,包含15万亿个token,这些数据被用来训练性能更好的LLMs。此外,论文还介绍了FineWeb-Edu,这是一个从FineWeb中筛选出来的、专注于教育文本的子... 阅读全文

    优惠 Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store,在手机上使用各种开源大模型

  • Hugging Face旗下AI聊天应用Hugging Chat上架苹果 App Store,在手机上使用各种开源大模型
    AI
  • Hugging Face推出了旗下AI聊天应用Hugging Chat的 iOS客户端,大家可以方便的在手机上使用各种开源大模型,目前支持的模型有6款: Command R+ Zephyr-14b Mixtral 8x7B Gemma-1.1-7b Nous-hermes-mixtral 8x7B Mistral 7B... 阅读全文

    优惠 Hugging Face推出数据集WebSight和基于视觉-语言模型的系统Sightseer:它们旨在自动化网页截图到HTML代码的转换过程

  • Hugging Face推出数据集WebSight和基于视觉-语言模型的系统Sightseer:它们旨在自动化网页截图到HTML代码的转换过程
    AI
  • Hugging Face推出数据集WebSight和一个基于视觉-语言模型(VLM)的系统Sightseer,它们旨在自动化网页截图到HTML代码的转换过程。这项技术对于网页开发者来说非常有价值,因为它可以极大地提高开发效率,尤其是在无代码(no-code)解决方案中。 主要功能和特点: WebSight数据集: 包含... 阅读全文

    优惠 收录 250 亿个 Token!Hugging Face开源 AI 训练数据集“Cosmopedia”

  • 收录 250 亿个 Token!Hugging Face开源 AI 训练数据集“Cosmopedia”
    AI
  • Hugging Face 近日开源了一款名为“Cosmopedia”的 AI 训练数据集,号称是目前世界上最大的合成数据集。该数据集内容均由 Mixtral 7b 模型汇总生成,其中收录 3000 万以上文本文件,包含大量教科书、博客文章、故事小说、WikiHow 教程等内容,共计 250 亿个 Token。Cosmo... 阅读全文