Jina AI 推出Reader-LM:专门用于将杂乱的网页代码(HTML)整理并转换成易于阅读的文档格式(Markdown)的小型语言模型

| 分类: AI情报 | 热度: 86 ℃

Jina AI 推出了 reader-lm-0.5b 和 reader-lm-1.5b 这两款小型大语言模型,它们是专门为从杂乱无章的原始 HTML 代码中直接生成清晰、格式良好的 Markdown 文档而训练的。这两款模型支持多语言输入,并且能够处理长达 256,000 个词汇单位的文本内容。尽管它们的体积只有大型语言模型的五十分之一,但它们在这项任务上的表现却达到了行业领先水平,甚至超过了一些体积更大的模型。(官方介绍

模型地址:

  • reader-lm-0.5b:https://huggingface.co/jinaai/reader-lm-0.5b
  • reader-lm-1.5b:https://huggingface.co/jinaai/reader-lm-1.5b
  • Demo:https://huggingface.co/spaces/maxiw/HTML-to-Markdown

Jina AI 推出Reader-LM:专门用于将杂乱的网页代码(HTML)整理并转换成易于阅读的文档格式(Markdown)的小型语言模型

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论