情报 Jina AI 推出Reader-LM:专门用于将杂乱的网页代码(HTML)整理并转换成易于阅读的文档格式(Markdown)的小型语言模型

Jina AI 推出了 reader-lm-0.5b 和 reader-lm-1.5b 这两款小型大语言模型,它们是专门为从杂乱无章的原始 HTML 代码中直接生成清晰、格式良好的 Markdown 文档而训练的。这两款模型支持多语言输入,并且能够处理长达 256,000 个词汇单位的文本内容。尽管它们的体积只有大型语... 阅读全文