新型的多任务信息提取模型GLiNER(Generalist Lightweight model for Information Extraction and Named Entity Recognition),这个模型旨在通过一个小规模的编码器(encoder)模型,实现对各种信息提取任务的有效处理,包括命名实体识别(... 阅读全文
HARE 是由中国电信股份有限公司贵州分公司 LiteAI 团队开发的预训练模型,我们使用约600B Tokens的高质量开源和策略生成的合成数据作为预训练数据。论文的主题是探讨如何通过利用人类先验知识(human priors)来提高小型语言模型(Small Language Models,简称SLMs)的效率和性能... 阅读全文
越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型基准测试工具REPOEXEC,它用于评估代码生成模型(CodeLLMs)在处理整个代码库级别的任务时的能力。REPOEXEC的核心目标是测试这些模型生成的代码是否可执行、功能正确,并且能够准确利用跨文件的上下文信息。实验结果表明,尽管预训练的大型语言模型(LL... 阅读全文