B站开源了轻量级 Index-1.9B 系列模型:包含基座模型、对照组、对话模型、角色扮演模型等多个版本

分类:大语言模型 | 热度:75 ℃

B站昨日开源了轻量级 Index-1.9B 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。据介绍,该模型在预训练阶段使用了 2.8T 规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。

  • GitHub:https://github.com/bilibili/Index-1.9B/blob/main/README.md
  • 模型:https://huggingface.co/IndexTeam
  • 基础模型Demo:https://huggingface.co/spaces/IndexTeam/Index-1.9B
  • 角色模型Demo:https://huggingface.co/spaces/IndexTeam/Index-1.9B-Character

官方简介:

  • Index-1.9B base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。

  • Index-1.9B pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响。

  • Index-1.9B chat :基于 index-1.9B base 通过 SFT 和 DPO 对齐后的对话模型,由于预训练中引入了较多互联网社区语料,聊天的趣味性明显更强。

  • Index-1.9B character :在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制。

B站开源了轻量级 Index-1.9B 系列模型:包含基座模型、对照组、对话模型、角色扮演模型等多个版本

B站开源了轻量级 Index-1.9B 系列模型:包含基座模型、对照组、对话模型、角色扮演模型等多个版本

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论