AI初创公司OthersideAI 开源了Reflection 70B模型,号称是世界上最顶级的开源大语言模型,它采用了一种名为反射调优(Reflection-Tuning)的创新技术,使模型能够识别推理过程中的错误并进行修正。Reflection 70B 基于 Llama 3.1 70B Instruct,可以使用与其它 Llama 模型相同的代码、pipeline 等从 Reflection Llama-3.1 70B 进行采样。它甚至使用了标准的 Llama 3.1 聊天格式。
- 模型地址:https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B
- Demo:https://reflection-playground-production.up.railway.app
- Ollama:https://ollama.com/library/reflection
在多个评分指标上超过了GPT-4o、Claude 3.5 Sonnet、Llama 3.1 405B。使用Reflection-Tuning技术进行训练,这个技术能让LLM修复自己的错误。405B版本会在下周发布。
0条评论