大语言模型
优惠 如何减少Transformer模型中关键值(Key-Value,KV)缓存的大小
标签:Transformer模型
AI
6个月前 (05-22)AI
MIT的研究人员发布论文,主题是关于如何减少Transformer模型中关键值(Key-Value,KV)缓存的大小。Transformer模型是当前自然语言处理(NLP)领域非常流行的一种模型,它在处理大语言模型(LLMs)时,解码速度很快,但需要大量的内存来存储KV缓存,这在处理长序列和大批量数据时尤其成问题。 主... 阅读全文
优惠 百川智能发布新一代大模型Baichuan 4及AI助手“百小应”
6个月前 (05-22)AI
今日,百川智能正式推出了最新一代基座大模型Baichuan 4。与前一代Baichuan 3相比,Baichuan 4在各项能力上均有显著提升,通用能力提升超过10%,数学和代码能力分别提升了14%和9%。在国内知名大模型评测机构SuperCLUE的评测中,Baichuan 4的模型能力位居国内第一。Baichuan ... 阅读全文
优惠 微软Build 2024开发者大会发布Phi-3-vision模型,可在小型设备上运行
标签:Phi-3-vision微软
AI
6个月前 (05-22)AI
在微软Build 2024开发者大会上,微软公布了Phi-3-vision模型,它小巧到足以在手机上执行,同时具备出色的视觉能力,能够理解文字和图片。Phi-3-vision是4月公布的Phi-3模型家族的最新成员,拥有42亿参数,介于Phi-3-mini(3.8亿)和Phi-3-small(7亿)之间。作为Phi-3... 阅读全文