LG AI Research团队开发的大语言模型EXAONE 3.0,这个模型特别之处在于它经过了“指令调优”,意味着它能够更好地理解和执行人类的指令。EXAONE 3.0是首个公开的大型语言模型家族中的一员,公开发布的是7.8B(即7.8十亿参数)的版本,目的是为了推动开放的研究和创新。 GitHub:https:/... 阅读全文
蚂蚁集团推出一种名为POA(Pre-training Once for All)的新型自监督预训练框架。POA的核心思想是通过一次预训练过程,生成多种大小的模型,以适应不同的计算和存储需求。这类似于我们在一个大型购物中心购物,而不是去多个小商店,POA让我们通过一次“购物”(预训练)得到所有尺寸的“衣服”(模型),以适... 阅读全文