当前位置：首页 > 优惠 >大语言模型>文章详情

可在手机上运行的微型语言模型MobiLlama

推荐人：暴走AI| 商城: AI | 1年前 (2024-02-27)| 分类：大语言模型 | 热度：307 ℃

已关闭评论

来自穆罕默德·本·扎耶德人工智能大学、澳大利亚国立大学、阿尔托大学、墨尔本大学、林雪平大学的研究人员推出小型语言模型MobiLlama，它是为了满足资源受限设备上的高效、准确语言处理需求而设计的。在当今大语言模型（LLM）如ChatGPT等越来越流行的背景下，这些大型模型虽然功能强大，但在需要在设备上直接处理数据、节省能源、减少内存占用和提高响应速度的场景中并不适用。MobiLlama旨在解决这些问题，提供一个既准确又轻量级的解决方案。MobiLlama是一个为资源受限环境设计的高效、准确的小型语言模型，它通过共享FFN层来优化模型结构，同时保持了模型的透明度，为研究社区提供了宝贵的资源。

GitHub：https://github.com/mbzuai-oryx/MobiLlama

模型：https://huggingface.co/collections/MBZUAI/mobillama-65dd4182d588c91e8230332e

Demo地址：https://845b645234785da51b.gradio.live

可在手机上运行的微型语言模型MobiLlama

主要功能：

MobiLlama是一个开源的小型语言模型，拥有5亿（0.5B）参数，专为资源受限的计算环境设计。
它通过共享前馈网络（FFN）层来减少模型大小，同时保持模型的准确性和效率。
MobiLlama提供了完整的透明度，包括训练数据、代码、模型权重和超过300个检查点，以及评估代码。

主要特点：

轻量级：MobiLlama的参数数量远少于大型语言模型，使其能够在内存和计算资源有限的设备上运行。
高效率：通过共享FFN层，MobiLlama在预训练和部署时的资源需求显著降低。
全透明：研究者提供了完整的训练数据管道、训练代码、模型权重和评估工具，促进了社区的进一步研究和创新。

工作原理：

MobiLlama从一个较大的模型开始，然后应用精心设计的参数共享方案来减少模型大小，从而降低预训练和部署的成本。
在传统的SLM设计中，每个Transformer块通常都有一个专门的FFN层。MobiLlama则提出了一个共享FFN设计，用于所有Transformer块，这样可以在不显著增加总训练参数的情况下，增加模型的层数和隐藏维度大小。

具体应用场景：