当前位置：首页 > 优惠 >大语言模型>文章详情

微调方法LoRA在大语言模型（LLMs）中的应用

推荐人：暴走AI| 商城: AI | 1年前 (2024-05-20)| 分类：大语言模型 | 热度：286 ℃

已关闭评论

直达链接

这篇论文的主题是探讨一种名为LoRA（Low-Rank Adaptation，低秩适应）的微调方法在大语言模型（LLMs）中的应用。LoRA是一种参数高效的微调技术，它通过只训练选定权重矩阵的低秩扰动来节省内存。

主要功能： LoRA的主要功能是在保持大型语言模型原有功能的同时，对其进行微调以适应特定的任务或领域（如编程和数学问题解答），同时尽量降低对模型原有性能的影响。

主要特点：

参数高效：LoRA只训练模型中的一小部分参数，这使得它在训练时对内存的需求远低于全参数微调。
正则化效果：LoRA在微调过程中提供了一种正则化效果，有助于减少模型对原始训练数据的“遗忘”。
多样性保持：LoRA有助于在生成文本时保持更多样化的输出。

工作原理： LoRA的工作原理是在预训练的权重矩阵上添加一个低秩的扰动矩阵。具体来说，如果有一个预训练的权重矩阵 $𝑊_{pretrained}$ ，LoRA会训练一个低秩矩阵 $Δ = 𝐴 𝐵$ （其中 $𝐴$ 和 $𝐵$ 的秩远小于 $𝑊_{pretrained}$ 的维度），最终的微调权重矩阵为 $𝑊_{finetuned} = 𝑊_{pretrained} + Δ$ 。