当前位置：首页 > 优惠 >大语言模型>文章详情

微软推出T-MAC，在边缘设备上高效部署大语言模型

推荐人：暴走AI| 商城: AI | 1年前 (2024-07-04)| 分类：大语言模型 | 热度：472 ℃

已关闭评论

微软推出T-MAC，在边缘设备上高效部署大语言模型（LLMs）。例如，我们想让智能手机、平板电脑或者家里的智能音箱能够更好地理解我们说的话，并且给出智能的回答，就需要在这些设备上运行一些非常复杂的算法，这些算法就是大型语言模型。但是，这些模型因为非常复杂，所以它们需要很多内存和计算能力，这对于边缘设备来说是个挑战。

论文的主要功能和特点就是提出了一个叫做T-MAC的新方法，它通过一种特殊的查找表（LUT）技术，帮助边缘设备在不需要太多计算资源的情况下，也能运行这些大型语言模型。这就像是我们查字典一样，当需要一个词的意思时，我们不需要从头到尾去想这个词的意思，而是可以直接在字典中查找，这样既快速又方便。

T-MAC的工作原理是将传统的基于数据类型的乘法运算转换为基于位的查找表查询。简单来说，就是把原本需要通过计算得出的结果，通过提前计算好并存到一个表里，当需要的时候直接查表得到结果，从而避免了复杂的计算过程，节省了时间和资源。

具体应用场景包括但不限于：