当前位置：首页 > 优惠 >大语言模型>文章详情

新型大语言模型TABULA-8B：专门用于处理表格数据

推荐人：暴走AI| 商城: AI | 2年前 (2024-06-19)| 分类：大语言模型 | 热度：702 ℃

已关闭评论

华盛顿大学、哈佛大学和斯坦福大学的研究人员推出新型大语言模型TABULA-8B，它专门用于处理表格数据（Tabular Data）。表格数据是一种结构化、异构的、类似电子表格的数据形式，它在许多领域中都有广泛应用，比如医疗、金融、政府和自然科学等。

例如，你有一大堆来自不同地方的数据表，这些数据表里充满了数字、文字和日期等信息。如果你想从这些数据中预测或分析出某些结果，通常需要用到专业的软件或者雇佣数据科学家来帮你。但是，有了TABULA-8B这样的模型，它就可以像一个聪明的助手一样，帮你理解这些数据，并做出预测。

主要功能：

表格预测：TABULA-8B能够对表格中的数据进行分类和回归预测。
零样本学习（Zero-Shot Learning）：即使没有见过类似的数据，TABULA-8B也能够做出准确的预测。
少样本学习（Few-Shot Learning）：在给定少量样本的情况下，TABULA-8B的表现也优于现有的一些模型。

主要特点：

大规模数据集：TABULA-8B使用了超过1.6亿行数据进行训练，这些数据来自3.1万个独特的表格。
高质量的数据过滤：在训练之前，对数据进行了一系列的过滤和质量控制，以确保数据的准确性和安全性。
开源发布：研究者们开源了模型、代码和数据集，以便社区可以在此基础上进一步研究和开发。

工作原理：

TABULA-8B基于一个名为Llama 3-8B的大型语言模型，通过一种新颖的打包和注意力机制来处理表格数据。它首先将表格数据序列化成文本，然后通过训练来学习如何预测目标列的值。模型使用了一种称为行因果表格掩码（Row-Causal Tabular Masking, RCTM）的策略，这有助于在训练过程中保持对少量样本的学习能力。