微软推出专为电子表格设计的大语言模型 SpreadsheetLLM

| 分类: AI情报 | 热度: 93 ℃

微软的研究人员最近开发了一种专为Excel、Google Sheets等电子表格程序设计的大语言模型,名为SpreadsheetLLM。这一模型旨在解决电子表格的布局和格式多样性带来的挑战,特别是在Token限制和理解电子表格特有的功能(如单元格地址和格式)方面。

  • 论文地址:https://arxiv.org/html/2407.09025v1

微软推出专为电子表格设计的大语言模型 SpreadsheetLLM

SpreadsheetLLM的特点:

  • 结构锚点压缩:通过识别和利用电子表格中的结构锚点,有效压缩数据,减少所需Token数量。
  • 逆向索引翻译:将电子表格中的数据转换为模型可以更有效处理的格式。
  • 数据格式感知聚合:理解并处理不同数据格式,提高模型对电子表格内容的理解和处理能力。

性能提升与成本降低:

  • 性能提升:在电子表格检测任务中,SpreadsheetLLM的性能比GPT4的传统方法高出25.6%。
  • 成本降低:在处理大规模电子表格时,SpreadsheetLLM能将Token成本降低高达96%。

限制与未来发展:

  • 当前限制:SpreadsheetLLM在处理包含背景颜色和边框的电子表格时可能会遇到Token占用过多的问题。此外,SheetCompressor目前还不能压缩包含自然语言的单元格。
  • 未来展望:微软计划进一步优化模型,例如通过将“中国”、“美国”和“法国”等术语归类到“国家”这一统一标签下,以提高压缩比率和加深模型对数据的语义理解。
声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论