当前位置：首页 > 优惠 >大语言模型>文章详情

腾讯推出全面基准测试Plot2Code：评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计

推荐人：暴走AI| 商城: AI | 1年前 (2024-05-20)| 分类：大语言模型 | 热度：287 ℃

已关闭评论

腾讯推出全面基准测试Plot2Code，它是为了评估多模态大语言模型（MLLMs）在将科学图表转换为可执行代码方面的能力而设计的。MLLMs在视觉领域的应用取得了显著进展，但它们在将视觉图表转换为代码方面的能力尚未得到充分评估。Plot2Code旨在填补这一空白，提供一个公平且深入的评估框架。

想象一下，你有一个复杂的科学图表，你想要一个计算机程序能够自动理解这个图表，并生成创建这个图表的Python代码。Plot2Code就是这样一个工具，它可以帮助你测试和评估不同的人工智能模型是否能够准确地完成这项任务。

Plot2Code基准测试揭示了现有MLLMs在文本密集型图表的视觉编码方面存在挑战，并依赖于文本指令。该基准测试旨在指导未来MLLMs在视觉编码方面的发展方向。所有与Plot2Code相关的数据都可以在Hugging Face的数据集库中找到。

Plot2Code

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

下一篇： Two Platforms推出多语言大语言模型架构SUTRA，它能够理解、推理并用超过50种语言生成文本

暂时木有评论

查看更多商品