当前位置：首页 > 优惠 >大语言模型>文章详情

微软推出评估平台WINDOWSAGENTARENA：专门用来测试和提升计算机代理在Windows操作系统中执行多模态任务的能力

推荐人：暴走AI| 商城: AI | 7个月前 (09-13)| 分类：大语言模型 | 热度：72 ℃

已关闭评论

微软推出评估平台WINDOWSAGENTARENA：专门用来测试和提升计算机代理在Windows操作系统中执行多模态任务的能力

AI

微软、卡内基梅隆大学和哥伦比亚大学的研究人员推出评估平台WINDOWSAGENTARENA，它专门用来测试和提升计算机代理（也就是我们通常说的“智能助手”或“机器人”）在Windows操作系统中执行多模态任务的能力。这些任务包括但不限于文本处理、网页浏览、使用各种应用程序等。

项目主页：https://microsoft.github.io/WindowsAgentArena
GitHub：https://github.com/microsoft/WindowsAgentArena

例如，你有一个朋友，他非常擅长使用电脑，可以帮你完成各种任务，比如写文档、网上购物、调整电脑设置等。现在，有人开发了一个虚拟的“朋友”，它可以在电脑上做同样的事情，但这个“朋友”是一个程序，我们称之为“智能代理”。而“WINDOWSAGENTARENA”就像是一个考场，用来测试这个虚拟朋友的“能力”如何，看它能不能像真人一样熟练地使用电脑。

主要功能：

任务执行： 让智能代理在Windows操作系统中执行各种任务。
性能评估： 通过一系列标准化的任务来评估智能代理的性能。
环境模拟： 提供一个真实的Windows环境，让代理可以像人类用户一样与应用程序和工具互动。

主要特点：

多模态任务： 支持文本、视觉（如屏幕截图）、声音等多种输入和输出模态。
可扩展性： 可以不断添加新的任务和功能，以适应不断变化的技术和用户需求。
并行化评估： 能够在云端并行处理多个任务，大幅缩短评估时间。

工作原理： 这个平台通过模拟真实的Windows操作环境，给智能代理提供任务指令，然后观察和记录代理是如何执行这些任务的。它使用了一系列的工具和技术，比如屏幕理解（理解屏幕上的按钮、文本等元素）、工具使用（比如使用计算器应用来计算日期差异）和规划（决定如何分步骤完成任务）。

具体应用场景：

自动化办公： 帮助用户自动完成文档编辑、数据整理等办公室任务。
家庭自动化： 管理家庭设备，比如调整灯光、温度等。
在线客服： 在网站上为用户提供实时帮助，解答问题或执行特定操作。
教育辅助： 帮助学生完成研究任务，比如在网上查找资料、整理笔记等。

总的来说，这个平台的目标是推动智能代理技术的发展，让它们能够更加智能和高效地协助人类完成各种计算机相关的任务。

WINDOWSAGENTARENA 微软

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：谷歌推出AI 辅助工具 NotebookLM：专为提升研究和写作效率而生

下一篇： DreamHOI：用于生成3D人类与物体互动场景的方法

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录