当前位置：首页 > 优惠 >开源软件>文章详情

Skyvern：利用大语言模型（LLMs）和计算机视觉技术，实现了基于浏览器的工作流程的自动化

推荐人：暴走AI| 商城: AI | 1年前 (2024-03-24)| 分类：开源软件 | 热度：355 ℃

已关闭评论

Skyvern：利用大语言模型（LLMs）和计算机视觉技术，实现了基于浏览器的工作流程的自动化

AI

Skyvern利用大语言模型（LLMs）和计算机视觉技术，实现了基于浏览器的工作流程的自动化。它提供了一个简洁的API接口，能够全面自动化手动工作流程，彻底取代那些脆弱或不可靠的自动化解决方案。传统的浏览器自动化方法通常涉及为网站编写定制脚本，这些脚本往往依赖于DOM解析和基于XPath的交互。然而，每当网站布局发生变化时，这些交互就会失效，导致自动化流程中断。与此不同，Skyvern融合了计算机视觉和LLMs技术，能够实时解析视口内的元素，制定交互计划，并与这些元素进行智能交互。

官网：https://www.skyvern.com

GitHub：https://github.com/Skyvern-AI/skyvern

这种方法的优势在于：

Skyvern能够操作从未见过的网站，因为它能够实时将视觉元素映射到完成工作流程所需的动作，无需任何定制代码。
Skyvern对网站布局变化具有很强的适应性，因为它不依赖于预先确定的XPath或其他选择器进行导航。
Skyvern利用LLMs进行交互推理，确保能够应对各种复杂情况。例如，如果您想从Geico获取汽车保险报价，对于“您18岁时是否有资格驾驶？”这一问题，Skyvern能够根据用户16岁获得驾照的事实进行智能推断。
在竞品分析场景中，Skyvern能够理解即使产品规格（如Arnold Palmer的罐装尺寸）存在细微差异，它们也可能是同一产品，从而避免了因数据误差导致的分析偏差。

Skyvern：利用大语言模型（LLMs）和计算机视觉技术，实现了基于浏览器的工作流程的自动化

Skyvern

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：号称是Loom 的开源替代品！跨平台屏幕录制软件Cap

下一篇：基于Docker的端到端开发者平台—Appwrite

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录