AI21首席执行官表示,由于错误持续存在,Transformer架构模型不适合AI智能体

| 分类: AI情报 | 热度: 1 ℃

随着越来越多的企业组织展望智能体未来,一个主要障碍可能是AI模型的构建方式。对于企业AI开发者AI21来说,答案很明确:行业需要转向其他模型架构以实现更高效的AI智能体。

Transformer的局限性

AI21首席执行官Ari Goshen在接受VentureBeat采访时指出,最流行的模型架构Transformer有局限性,这将使多智能体生态系统变得困难。

“我看到的一个趋势是非Transformer架构的兴起,这些替代架构将更加高效,”Goshen说。“Transformer通过生成大量Token来实现功能,这可能会非常昂贵。”

替代架构的优势

AI21此前曾提出,Transformer应该作为模型架构的一个选项,而不是默认选项。该公司正在使用其JAMBA架构(Joint Attention and Mamba架构的缩写)开发基础模型。JAMBA架构基于普林斯顿大学和卡内基梅隆大学的研究人员开发的Mamba架构,可以提供更快的推理时间和更长的上下文。

Goshen表示,像Mamba和Jamba这样的替代架构通常可以使智能体结构更高效,更重要的是,更实惠。基于Mamba的模型具有更好的内存性能,这将使智能体,特别是连接到其他模型的智能体,工作得更好。

智能体的发展现状

Goshen将AI智能体现在才开始流行——以及为什么大多数智能体尚未进入产品阶段——归因于对使用Transformer构建的大语言模型的依赖。

“智能体尚未进入生产模式的主要原因是不够可靠,”Goshen说。“当你分解一个Transformer模型时,你知道它是高度随机的,因此任何错误都会持续存在。”

企业智能体的崛起

AI智能体成为今年企业AI的最大趋势之一。几家公司推出了AI智能体和平台,使其易于构建智能体。

  • ServiceNow:宣布更新其Now Assist AI平台,包括一个面向客户的AI智能体库。
  • Salesforce:拥有名为Agentforce的智能体系列。
  • Slack:开始允许用户集成来自Salesforce、Cohere、Workday、Asana、Adobe等的智能体。

Goshen认为,随着正确的模型和模型架构的结合,这一趋势将变得更加流行。

“我们现在看到的一些用例,比如聊天机器人中的问答,基本上是经过美化的搜索,”他说。“我认为真正的智能在于连接和从不同来源检索信息。”

AI21的产品开发

AI21正在开发围绕AI智能体的产品,以实现更高效和可靠的智能体系统。

其他架构的竞争

Goshen强烈支持像Mamba和AI21的Jamba这样的替代架构,主要是因为他认为Transformer模型过于昂贵且难以运行。

与Transformer模型的注意力机制不同,Mamba可以优先处理不同数据并分配输入权重,优化内存使用,并利用GPU的处理能力。

Mamba越来越受欢迎。其他开源和开放权重的AI开发者在过去几个月中开始发布基于Mamba的模型。例如,Mistral在7月发布了Codestral Mamba 7B,而在8月,Falcon推出了自己的基于Mamba的模型Falcon Mamba 7B。

然而,Transformer架构仍然是开发基础模型的默认选择。OpenAI的GPT当然是Transformer模型——它的名字中就有——但大多数其他流行模型也是如此。

未来的展望

Goshen表示,最终,企业会选择更可靠的方法。但组织也必须警惕那些承诺解决许多问题的炫目演示。

“我们正处于一个容易进行有魅力的演示的阶段,但我们离产品阶段更近,”Goshen说。“使用企业AI进行研究是可以的,但它还没有达到企业可以用来指导决策的程度。”(来源

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论