随着越来越多的企业组织展望智能体未来,一个主要障碍可能是AI模型的构建方式。对于企业AI开发者AI21来说,答案很明确:行业需要转向其他模型架构以实现更高效的AI智能体。
Transformer的局限性
AI21首席执行官Ari Goshen在接受VentureBeat采访时指出,最流行的模型架构Transformer有局限性,这将使多智能体生态系统变得困难。
“我看到的一个趋势是非Transformer架构的兴起,这些替代架构将更加高效,”Goshen说。“Transformer通过生成大量Token来实现功能,这可能会非常昂贵。”
替代架构的优势
AI21此前曾提出,Transformer应该作为模型架构的一个选项,而不是默认选项。该公司正在使用其JAMBA架构(Joint Attention and Mamba架构的缩写)开发基础模型。JAMBA架构基于普林斯顿大学和卡内基梅隆大学的研究人员开发的Mamba架构,可以提供更快的推理时间和更长的上下文。
Goshen表示,像Mamba和Jamba这样的替代架构通常可以使智能体结构更高效,更重要的是,更实惠。基于Mamba的模型具有更好的内存性能,这将使智能体,特别是连接到其他模型的智能体,工作得更好。
智能体的发展现状
Goshen将AI智能体现在才开始流行——以及为什么大多数智能体尚未进入产品阶段——归因于对使用Transformer构建的大语言模型的依赖。
“智能体尚未进入生产模式的主要原因是不够可靠,”Goshen说。“当你分解一个Transformer模型时,你知道它是高度随机的,因此任何错误都会持续存在。”
企业智能体的崛起
AI智能体成为今年企业AI的最大趋势之一。几家公司推出了AI智能体和平台,使其易于构建智能体。
- ServiceNow:宣布更新其Now Assist AI平台,包括一个面向客户的AI智能体库。
- Salesforce:拥有名为Agentforce的智能体系列。
- Slack:开始允许用户集成来自Salesforce、Cohere、Workday、Asana、Adobe等的智能体。
Goshen认为,随着正确的模型和模型架构的结合,这一趋势将变得更加流行。
“我们现在看到的一些用例,比如聊天机器人中的问答,基本上是经过美化的搜索,”他说。“我认为真正的智能在于连接和从不同来源检索信息。”
AI21的产品开发
AI21正在开发围绕AI智能体的产品,以实现更高效和可靠的智能体系统。
其他架构的竞争
Goshen强烈支持像Mamba和AI21的Jamba这样的替代架构,主要是因为他认为Transformer模型过于昂贵且难以运行。
与Transformer模型的注意力机制不同,Mamba可以优先处理不同数据并分配输入权重,优化内存使用,并利用GPU的处理能力。
Mamba越来越受欢迎。其他开源和开放权重的AI开发者在过去几个月中开始发布基于Mamba的模型。例如,Mistral在7月发布了Codestral Mamba 7B,而在8月,Falcon推出了自己的基于Mamba的模型Falcon Mamba 7B。
然而,Transformer架构仍然是开发基础模型的默认选择。OpenAI的GPT当然是Transformer模型——它的名字中就有——但大多数其他流行模型也是如此。
未来的展望
Goshen表示,最终,企业会选择更可靠的方法。但组织也必须警惕那些承诺解决许多问题的炫目演示。
“我们正处于一个容易进行有魅力的演示的阶段,但我们离产品阶段更近,”Goshen说。“使用企业AI进行研究是可以的,但它还没有达到企业可以用来指导决策的程度。”(来源)
0条评论