genai的新潮流：如何利用智能体的力量 -凯发在线

责任编辑：cres 作者：suresh bansal |来源：企业网d1net 2024-08-19 16:00:07 原创文章企业网d1net

ai和机器学习的发展历程是颠覆性的。最初，我们从手动编码转向通过数据训练计算机。在早期阶段，ai只能处理特定任务，例如分类和物体识别——这些是它们经过明确训练后能够执行的功能。

但这一切在2022年底随着openai推出chatgpt而发生了改变，这一突破性工具不仅可以生成内容，还能执行各种任务，迅速吸引了全球数百万人的关注。正如gartner在2023年ai技术成熟度曲线中所指出的那样，genai已经达到了“膨胀期的顶峰”，预计将在未来5到10年内进入“生产力平台期”。

克服挑战与局限性

根据gartner的定义，达到生产力平台期意味着ai将被广泛采用，其优势将得到明确定义，并有清晰的实施指南。要实现这一目标，我们首先必须解决当前ai技术的局限性，并探索如何通过智能体来克服这些挑战。

尽管当今的大型语言模型（llms）在生成电子邮件、写作文章和进行情感分析等任务上表现出色，但它们在处理复杂任务时仍然存在困难，例如复杂的数学计算或多步骤问题解决。此外，llms还存在其他显著的局限性：

• 幻觉或误导性输出

• 技术限制，如有限的上下文长度和内存

• 输出中的偏见

• 可能产生有害或不当言论

• 知识有限（例如，chatgpt 3.5的知识截止日期为2021年9月）

有趣的是，这些挑战与我们人类所面临的问题并无太大不同。我们也容易犯错误、存在偏见、记忆有限，有时甚至会做出有害的回应。为了管理这些不足，我们通常会：

• 在线寻找信息，使用excel和word等工具。

• 多次修改我们的工作以纠正错误并提高质量。

• 寻求同事和导师的反馈，并吸收他们的见解。

• 团队合作以取得更好的结果。

通过应用类似的策略，我们可以改进大型语言模型（llm）的输出，从而引出genai智能体的概念。

什么是genai智能体？

genai智能体旨在克服当前llm的许多局限性，能够执行单一模型无法处理的复杂任务。例如，如果你想从一个数据集中识别出按收入排名前三的公司，智能体将会：

• 获取所有公司的收入数据。

• 按收入对公司进行排序。

• 返回排名前三的公司。

为了实现这一目标，智能体将llm与关键组件结合起来，如规划、记忆和工具：

• 规划：智能体使用llm制定并执行计划。

• 记忆：智能体在执行多个步骤时保留信息，从而能够处理复杂任务。

• 工具：智能体使用各种工具来执行特定任务，以下将对此进行更详细的讨论。

genai智能体的关键特性

genai智能体被设计为：

• 规划和执行任务

• 反思结果

• 使用工具实现特定目标

• 在最少的人工干预下运行

此类智能体的例子包括网站建设工具、从excel表格中提供见解的数据分析师，以及根据用户输入规划旅行的旅游代理。

工具在genai智能体中的作用

工具对于智能体至关重要，使其能够有效地执行任务。在genai的领域中，工具使llm智能体能够与外部环境和应用程序进行交互，例如进行互联网搜索、代码解释器和数学引擎等，这些工具可以访问数据库、知识库以及外部模型。

例如，一个旅行代理需要工具来搜索和预订航班，还需要搜索互联网的工具。其他工具可能包括：

• 实体提取：从非结构化文档中提取特定信息。

• chat db：无需sql知识即可从数据库中检索信息。

• 知识机器人：使用检索增强生成（rag）技术，根据自定义知识库回答问题。

• 互联网搜索：根据用户查询从搜索引擎获取内容。

• 摘要生成：为大型文档提供针对特定角色的摘要。

• 程序执行：执行python代码以解决特定问题。

• 维基百科搜索：根据用户查询从维基百科检索内容。

• 比较：回答比较性问题，如性能指标或产品推荐。

智能体设计模式

为了执行复杂任务，智能体必须有效地协调这些工具。基于andrew ng的讲座，已经出现了几种智能体设计模式：

• 反思：llm评估自己的工作以改进输出。

• 工具使用：llm利用工具，如网络搜索或代码执行，来收集信息和处理数据。

• 规划：llm制定多步骤计划以实现目标，然后执行该计划。

• 多智能体协作：多个ai智能体协作，分配任务并讨论想法，以寻找更好的凯发在线的解决方案。

尽管前两种模式会产生可预测的结果，但后两种仍处于实验阶段。

llm智能体框架

基于对智能体、工具和设计模式的理解，规划模式的一种变体逐渐形成。这个框架包括定义一个任务或目标，然后通过迭代的方式规划并执行下一个动作，接着进入反馈循环。

一个llm智能体由核心组件组成：

• 大脑/llm：作为协调者。

• 记忆（向量数据库）：存储中间步骤和结果。

短期记忆：在上下文窗口内保存上下文信息。

长期记忆：一个外部的向量存储，提供相关的上下文信息。

• 工具/互联网：使智能体能够执行任务，如网络搜索或程序执行。

• 政策：通过设计确保信任，防止处理有害输入。

智能体的未来

genai的未来在于智能体与人类的协作。试想一个世界，医生、设计师和客户服务代表都由增强其能力的智能体支持。从科学发现到艺术创作，可能性是无穷的。

对于企业而言，将genai智能体融入运营中可以带来战略优势，释放出新的效率提升、个性化服务和问题解决能力，这些智能体不会取代人类的创造力，而是会增强它，推动一个充满创新和进步的未来。

企业网d1net(www.d1net.com)：

国内主流的to b it门户，旗下运营国内最大的甲方cio专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个it行业公众号(微信搜索d1net即可关注)。

关键字：凯发在线

热文

高端访谈更多

cio：全数字化时代，你做好转型准备了吗？

国药国际cio冯伟：数字化转型要打破信息化建系统的固有思维

热点专题更多

飞利浦商用显示器:智能科技助力高效工作

企业出海

电子周刊

当前位置：人工智能 → 行业动态 → 正文