AI 发展到后半场「大雾散去」,如何让大模型的智力落实成执行力,智能体似乎成了业界的共同答案。从元宝到混元,各类智能体平台如雨后春笋般涌现。上个月,智谱发布 AutoGLM 的发布会上,智能体好像突破了次元壁,一句指令,就拿着手机在现场发了一个总计两万块钱的红包。我们正在见证一个重要的转折点:智能体正在将 AI 的能力从「能说会道」转变为「能做会干」。作为最强大模型厂商的有力竞争者,Anthropic 推出的智能体功能也着实惊艳了我们一把。Computer Use 甚至已经可以做到跟 Claude 说一声想做一个 90 年代风格的个人网站,剩下的只需要坐在屏幕前看网页自己做自己就好了。在过去一年中,Anthropic 与数十个行业团队合作,对大模型智能体进行了系统研究。但他们发现,那些表现最出色的 AI 智能体,并非建立在庞大复杂的框架或专业库之上,而是采用了简单、可组合的模式。Anthropic 将一年的实践经验总结成了这篇博客,机器之心在不改变原意的基础上进行了编译。
什么时候该用智能体?在开发 AI 应用时,Anthropic 的研究团队给出了一个建议:能简单就不要复杂。有时候,根本不需要建造一个智能系统 —— 因为智能系统虽然功能强大,但往往会让响应变慢,成本也会更高。开发者需要权衡这种取舍。当确实需要更复杂的系统时,工作流适合需要可预测和一致性的明确任务,而智能体则更适合需要灵活性和模型驱动决策的大规模场景。不过对很多应用来说,配合检索和上下文示例,拿着一个好的 prompt 去问大模型通常就足够了。何时使用框架以及如何使用目前,有多个可以帮助开发者更容易地搭建 AI 智能体的框架,包括:
LangChain 的 LangGraph
亚马逊 Bedrock 的 AI Agent 框架
拖放式的大模型工作流构建工具 Rivet
用于构建和测试复杂工作流的 GUI 工具 Vellum
这些框架确实简化了 AI 开发流程。但要注意的是,它们会在代码中增加额外的抽象层,这不仅让底层的运行逻辑变得不够透明,也增加了调试的难度。而且,开发者可能会在一些简单的场景中,不自觉地引入过度复杂的解决方案。Anthropic 建议开发者从直接使用大模型的 API 开始:许多模式只需几行代码就能实现。如果选择使用框架,一定要理解其底层原理。经验表明,对框架底层机制的理解不足,往往是导致开发问题的主要原因。具体示例请参考 Anthropic 的 cookbook。
除此之外,Anthropic 最近发布的模型上下文协议提供了一种新的实现方式。这个协议让开发者可以通过简洁的客户端代码,轻松地将 AI 模型与持续扩展的第三方工具生态系统进行集成。工作流:提示链提示链是一种将复杂任务拆解为多个步骤的方法,每个步骤代表调用一次大模型,后一步将基于前一步的结果继续处理。开发者可以在任意中间环节加入程序化的检查点(比如图中的「gate」),以确保流程按预期推进。 提示链工作流。什么时候更适合用提示链工作流呢?当一个复杂任务能够被清晰地拆分成一系列固定的子任务时,提示链就是最佳选择。这种方法让每个模型只需专注完成一个简单任务,虽然整体响应时间可能会略长,但准确率会得到显著提升。典型应用案例: