智能体工具及与 MCP 的互操作性
Agent Tools & Interoperability with MCP
作者:Mike Styer、Kanchana Patlolla、Madhuranjan Mohan 和 Sal Diaz
Unifying Agents, Tools, and the World
统一智能体、工具和世界
引言:模型、工具和智能体
Introduction: Models, Tools and Agents
如果无法访问外部功能,即使是最先进的基础模型也只是一个模式预测引擎。一个高级模型可以做好很多事情——通过法律 考试,编写代码或者写诗,创建图像和视频,解决数学问题——但它自身只能根据之前训练过的数据生成内容。除了请求上下文中输入的数据外,它无法访问任何关于世界的新数据;它无法与外部系统交互;也无法采取任何行动来影响其环境。
个人注:LLM驱动的智能体;后训练阶段的能力。
大多数现代基础模型现在都具备调用外部函数或工具的能力,以克服这一局限性。就像智能手机上的应用程序一样,工具使人工智能系统能够做的不仅仅是生成模式。这些工具充当智能体的“眼睛”和“手”,使其能够感知世界并与之互动。
随着智能体 AI(Agentic AI)的到来,工具对 AI 系统变得愈发重要。AI 智能体利用基础模型的推理能力与用户进行交互,并为他们实现特定的目标,而外部工具则赋予了智能体这一能力。通过拥有执行外部操作的能力,智能体可以对企业级应用产生巨大的影响。
然而,将外部工具连接到基础模型面临着重大挑战,这其中既包括基本的技术问题,也涉及重要的安全风险。模型上下文协议(Model Context Protocol,简称 MCP)于 2024 年推出,旨在简化工具与模型的集成流程,并解决其中的部分技术与安全挑战。
在本白皮书中,我们首先探讨基础模型所使用工具的本质:它们是什么以及如何使用它们。我们为如何设计高效的工具以及如何高效地使用它们提供了一些最佳实践和指南。随后,我们转向模型上下文协议(MCP),讨论其基本组件以及它所带来的一些挑战与风险。最后,我们深入剖析当 MCP 被引入企业环境并连接到高价值外部系统时,所带来的安全挑战。