科学工具
科学工具让世界更美好
让世界更美好

谷歌开放协议Agent2Agent (A2A)为 AI 代理生态系统提供通用的通信标准,实现跨平台、跨应用的智能体协作谷歌开放协议Agent2Agent (A2A)为 AI 代理生态系统提供通用的通信标准,实现跨平台、跨应用的智能体协作

谷歌推出新开放协议Agent2Agent (A2A),为AI代理生态系统提供通用通信标准,推动跨平台、跨应用智能体协作,提升生产力,自动化复杂工作流程,降低长期成本。

A2A:智能体的“通用语言”

企业内部的AI智能体,其来源、技术栈各异,服务不同业务系统,像客户关系管理、人力资源管理、供应链管理等。A2A协议出现前,这些智能体难以沟通协作,限制AI解决复杂问题的能力。A2A打破了这些系统间的壁垒,让不同来源、技术的智能体可交流、交换信息,协同执行跨企业平台或应用的复杂任务,如同制定统一沟通规则和工作流程,让智能体高效合作。

生态支持:超50家合作伙伴助力

A2A协议发布后超50家技术合作伙伴和领先服务提供商支持A2A,像Atlassian、Box等技术和平台机构,Accenture、BCG等服务机构。技术伙伴和服务提供商对生态的支持,让A2A有望成为未来智能体交互的事实标准。

A2A的核心设计原则

谷歌和合作伙伴设计A2A协议遵循五个关键原则。

拥抱智能体原生能力:A2A让智能体以自然、非结构化方式协作,不局限为简单“工具”,实现真正多智能体场景。

基于现有标准构建:协议以HTTP、SSE、JSON - RPC等广泛使用的现有标准为基础,方便企业集成到现有IT技术栈,无需重新搭建复杂数据传输通道。

默认安全:A2A支持企业级身份验证和授权,发布时与OpenAPI身份验证方案对等,保障数据传输安全合规,防止数据泄露。

支持长时任务:协议灵活,能处理快速任务和需长时间(可能有人工介入)的深度研究任务,还能提供实时反馈、通知和状态更新。

模态无关:A2A支持音频、图像、视频流等多种模态,提供更丰富交互方式。

A2A的工作原理

A2A协议核心是促进客户端智能体和远程智能体通信。客户端智能体制定和传达任务,远程智能体执行任务提供信息或行动。交互过程包含以下关键能力:

能力发现:能提供服务的智能体准备电子“名片”(Agent Card),以JSON格式描述自身信息,客户端智能体读取名片找最适合任务执行的远程智能体并发起A2A通信。

任务管理:客户端智能体将工作要求打包成“工作委托单”(Task),任务有完整生命周期,过程可同步状态,完成后生成“交付物”。

协作:智能体间互发“消息”传递信息,实现多智能体协同工作。

用户体验协商:每条消息含多个“内容部分”,每个部分有指定内容类型,方便双方协商正确格式和用户界面能力,根据用户需求和设备能力提供最佳用户体验。

A2A与MCP:互补关系

A2A协议对Anthropic公司模型上下文协议(MCP)起补充作用。MCP关注连接LLM与数据、资源和工具,类似连接AI模型与各种源和工具的“USB - C接口”;A2A专注不同智能体间自然协作和通信。谷歌希望A2A与MCP相互补充推动智能体生态系统发展。

应用场景

A2A协议潜力大,在多场景发挥关键作用:

招聘流程可自动化,不同智能体协作完成候选人搜寻、面试安排和背景调查等。

跨企业应用能自动化工作流程,如电商平台订单管理智能体与库存管理系统智能体实时交互,打破数据孤岛。

复杂问题解决和知识整合方面,促进专业化智能体开发,不同智能体协作汇集知识和能力,如新药研发。

可个性化用户体验和多模态交互,根据用户设备和界面能力协商内容呈现方式,支持多种模态交互。

跨组织协作方面,支持不同组织智能体沟通,如汽车修理厂智能体与零件供应商智能体查询订购零件。