科学工具

科学工具让世界更美好

让世界更美好

谷歌开放协议Agent2Agent (A2A)为 AI 代理生态系统提供通用的通信标准，实现跨平台、跨应用的智能体协作

谷歌推出新开放协议Agent2Agent (A2A)，为AI代理生态系统提供通用通信标准，推动跨平台、跨应用智能体协作，提升生产力，自动化复杂工作流程，降低长期成本。

A2A：智能体的“通用语言”

企业内部的AI智能体，其来源、技术栈各异，服务不同业务系统，像客户关系管理、人力资源管理、供应链管理等。A2A协议出现前，这些智能体难以沟通协作，限制AI解决复杂问题的能力。A2A打破了这些系统间的壁垒，让不同来源、技术的智能体可交流、交换信息，协同执行跨企业平台或应用的复杂任务，如同制定统一沟通规则和工作流程，让智能体高效合作。

生态支持：超50家合作伙伴助力

A2A协议发布后超50家技术合作伙伴和领先服务提供商支持A2A，像Atlassian、Box等技术和平台机构，Accenture、BCG等服务机构。技术伙伴和服务提供商对生态的支持，让A2A有望成为未来智能体交互的事实标准。

A2A的核心设计原则

谷歌和合作伙伴设计A2A协议遵循五个关键原则。

拥抱智能体原生能力：A2A让智能体以自然、非结构化方式协作，不局限为简单“工具”，实现真正多智能体场景。

基于现有标准构建：协议以HTTP、SSE、JSON - RPC等广泛使用的现有标准为基础，方便企业集成到现有IT技术栈，无需重新搭建复杂数据传输通道。

默认安全：A2A支持企业级身份验证和授权，发布时与OpenAPI身份验证方案对等，保障数据传输安全合规，防止数据泄露。

支持长时任务：协议灵活，能处理快速任务和需长时间（可能有人工介入）的深度研究任务，还能提供实时反馈、通知和状态更新。

模态无关：A2A支持音频、图像、视频流等多种模态，提供更丰富交互方式。

A2A的工作原理

A2A协议核心是促进客户端智能体和远程智能体通信。客户端智能体制定和传达任务，远程智能体执行任务提供信息或行动。交互过程包含以下关键能力：

能力发现：能提供服务的智能体准备电子“名片”（Agent Card），以JSON格式描述自身信息，客户端智能体读取名片找最适合任务执行的远程智能体并发起A2A通信。

任务管理：客户端智能体将工作要求打包成“工作委托单”（Task），任务有完整生命周期，过程可同步状态，完成后生成“交付物”。

协作：智能体间互发“消息”传递信息，实现多智能体协同工作。

用户体验协商：每条消息含多个“内容部分”，每个部分有指定内容类型，方便双方协商正确格式和用户界面能力，根据用户需求和设备能力提供最佳用户体验。

A2A与MCP：互补关系

A2A协议对Anthropic公司模型上下文协议（MCP）起补充作用。MCP关注连接LLM与数据、资源和工具，类似连接AI模型与各种源和工具的“USB - C接口”；A2A专注不同智能体间自然协作和通信。谷歌希望A2A与MCP相互补充推动智能体生态系统发展。

应用场景

A2A协议潜力大，在多场景发挥关键作用：

招聘流程可自动化，不同智能体协作完成候选人搜寻、面试安排和背景调查等。

跨企业应用能自动化工作流程，如电商平台订单管理智能体与库存管理系统智能体实时交互，打破数据孤岛。

复杂问题解决和知识整合方面，促进专业化智能体开发，不同智能体协作汇集知识和能力，如新药研发。

可个性化用户体验和多模态交互，根据用户设备和界面能力协商内容呈现方式，支持多种模态交互。

跨组织协作方面，支持不同组织智能体沟通，如汽车修理厂智能体与零件供应商智能体查询订购零件。

Together Open Deep Research由AI驱动的深度研究工具，能生成含引用的综合性报告

Python A2A：Google A2A协议的Python实现，集成MCP，用于构建可互操作的多智能体系统

DeepSeek-RAG-Chatbot 结合检索增强生成（RAG）技术的聊天机器人

XianyuAutoAgent 智能闲鱼客服机器人系统

Zerox OCR 开源 AI 文档工具，将 PDF、DOCX、图片等格式转换为 Markdown

Agent-Wiz：用于威胁建模和可视化AI代理的CLI工具

Seed-Thinking-v1.5 强化学习训练推理模型

谷歌开放协议Agent2Agent (A2A)为 AI 代理生态系统提供通用的通信标准，实现跨平台、跨应用的智能体协作

Lumina-mGPT 2.0 自回归图像生成模型，支持多种图像生成任务

Eko框架：开源JavaScript AI代理工具，构建AI Agent 工作流

播放器工具

大语言模型

Umi-OCR 开源免费的离线 OCR 软件，支持截图、批量导入图片、PDF文档识别，去除水印、页眉和页脚等

EasyRecovery 数据恢复软件

AI-ClothingTryOn 基于 Google Gemini API 的 AI虚拟试衣应用

TrafficMonitor 桌面悬浮窗软件，显示当前的网速、CPU 利用率和内存利用率

WhatsApp MCP Server：连接Claude管理个人消息的AI工具

MCP Server for Milvus 让LLM应用可以通过模型上下文协议(MCP)访问Milvus向量数据库的功能

Flowise 零代码搭建AI应用

IOPaint 基于AI模型的图像修复工具

Pake打包工具：可将网页快速打包成桌面应用

notion-mcp-server：Notion API的MCP服务器实现，支持通过指令或内容ID与Notion交互

Zerox OCR 开源 AI 文档工具，将 PDF、DOCX、图片等格式转换为 Markdown

DeepSeek-RAG-Chatbot 结合检索增强生成（RAG）技术的聊天机器人

插件化、定制化、无广告的免费音乐播放器 MusicFree

Reubah 基于网页的图像处理与文档转换工具

Ward服务器监控工具

Escrcpy ：基于 Scrcpy 的图形化安卓手机投屏+控制软件，支持Windows、macOS、Linux

KrillinAI 基于LLMs的本地视频翻译、配音和语音克隆的工具

MarkitDown：可以将PDF，PPT，word，Excel、图片、音频、html、csv 等转化成Markdown格式

Together Open Deep Research由AI驱动的深度研究工具，能生成含引用的综合性报告

LLManager 用于管理审批请求的 LangGraph 工作流

Python A2A：Google A2A协议的Python实现，集成MCP，用于构建可互操作的多智能体系统

OpenAI.fm 基于 OpenAI Text-to-Speech 模型的交互式演示项目，使用 OpenAI Speech API 将文本转换成语音