各家出的Deep Researcher汇总:
1. 谷歌 Gemini 搜索智能体 (Google Gemini Search Agent)
来源:
github.com摘要: 这个 GitHub 仓库提供了一个快速入门指南,用于使用 Gemini 2.5 和 LangGraph 构建一个全栈应用程序。该应用包含一个 React 前端和一个由 LangGraph 驱动的后端智能体,该智能体通过动态生成搜索查询、使用谷歌搜索 API、反思结果以填补知识空白,并迭代优化搜索来生成引用充分的答案,从而进行全面的研究。主要功能包括用于开发的热重载、用于一次性查询的命令行界面(CLI),以及使用 Docker 和 docker-compose 的部署说明。该项目采用 Apache 2.0 许可证,并强调模块化结构,为本地开发和生产环境提供了清晰的设置说明。
2. OpenAI 深度研究 (OpenAI Deep Research)
来源:
openai.com摘要: OpenAI 于 2025 年 2 月 2 日在 ChatGPT 中引入了“深度研究”功能,这是一个多步研究智能体,由一个为网页浏览和数据分析优化的 o3 模型版本驱动。它能进行广泛的在线研究,将数百个来源的信息综合成长篇报告,以应对金融、科学和消费者研究等领域的复杂任务。该系统处理每个查询需要 5-30 分钟,并提供详细、带引用的输出。它在 Humanity’s Last Exam (准确率 26.6%) 和 GAIA (平均 pass@1 为 67.36%) 等基准测试中表现出色,超越了以前的模型。其局限性包括偶尔的幻觉和置信度校准问题。初期,Pro 用户可使用(每月 100 次查询),并计划扩展到 Plus、Team 和 Enterprise 用户。
3. Anthropic 多智能体研究系统
来源:
www.anthropic.com摘要: Anthropic 详细介绍了其 Claude 多智能体研究系统的开发过程,该系统使用一个主导智能体来协调并行的子智能体,以执行复杂的研究任务。该系统在广度优先的查询中表现出色,在内部评估中,其性能比单智能体的 Claude Opus 4 提升了 90.2%。关键原则包括有效的上下文工程、并行工具调用和用于管理子智能体协调的提示工程。挑战包括 Token 密集型操作、调试非确定性行为,以及通过持久化执行和可观测性来确保生产环境的可靠性。该系统针对读取密集型任务进行了优化,而写作任务则由主导智能体统一完成,以避免协同输出的复杂性。
4. JinaAI 深度研究指南 (JinaAI Deep(Re)Search Guide)
来源:
jina.ai摘要: 由于文档中未提供此文章,因此无法生成直接的摘要。根据标题和 URL 判断,它很可能提供了一份实现深度研究系统的实用指南,可能会讨论用于构建 AI 驱动的研究智能体的框架(如 DeepSearch 或 DeepResearch)。它可能涵盖技术实现细节、最佳实践或集成此类系统的案例研究,并可能引用其他文档中讨论的 LangGraph 或类似框架等工具。
5. 字节跳动 DeerFlow
来源:
deerflow.tech摘要: DeerFlow 被介绍为一个个人深度研究助手,它由一个采用“主管+移交”(Supervisor + Handoffs)设计的多智能体架构驱动。它利用搜索引擎、网络爬虫、Python 和 MCP 服务等工具,提供即时见解、综合报告和播客。该平台强调社区协作,并采用 MIT 许可证,鼓励开源贡献。简短的描述强调了其专注于高效研究与探索(DEER: Deep Exploration and Efficient Research),但缺乏详细的技术或性能细节。
6. 实现 DeepSearch/DeepResearch 的实用指南
来源:
jina.ai摘要: 这是对上述 JinaAI 指南的重复引用。由于没有提供文档内容,摘要保持不变:它很可能提供实现深度研究系统的实用指南,可能涵盖构建 AI 驱动的研究智能体的框架、工具或方法论,类似于 OpenAI、Anthropic 或谷歌 Gemini 文档中讨论的内容。
7. 如何以及何时构建多智能体系统
来源:
blog.langchain.com摘要: 这篇发表于 2025 年的 LangChain 博客文章,综合了 Anthropic 的多智能体研究系统的见解和 Cognition 对多智能体系统的警示。文章强调,多智能体系统在读取密集型、可并行的任务(如研究)中表现出色,因为子智能体可以探索独立的方向;但由于上下文和输出协调的挑战,它们不太适合写作密集型任务(如编码)。关键点包括:上下文工程对于有效智能体通信的重要性,以及需要强大的工具(如 LangGraph、LangSmith)来实现持久化执行、调试和评估。对于需要大量信息收集的高价值、Token 密集型任务,推荐使用多智能体系统。
8. Kimi-Researcher: 面向新兴智能体能力的端到端强化学习训练
来源:
moonshotai.github.io摘要: Kimi-Researcher 于 2025 年 6 月 20 日发布,是一个基于内部 Kimi k 系列模型构建的自主智能体,通过端到端强化学习(RL)进行训练。它在多轮搜索和推理方面表现出色,在 Humanity’s Last Exam 基准测试中取得了 26.9% 的 Pass@1 的顶尖水平,在 xbench-DeepSearch 上达到了 69%。它使用并行搜索、网页浏览和编码等工具,通过上下文管理来处理长周期任务,支持超过 50 次迭代。使用 REINFORCE 算法、同策略数据(on-policy data)和合成数据集进行的强化学习训练,使其具备了强大的泛化能力。其涌现出的能力包括解决冲突信息和进行严格的交叉验证。未来的计划包括开源该模型并扩展其工具集。