即刻App年轻人的同好社区
下载
App内打开
J杰克
52关注36被关注0夸夸
独立开发者
写过多年代码,做过多年产品
面对自己,面对世界
J杰克
1天前
各家出的Deep Researcher汇总:

1. 谷歌 Gemini 搜索智能体 (Google Gemini Search Agent)
来源: github.com
摘要: 这个 GitHub 仓库提供了一个快速入门指南,用于使用 Gemini 2.5 和 LangGraph 构建一个全栈应用程序。该应用包含一个 React 前端和一个由 LangGraph 驱动的后端智能体,该智能体通过动态生成搜索查询、使用谷歌搜索 API、反思结果以填补知识空白,并迭代优化搜索来生成引用充分的答案,从而进行全面的研究。主要功能包括用于开发的热重载、用于一次性查询的命令行界面(CLI),以及使用 Docker 和 docker-compose 的部署说明。该项目采用 Apache 2.0 许可证,并强调模块化结构,为本地开发和生产环境提供了清晰的设置说明。

2. OpenAI 深度研究 (OpenAI Deep Research)
来源: openai.com
摘要: OpenAI 于 2025 年 2 月 2 日在 ChatGPT 中引入了“深度研究”功能,这是一个多步研究智能体,由一个为网页浏览和数据分析优化的 o3 模型版本驱动。它能进行广泛的在线研究,将数百个来源的信息综合成长篇报告,以应对金融、科学和消费者研究等领域的复杂任务。该系统处理每个查询需要 5-30 分钟,并提供详细、带引用的输出。它在 Humanity’s Last Exam (准确率 26.6%) 和 GAIA (平均 pass@1 为 67.36%) 等基准测试中表现出色,超越了以前的模型。其局限性包括偶尔的幻觉和置信度校准问题。初期,Pro 用户可使用(每月 100 次查询),并计划扩展到 Plus、Team 和 Enterprise 用户。

3. Anthropic 多智能体研究系统
来源: www.anthropic.com
摘要: Anthropic 详细介绍了其 Claude 多智能体研究系统的开发过程,该系统使用一个主导智能体来协调并行的子智能体,以执行复杂的研究任务。该系统在广度优先的查询中表现出色,在内部评估中,其性能比单智能体的 Claude Opus 4 提升了 90.2%。关键原则包括有效的上下文工程、并行工具调用和用于管理子智能体协调的提示工程。挑战包括 Token 密集型操作、调试非确定性行为,以及通过持久化执行和可观测性来确保生产环境的可靠性。该系统针对读取密集型任务进行了优化,而写作任务则由主导智能体统一完成,以避免协同输出的复杂性。

4. JinaAI 深度研究指南 (JinaAI Deep(Re)Search Guide)
来源: jina.ai
摘要: 由于文档中未提供此文章,因此无法生成直接的摘要。根据标题和 URL 判断,它很可能提供了一份实现深度研究系统的实用指南,可能会讨论用于构建 AI 驱动的研究智能体的框架(如 DeepSearch 或 DeepResearch)。它可能涵盖技术实现细节、最佳实践或集成此类系统的案例研究,并可能引用其他文档中讨论的 LangGraph 或类似框架等工具。

5. 字节跳动 DeerFlow
来源: deerflow.tech
摘要: DeerFlow 被介绍为一个个人深度研究助手,它由一个采用“主管+移交”(Supervisor + Handoffs)设计的多智能体架构驱动。它利用搜索引擎、网络爬虫、Python 和 MCP 服务等工具,提供即时见解、综合报告和播客。该平台强调社区协作,并采用 MIT 许可证,鼓励开源贡献。简短的描述强调了其专注于高效研究与探索(DEER: Deep Exploration and Efficient Research),但缺乏详细的技术或性能细节。

6. 实现 DeepSearch/DeepResearch 的实用指南
来源: jina.ai
摘要: 这是对上述 JinaAI 指南的重复引用。由于没有提供文档内容,摘要保持不变:它很可能提供实现深度研究系统的实用指南,可能涵盖构建 AI 驱动的研究智能体的框架、工具或方法论,类似于 OpenAI、Anthropic 或谷歌 Gemini 文档中讨论的内容。

7. 如何以及何时构建多智能体系统
来源: blog.langchain.com
摘要: 这篇发表于 2025 年的 LangChain 博客文章,综合了 Anthropic 的多智能体研究系统的见解和 Cognition 对多智能体系统的警示。文章强调,多智能体系统在读取密集型、可并行的任务(如研究)中表现出色,因为子智能体可以探索独立的方向;但由于上下文和输出协调的挑战,它们不太适合写作密集型任务(如编码)。关键点包括:上下文工程对于有效智能体通信的重要性,以及需要强大的工具(如 LangGraph、LangSmith)来实现持久化执行、调试和评估。对于需要大量信息收集的高价值、Token 密集型任务,推荐使用多智能体系统。

8. Kimi-Researcher: 面向新兴智能体能力的端到端强化学习训练
来源: moonshotai.github.io
摘要: Kimi-Researcher 于 2025 年 6 月 20 日发布,是一个基于内部 Kimi k 系列模型构建的自主智能体,通过端到端强化学习(RL)进行训练。它在多轮搜索和推理方面表现出色,在 Humanity’s Last Exam 基准测试中取得了 26.9% 的 Pass@1 的顶尖水平,在 xbench-DeepSearch 上达到了 69%。它使用并行搜索、网页浏览和编码等工具,通过上下文管理来处理长周期任务,支持超过 50 次迭代。使用 REINFORCE 算法、同策略数据(on-policy data)和合成数据集进行的强化学习训练,使其具备了强大的泛化能力。其涌现出的能力包括解决冲突信息和进行严格的交叉验证。未来的计划包括开源该模型并扩展其工具集。
00
J杰克
2天前
一个双边市场,首先会迎合其终端用户,然后为了企业客户的利益而压榨这些用户,最后再压榨企业客户,为自己榨取所有剩余价值。
00
J杰克
10天前
顿的任他顿,渐的任他渐;神秀的归于神秀,惠能的归于惠能,一如“繁荣的任它繁荣,干枯的任它干枯”

这世界的美就在于每个人有每个人的特色,统一了反而无趣,所以做好自己,在别人需要时按能力施以援手即可。
00
J杰克
10天前
缺乏慈悲的人,看不到那些须以慈悲之眼才能看到的事物。

一行禅师
00
J杰克
12天前
今天在reddit上看到一个commit,感觉写得很好,摘录一下:
实际上,普通的企业主都是从40岁才开始的。

别去理会媒体对年轻富豪的理想化宣传和社交媒体上的那些叙事。

你还有时间。好的一点是,你正在为此发声并尝试做出改变。

尽可能多地投入时间去学习。强烈地追随你的兴趣。

我决定给自己设定一个学习预算,基本上就是允许自己花尽可能多的钱去学习,无论是买亚马逊的书,还是订阅 trends.co(每年300美元),抑或是 theadvault.co.uk(免费),或者其他什么。我需要向前发展,无论这意味着什么。

不要去学习那些你“应该”学的东西,去学习那些能给你带来活力、让你充满热情的东西。

举个例子,我大学毕业后,当音乐制作人没钱了(我有一段低谷期,然后转行了),我的第一份工作是在音乐行业。在这个行业里,我在洛杉矶的年薪是3.5万美元。不够生活。

于是我开始尝试线上业务,经过一些尝试和错误,有了一两次小成功。后来被公司发现了,他们不喜欢我搞线上业务。所以我就回去上班,说实话,把我的项目藏起来了,但还是坚持做,因为我喜欢。后来等我的编码技术足够好了,我就离开了那个行业,找了一份我更喜欢、工资是两倍、并且允许我发展副业的工作。

所以,是的,尽管追随你的兴趣并保持专注。

我曾多次感到迷茫,但只要坚持下去,并以此作为你的动力。
00
J杰克
13天前
(转) 学好基本功,AI 才能真正助你一臂之力

我最近一直在尝试把AI融入到日常工作中。必须承认,在处理像增删改查(CRUD)、数据解析这类琐碎任务时,AI确实是个神器。你只需要下达指令,它就能帮你搞定,极大地解放了生产力。但软件开发远不止于此,我们还需要整合系统、性能优化、技术研究,这些都需要真正的理解力。

今天在咖啡馆工作时,我旁边坐着一位同行。他也在用AI写代码,这很正常,我也用。但让我忍俊不禁的是,他为了解决一个极其基础的问题,竟然在和AI反复“拉扯”。那个问题是什么呢?仅仅是一个CSS元素的居中,或是一个忘记绑定onClick点击事件的低级Bug。

我内心的独白是:“简直可笑,花几分钟学一下CSS的Flexbox布局,不比你这样反复试错问AI快得多吗?”

我当然不会说出口,毕竟萍水相逢,我也不想打击一个年轻工程师的热情。但这情景让我深有感触。AI需要精确的上下文才能给出好答案,你反反复复地对它说“还没居中呢”,其实是在浪费你自己的生命。如果你从不想去理解代码片段之间是如何协同工作的,那你当初又何必选择软件开发这个行业呢?

这让我想起了乔纳森·布洛(Jonathan Blow)一直在警告的那个观点——我们行业的知识体系,正在从根基处“崩溃”。

布洛的核心忧虑是:现代软件建立在层层叠叠的抽象之上,如今的开发者,尤其是新人,越来越依赖顶层的框架和工具(现在又加上了AI),却对底层原理一窍不通。他们知“怎样”让东西跑起来,却不知道“为什么”能跑起来。

当整个行业都建立在“知其然,不知所以然”的基础上时,我们创造的系统会变得异常脆弱。就像今天这位小哥,他遇到的只是个CSS问题。但如果未来遇到的一个底层性能瓶颈或安全漏洞呢?当没有人再理解事物的本质时,我们又该如何去修复和创造真正可靠的东西?

这正是“崩溃”的真实写照——它不是什么末日天启,而是我们作为一个整体,正在逐渐丧失对复杂技术的掌控力。

AI的出现加剧了这种割裂:
- 对于经验丰富的开发者,AI是如虎添翼的杠杆,能将他们从重复劳动中解放出来,专注于更复杂的架构和创造。
- 对于新手而言,AI却成了一个“黑箱”或“许愿机”,让他们跳过了最关键的学习和试错过程,沦为只会提问的“提示工程师”,根基愈发不稳。

这是一个多么吊诡的世界。一方面技术在飞速进步,另一方面,从业者的平均基本功却在退化。

真心希望那位小哥能看到这篇文章,并明白,真正的成长,源于求知本身。

---
作者的观点与我相似,而最近遇到的一些事情让我更加坚信这一点。

学好基本功,AI 才能真正助你一臂之力

00
J杰克
13天前
全是反人性的呀:
1、不贪,一是在纷呈的机会中保持定力,专注于自己的事业;二是不要妄求不合理的“以小搏大”
2、不二过,错误不可怕,可怕的是同样的错误重复犯;而要做到不二过,就得每战后都要第一时间总结经验,特别是失败的教训,并从中提炼成可以指导今后工作的简单原则
3、透明度,不要总是搞“密室办公”,除非是公司今后的重大战略规划,不要有那么多的秘密,能够公开的尽可能公开,这样,信息就会畅通无阻
4、品牌至上,不要做伤害品牌的促销等动作,不要做影响品牌价值的偷工减料行为。品牌是一个企业给自己的用户编织的梦想,也一定要用心保护这个梦想
5、尊重逻辑的力量,很多时候,消费者是不知道自己未来想要什么,除非你放到他面前,所以,企业需要尊重逻辑的力量,不要迷信市场调研,逻辑上对的,哪怕还没有人作为,也是大胆尝试

今日头条

00
J杰克
14天前
使用豆包将一张图片变成了视频😄
00:05
00
J杰克
17天前
现在听到最多的就是焦虑这个词,但是它深层次究竟意味着什么呢?
00
J杰克
18天前
昨天在与客户聊天时,她们现在的系统是自己通过草料搭建起来的;联想到上周了解到一个朋友的面向建筑业的系统是通过一个低代码平台搭建的,只是在一个比较复杂的交互流程中进行了二开,这两个信息对我的触动很大,其实只要打开思路,技术完全不是问题!
00