即刻App年轻人的同好社区
下载
App内打开
汉堡在思考
42关注22被关注0夸夸
结合科研前沿与市场,并把它简单的讲给感兴趣的人们,这是我想做的事情,也是我的使命
汉堡在思考
9天前
cursor也有声音提示了 不用担心vibe coding自己再摸鱼了
00
汉堡在思考
10天前
用Manus搜集季逸超所有访谈,让AI还原:Manus是怎么做出来的

大家好,我是 季逸超。我现在在一家叫 蝴蝶效应 AI 公司,负责产品和技术,最近的manus想必大家都知道了。但今天,我不想讲一个成功的故事。我想聊聊失败,聊聊我是如何从一个“早十步成先烈”的技术信徒,在两次创业失败后,变成一个产品思考者的。这不是一篇成功学鸡汤,而是一份来自 AI 创业一线,用真金白银和无数个不眠之夜换来的复盘。

第一次“豪赌”:我如何从零构建一切,又如何被 GPT-3 一拳打醒
我的第一次正式创业,是一个叫做 MAGI 的项目。那时的我们,心气极高,愿景也极其宏大:我们要用自研的语义搜索引擎,去挑战 Google。
为了实现这个目标,我们选择了一条最苦、但也自认为最酷的路——“垂直整合”。从爬虫、索引引擎,到自己从头预训练语言模型,每一个环节都坚持自研。那段日子,我至今都觉得是我“智力和编程能力的巅峰”。我们坚信,只有掌握了从头到脚的每一项技术,才能构建出最完美的系统。
我们当时很早就遇到了现在大家热议的“长上下文”问题。早在 2018 年,当模型上下文普遍只有 512 token 时,我们就开始死磕,希望能把它扩展到 16K,这样 AI 才能真正读懂互联网上的长文章。这其实是我们第一次痛苦地触碰到一个后来将成为整个 AI 行业核心议题的根本性难题,也预示了我们“生不逢时”的命运。
然后,天要塌了。
其实在 GPT-3 之前,Google 一篇名为 T5 的论文就已经露出了苗头,暗示着 AI 的不同任务或许可以被“大一统”。但我们当时还心存侥幸,觉得这只是巨头的炫技。直到 GPT-3 发布的那个时刻,我拿到了早期内测资格,我们内心最深的恐惧被彻底证实了。
我把我们正在攻克的任务,用非常简单的 prompt 扔给了 GPT-3。结果发现,这个通用的、庞大的、别人家的模型,效果竟然和我们自己苦心训练的端到端专用模型打得有来有回。那一瞬间我意识到,我们对“垂直整合”的信仰被彻底击碎了。GPT-3 证明了一件事:过去那种做信息抽取的、做机器翻译的、做客服的团队之间泾渭分明的时代,结束了。
这次豪赌最终以失败告终,我总结了三个核心教训:
1. 产品上,我们严重低估了数据生态这类非技术问题的复杂性,以为单靠技术就能解决一切。
2. 时机上,我们过于超前。创业早一步是先驱,早十步就是先烈。我们成了先烈。
3. 商业上,模式始终不清晰,在 ToC ToB 之间摇摆不定,最终什么也没抓住。
4.
迷茫期:当AI浪潮涌来,我为何坚决不碰大模型
MAGI 之后,我有一年半的时间都在迷茫和思考中度过。那段时间,整个 AI 领域的发展给我的感觉是“海水在上涨”,你身处其中,能感受到水位不断上升,但不知道明天醒来会不会就已经被淹没,那种压迫感和不确定性让人窒息。
经历过被 GPT-3 的降维打击后,我给自己定下了一条铁律:绝不再碰“垂直整合”,尤其是模型层。那段时间,我几乎和国内外所有叫得上名字的大模型公司都聊过,但过去失败留下的“PTSD”(创伤后应激障碍)让我对这条路充满了警惕。
为什么我不看好初创公司做模型?因为在方向尚不明确的初期,产品的迭代速度就是生命线。如果你把宝押在自研模型上,你的产品迭代就会被模型的训练周期严重拖累。这无异于“买模型彩票”,在模型训练完成的最后一刻前,你永远不知道它能否达到产品预期的效果。我不想再吃一次这样的亏。

转折点:遇到“正常”的 CEO 和一张完美的“画布”
我最终选择加入现在的团队,遇到了 CEO 肖宏(Xiao Hong),原因有二。
首先,我对自己有了一个清醒的认知。作为一个技术出身的创始人,我很容易陷入技术的牛角尖,“一旦认准一个方向,就会油门踩死往右走,哪怕知道这已经是错了”。我需要一个能“管住”我的人,一个能在我上头的时候把我拉回来的人。所以,我明确告诉自己:我不想再当 CEO 了。
肖宏就是那个完美的人选。他身上有一个在当今 AI 创始人中极其稀缺的特质——他“很正常”。他相信常识,相信团队,身心健全,没有任何极端偏执的念头。你可能觉得这算什么优点,但在一个充斥着“没有乔布斯的命,却得了乔布斯的病”的行业里,这已经难能可贵。
其次,我看到了他们当时的产品 Monica,一张完美的“画布”(canvas)和“容器”(container)。Monica 是一款浏览器插件,它的绝妙之处在于:
* 它不改变用户的任何原始习惯,你依然在用你熟悉的网站,这让我们可以无干扰地观察用户到底是如何在真实场景中使用 AI 的。
* 它的功能分发是基于上下文的,比如视频相关功能只在 YouTube 出现,写作功能只在 Gmail 出现。这避免了功能堆砌带来的复杂性爆炸。
我意识到,这不仅仅是一个产品,更是一个观察用户、理解需求的绝佳窗口。

我们共同的第一次失败:为什么 AI 原生浏览器是个伪命题
加入团队后,基于在 Monica 上对用户的观察,我们顺理成章地产生了一个想法:做一款 AI 原生浏览器。我们投入了大量精力,产品形态也做到了和现在市面上的一些 AI 浏览器很像。但最终,我们亲手放弃了这个项目。
我们发现了两个无法解决的核心体验问题:
1. 控制权冲突:当 AI Agent 接管浏览器帮你操作时,它和你就像“两个人在抢一个系统”。你想滚一下屏幕,可能会打断 AI 的观察,它又会把页面给你滚回去,体验非常奇怪。
2. 任务场景错配:对于点击几下就能完成的简单任务,AI 的决策速度反而比人慢,显得多此一举。而对于那些我们真正希望 AI 代劳的长耗时任务,它又会一直占用你的本地电脑。你不能息屏,不能盖上笔记本,甚至不能干别的事,这完全违背了让 AI 解放生产力的初衷。
最终,我们向自己提出了一个灵魂拷问:“这款浏览器,到底有什么是 Chrome + Monica 插件做不到的吗?” 答案是,好像真的没有。
理智地放弃一个已经投入很多的项目,是团队成熟的标志。这让我们避免了陷入“自证循环”的陷阱,也为后来抓住真正的机会节省了宝贵的资源。

真正的洞察:Manus 的诞生源于一次意外观察
真正的转折点,来自一次非常偶然的观察。我们发现,公司里很多非工程师同事,比如运营和数据分析师,竟然都在使用像 Cursor 这样为程序员设计的专业代码工具,去写博客、做数据分析。
我们站在他们身后,好奇地看他们到底在怎么用。我们发现,他们根本不看左边的代码区,只是在右边的聊天窗口里,不断地和 AI 对话,让 AI 通过写代码的方式,去完成各种各样的非编程任务。
这个现象给了我们巨大的启发,让我们意识到一个核心观点:编程不是一个垂直能力,而是解决通用任务的媒介。
基于这个洞察,我们确立了 Manus 的三个核心设计原则:
1. 上云:必须将 Agent 的运行环境搬到云端,这样才能真正解放用户的电脑,处理长耗时任务,并且实现任务的并发执行。
2. 封装:代码应该作为底层的实现工具,而不是直接呈现给用户。我们要把技术的复杂性彻底封装起来,面向所有非技术用户。
3. 服务 Prosumer:我们的目标用户不应该是专业程序员,那个赛道已经过于拥挤。我们应该服务所有的“Prosumer”,也就是那些高价值的脑力工作者。
最后,我们给产品起名为 Manus。这个词源自 MIT 的校训“Mens et Manus”(心与手)。我们第一次创业做的 MAGI,是纯粹的“Mens”——一个悬浮在真空中的智脑。我们惨痛地认识到,没有一只“Manus”去触碰和改造现实世界,再聪明的“心”也毫无用处。在整个行业都在做“心”(大模型)的时候,我们选择做那只“手”。

我在 AI 时代的创业心法:五条反直觉的原则
MAGI 的惨败,到 AI 浏览器的放弃,再到 Manus 的诞生,这些经历让我总结出了五条在 AI 时代可能有些反直觉的创业原则。
原则一:产品的迭代速度,远比技术垂直整合重要。
在充满不确定性的 AI 时代,快速试错和迭代是活下去的关键。过早投入自研模型会成为产品迭代的巨大瓶颈。一个更健康的模式是:当产品通过调用外部模型找到了清晰的 PMF(产品市场契合点)后,再根据具体需求,考虑通过自研模型来降本增效,或是突破现有模型无法达到的天花板。
原则二:坦然接受“套壳”,并做到极致。
很多人对应用层创业嗤之以鼻,称之为“套壳”。我完全不认同。操作系统的 Shell(壳)本身就是极具技术壁垒的东西。“壳”做得好不好,天差地别。在 AI 时代,真正的核心竞争力在于围绕基础模型构建的框架(Framework)和上下文工程(Context Engineering)能力。如何为模型提供最精准的上下文,如何设计出能让模型稳定执行复杂任务的系统,这才是应用层的护城河。
原则三:先做通用,再从用户行为中寻找方向。
传统创业理论教我们要做垂直、做细分。但在 AI 时代,我更相信一种“达尔文式”的产品策略。Manus 选择做通用 Agent,不是因为我们想做所有事,而是我们想把产品形态的定义权交给用户。我们提供一个通用的底层架构,通过观察用户集体的行为模式,去发现那些最高频、最高价值的场景,然后再由我们的产品团队去进行“最后一公里”的优化。这种模式塑造出的产品,是用户“用脚投票”投出来的,生命力远比我们闭门造车要强。而且,通用 Agent 永远能“多做一步”,将不同场景的能力串联起来,产生内部的网络效应。
原则四:“不做什么”比“做什么”更重要。
AI 极大地解放了生产力,让创业公司似乎一夜之间什么都能做。机会看似无限,但克制和专注变得前所未有的重要。诱惑越多,越需要想清楚自己的边界在哪里。我们团队内部经常讨论的是“这个月我们能删掉什么功能”,而不是增加什么。保持产品的简洁和核心价值的纯粹,是在机会爆炸时代不迷失方向的关键。
原则五:关注营收,而非日活(DAU)。
AI 创业与上一代移动互联网创业有个根本不同:它有实实在在的、高昂的边际成本。它更像“制造业”,而不是纯软件。这意味着,你必须从第一天就开始思考商业化,追求正向现金流。Manus 的目标用户是那些任务价值高、对价格不那么敏感的 Prosumer。我们追求的不是用户数量,而是能为每个用户创造多少“Agentic Hours”(即由我们的 Agent 自主完成、为用户节省下来的高价值工作时长),并最终让这一价值体现在营收上。

结语:战斗还远未结束
写下这些,并不是因为我们已经成功了。恰恰相反,是因为我们深知战斗还远未结束。我常常和团队说一句话:“我们都还没有活着的权利。” AI 这股巨浪中,任何一家创业公司,无论今天看起来多么光鲜,都必须持续奔跑、持续进化,才能为自己争取到活下去的权利。
前路漫漫,我们依然在探索的路上,谨慎而乐观。
00
汉堡在思考
10天前
Manus被Meta数十亿美金收购了,10天谈完。
最有意思的是timing:
去年初字节想3000万买,肖弘没卖
今年3月Manus上线就爆了
12月ARR破1亿美元
现在Meta砸几十亿收购
决策对了,一年时间估值翻了100倍。
之前总说中国AI公司”只能做应用层套壳”,好像是种贬低。但Manus这事说明:能做出全球用户付费的产品,比讲技术故事重要得多。
Monica时期被嘲套壳,但人家一直在赚钱。行业还在争论要不要all in大模型时,肖弘已经在想怎么让用户真正用起来了。
扎克伯格自己是Manus重度用户——产品好到CEO亲自掏钱买公司,这才是最硬的背书。
武汉团队,全球舞台,几十亿美金exit。这个故事很提气。​​​​​​​​​​​​​​​​
00
汉堡在思考
1月前
最近琢磨了一套AI编程的方法论,越想越觉得有意思,分享一下。

核心观点:程序员的本质工作从"写代码"变成了"上下文工程"。你维护的不再是Git仓库里的代码,而是发给AI的上下文。

代码是什么?是高质量上下文流过AI后沉淀的结晶。上下文脏了,代码一定有杂质——这就是AI时代的"内存泄漏"。

所以你得像管理内存一样管理对话:保留关键决策,主动清除无效试错,防止AI被旧噪音干扰。

最重要的心法:AI负责堆料,人类负责熵减。

AI天性啰嗦、爱过度设计。哪怕它一秒能生成微服务架构,单体能解决就只让它写单体。Review的时候专门删那些"正确但没用"的代码。

经典软工一个环节都不能省,需求、TDD、Review、文档,只是被AI加速了。特别是TDD,必须先写测试锁定"什么算对",再让AI填实现。

最佳状态叫Vibe Coding:人类专注业务逻辑和权衡取舍,所有打断心流的机械活全丢给AI。但永远保持质疑——你是船长,AI是力气大但容易眼花的舵手。

打个比方:代码像疯长的植物,AI让它长得飞快。你不再是一铲一铲挖土的苦力,而是手持剪刀的首席园艺师。核心工作是修剪——剪掉杂乱枝叶,控制生长方向,让整座园林干净有序。
00
汉堡在思考
1月前
【紧急】React Server Components严重RCE漏洞完全指南

刚收到Vercel的紧急通知,想必很多Next.js开发者都收到了。这次不是简单的框架漏洞,而是React底层的严重安全问题,影响范围很广。

🔥 漏洞本质

CVE-2025-55182(代号React2Shell)是React Server Components (RSC) 的反序列化漏洞:

- CVSS评分:10.0(满分)
- 根本原因:React Flight协议在处理RSC payload时存在不安全的反序列化
- 攻击方式:攻击者发送特制payload,服务器解析时会执行任意JavaScript代码
- 无需认证:任何人都能利用

😰 谁受影响?

直接受影响:React 19.x

以下包的这些版本有问题:
- react-server
- react-server-dom-webpack
- react-server-dom-turbopack
- react-server-dom-parcel

受影响版本:19.0, 19.1.0, 19.1.1, 19.2.0

间接受影响:所有使用RSC的框架

因为底层用了React Server Components,这些框架都中招:
- Next.js15.x/16.x(使用App Router)
- React Router
- Waku
- Expo
- Redwood SDK
- 以及其他支持RSC的框架

⚠️ 关键点:即使你没显式使用Server Functions,只要启用了Server Components就有风险!

🛠️ 修复方案

React用户

升级到以下任一版本:
bash
npm install react@19.0.1 react-dom@19.0.1或
npm install react@19.1.2 react-dom@19.1.2

npm install react@19.2.1 react-dom@19.2.1
00
汉堡在思考
1月前
颠覆认知的5条产品军规:前百度产品负责人的深度复盘

为什么有些产品一夜爆红,而另一些投入巨资却无人问津?多年来,我看到太多团队沉迷于功能、设计与技术,却忽略了决定成败的真正驱动力。这些驱动力并非复杂理论,而是一系列反直觉的法则。今天,我想带你踏上一段旅程,从一个产品的核心价值出发,层层深入,探索用户的真实心理、产品的意外生命、商业的残酷现实,直至最终洞察——那个创造一切的组织本身。

--------------------------------------------------------------------------------

1. 成功的铁律:一条价值公式定胜负

一切产品思考的起点,都应回归到一个看似简单却极其深刻的公式:

用户价值 = (新体验 - 旧体验) - 替换成本

这条公式是检验产品价值的试金石。我用微信替代短信的案例来拆解它:

* 旧体验:收发短信,甚至在那之前,很多人为了省钱会用移动的“飞信”(Fetion)免费发短信。这是用户已经习惯的沟通方式。
* 新体验:微信提供了与短信几乎一致的打字、发送体验,同时增加了语音、图片、群聊等更丰富的功能。它的新体验远超旧体验。
* 替换成本:从付费短信或功能单一的飞信,切换到功能强大且完全免费的微信,用户的替换成本几乎为零,甚至为负(反而省钱了)。

(新体验 - 旧体验) 的价值足够巨大,而 替换成本 又无限趋近于零时,用户价值便会呈指数级增长,产品的成功几乎成为必然。这条公式之所以关键,因为它强迫我们站在用户的视角进行冷酷的得失计算,而不是沉浸在设计者的主观臆断中。

--------------------------------------------------------------------------------

2. 最大的陷阱:你的用户(和你的老板)都不知道自己想要什么

从价值公式深入到第二层,我们会遇到一个巨大的陷阱:直接听从用户或老板的需求,往往是产品失败的根源。

我曾亲眼见证一个典型的失败案例——盛大重金打造的社区产品。当年,盛大收购了游戏、文学、视频等几乎所有娱乐形态的公司,雄心勃勃地想打通所有平台,让用户可以跨产品社交。这听起来无比宏大,但它源于一个致命的起点——“老板想要”。

...但是失败原因就是因为那是老板想要用,不是用户想用。

产品最终失败了。因为用户根本没有真实存在的、跨越不同娱乐产品的社交需求。当一个用户沉浸在游戏世界里,他的社交关系链就在游戏内部,他并没有强烈的动机去和一个正在看小说的人互动。

用户的真实需求是通过他们的行为(用鼠标投票),而不是口头表达来体现的。顶尖的产品家,如乔布斯,从不做用户调研,因为他们着眼于创造用户尚未意识到的巨大价值,而非满足用户表面的“想要”。

--------------------------------------------------------------------------------

3. 意外的惊喜:最成功的产品往往源于“无心插柳”

作为百度贴吧的第一任产品经理,这段经历让我对产品生命力的理解发生了颠覆。最成功的产品,其最终形态往往远超创造者的最初设想。

当我们最初设计贴吧时,意图非常简单:做一个基于关键词的知识分享平台。比如,用户搜索“刘德华”,就可以进入“刘德华吧”,分享关于他的知识。为了实现这一点,我们做了两个关键的技术和策略决定:第一,底层不用传统数据库,而是用文本检索引擎,这让贴吧的访问速度比当时世界上任何论坛都快;第二,我们允许用户匿名发帖,将参与门槛降到最低。

然而,产品上线后,用户的行为完全超出了我们的预想。粉丝们并没有把它当成知识库,而是涌入其中,将其变成了追星、情感交流和互动的社区。很快,从“减肥吧”到冷门的“夏侯渊吧”,用户自发地创造了无数个充满亚文化的庞大社会生态。

面对这种“失控”,我们的核心策略不是“克制”,而是一种更主动的哲学:通过提供一个稳定、高性能的平台来催生“涌现”行为,并积极地管理随之而来的混乱。 当粉丝之间爆发“圣战”(大规模的刷屏论战)时,我们的首要任务不是阻止,而是确保服务器不会崩溃。等他们宣泄完情绪后,我们再进去清理垃圾信息。我们只提供基础功能,让用户自己去定义产品的用途。这个案例让我深刻认识到,为用户的自发行为留出空间,其力量远比我们精确规划的功能更为巨大。

--------------------------------------------------------------------------------

4. 残酷的现实:好产品≠好生意

一个产品在用户层面非常成功,并不意味着它是一门可持续的好生意。这是产品人必须面对的第四层现实。

百度贴吧、天涯社区等产品,都创造了巨大的用户价值和深远的文化影响,但在商业化上却始终举步维艰。它们是用户眼中的“好产品”,却不是一门“好生意”。

一个真正的好产品,必须满足三个标准:

1. 有效用:对用户有价值。
2. 有利润:能够建立可持续的商业模式。
3. 可持续:企业能够长期存在并提供服务。

“可持续性”尤其重要。威马汽车的倒闭,导致车主的后续服务中断;早年我们不得不关闭百度空间(Baidu Spaces),也让用户失去了他们积累多年的内容。这些惨痛的教训说明,如果一个企业无法持续经营,无论它的产品曾经多么优秀,最终对用户造成的伤害都是巨大的。

--------------------------------------------------------------------------------

5. 终极的洞察:你公司本身才是最重要的产品

穿越了产品、用户、商业的重重迷雾,我们最终触及问题的核心:一家公司的组织结构、决策机制和激励机制,共同构成了它最重要的“产品”。这个“内部产品”的优劣,决定了公司能否持续创新。

我曾亲身经历过这样一个困境:在一家公司里,老产品非常赚钱,所有的激励(奖金、晋升)都向这个老业务倾斜。结果,最优秀的人才都不愿意去做那些短期内没有利润回报的新产品探索。最终,这家公司虽然手握重金,却完全失去了创新的能力。

一个僵化或不合理的内部结构,会扼杀所有伟大的产品构想。与之形成鲜明对比的是像理想汽车这样的公司,他们的组织结构本身就是为了快速决策和迭代而设计的,这使得他们能够在激烈的竞争中脱颖而出。因此,对于一个企业而言,打造一个能够鼓励创新、快速决策的组织,比设计任何单一的产品功能都更为关键。

-------------------------------------------------------------------------

结语

从价值公式到组织设计,这五层认知揭示了产品世界的复杂与纵深。一个完美的产品(法则1),如果误解了用户心理(法则2),扼杀了自发演化(法则3),找不到商业模式(法则4),或诞生于一个僵化的组织(法则5),其最终的命运都注定是失败。那么,作为创造者,我们又该如何确保自己不仅是在“正确地做事”,更是在做那件“正确的事”?
20
汉堡在思考
1月前
最近复盘了一些 AI Wrapper 产品的起落,发现一个很有意思的现象。
在这个阶段,能拿到融资且数据(Traction)好看的产品,很多本质上并不拥有技术壁垒,而是在极高风险地赚三种“信息差”:
第一种是“可得性信息差”。说白了就是做代理,赚国内外访问门槛的钱。这种生意最怕政策和官方合规,头顶永远悬着一把剑。
第二种是“能力发现信息差”。大模型本身很强,但用户不知道怎么用。Wrapper 做了个漂亮的 UI 帮用户写 Prompt。这本质上是在赌 OpenAI 这种巨头“看不上”你的细分场景。但现实是残酷的,官方每一次 Update,都是对这类 Wrapper 的一次降维打击。
最隐蔽的是第三种:“负毛利补贴体验的信息差”。为了让产品看起来比原生 ChatGPT 更丝滑、响应更快,后台用极高的算力成本在跑,前台却收白菜价。这其实是在拿 VC 的钱补贴用户,换取漂亮的增长曲线。
这三种模式,都是在借来的时间里过日子。
这波 AI 浪潮里,如果不深入到业务流 (Workflow) 里面去,不沉淀私有数据,只做“套壳”和“体验优化”,最终可能只是一场为大模型厂商做的免费“用户教育”。

做产品,还是得诚实一点,别把红利当能力。🌊
#AI创业 #产品思考 #商业模式
00
汉堡在思考
3月前
这两天体验了claude code2.0的vscode 插件版本,感觉虽然看起来没有直接用prompt那么清晰,但是有两个好处一个是自动压缩对话以及开启新页面,另一个是不会出现字符乱码。

我不知道大家都在用什么,以及你们的体验如何,可以分享一下吗
00
汉堡在思考
3月前
claude4.5的 imagine with claude其实目前最好的是做一个闭环的游戏生态
00
汉堡在思考
4月前
那这个需要over engineering一下,加个虚拟人物或者数字人来搞。难受的时候可以让他成为程序员鼓励师。当然,这还是没有加nsfw功能的情况下…… 而且这个功能不止限于屏幕界面交流,还能是某些让人愉悦的智能硬件🤫
原动态已删除
00