Quick Q&A about AI Startup 2
我在24年底时写过一篇Quick Q&A about AI Startup,当时收到一些行业朋友来问AI创业、投融资相关的事情,索性就快速输出了一些判断。今天回过头来看,大部分仍可以坚持当时的观点。最近又收到比较多的询问,因此Q&A 2就来了。
Q: 你怎么看最近比较火的A2A概念?
A:和一年前看法一样是个伪概念。它有两层逻辑硬伤:
说未来世界会有非常多的差异化Agent(数量级甚至超过人类),因此A2A的网络很重要。这里面是忽略了基座大模型的进化,过分夸大了skill、harness等。这个问题和当初OpenAI匆忙搞Agent Store是一样的。基座大模型的进化,使得未来单一Agent能处理的任务会越来越复杂,不太会有专门处理某个单一任务的Agent,那么Agents之间的差异就不会大,比人类要小非常多。这样一想,是不是不需要A2A的互联网?或者最多是需要局域网而已。而且大模型的发展趋势就是不断把外部数据、能力内化的过程,出口是单一的,搞那么多交互过程反而是与Transformer黑盒的特点背道而驰;即便未来有A2A的网络,而且它还很重要,那么掌握了基座模型的公司,为啥不会自己做呢?因此,如果想投机搞一把A2A、Skill store之类的概念,我不懂,但至少逻辑是通顺的。如果以此为出发点来创业,可以再深入思考下。
Q: 你怎么看Agent创业?
A:大部分Agent创业是可以归属到投机方式的,那最好要快进快出。因为和基座大模型的引力相比,Agent创业方向的核心优势是速度快,得做到预判下一版甚至两版大模型的迭代方向来做(最近Claude源码泄漏直接把创业难度提高到预测下两版),最近一两个月立项搞harness agent创业的就很难了,产品上线打了三四个月会发现基座大模型迭代了,要么把Agent的能力内化吃掉了,要么原有那套工程优化不适用了,得重头再来。除了速度要快,本质上PK的是营销水平,这个就要思考下了。
Q:你怎么看Loopit连续融资的新闻?
A:我思考的结论:这个所谓“下一代AI抖音”的方向,可以视作上面投机方式的打法(非贬义),也就意味着要提前想清楚,后面谁会来接盘,怎么实现快进快出。背后思考是:这个产品形态商业模式艰难。首先无法向用户卖token;其次里面的很多小互动游戏无法向用户收费;那么最终剩下广告,可以问问从23年开始到现在做AIGC内容产品的公司,能挣多少广告费?这个产品形态很难变成社交媒体,本质上和每隔几年主流社交媒体上就流行一阵的meme玩法一样(一直都有的匿名AMA就是,还有23年火过一阵的各种模拟器)。形成社交媒体需要内容能立人设,形成粉丝关系(人的本性),人设包括外表、言论,才华是现代社会里人设比较不重视的了,何况是造meme小游戏的才华。外表和言论分别被短视频、推特的巨头把持。我不认为这个东西变成AI生成可以玩几下的互动就会改变。如果不是社交媒体,就变成了玩法驱动的产品,这类有很多的先烈了不一一举例,AI无非是加速了成为先烈的速度;这类产品没有技术壁垒。这个连harness都没有,只是套上Claude,扒热点meme批量搞内容生成然后投流,最终投资人的钱都贡献给了社媒巨头和LLM。这类产品据我了解就有七八个,还有上市公司做。烧完一波难以留下什么,所以综合结论是:快进快出,找好接盘;我觉得字节内部如果清醒的话不会花资源搞这个方向的,之前学着搞AI陪伴也是“类抖音”流式体验那一波已经吃了经验了。那堆产品里应该目前剩下Minimax的Talkie还能活着挣钱,因为用的自己的模型,有毛利,其他套壳的应该都搞不下去。
Q:你怎么看世界模型?
A:从科研角度,世界模型有不同的方向或者叫定义,有人尝试去统一总结叫预测下一个状态(不管是在虚拟世界还是物理世界)。但总体来讲,模型的训练方式无非就两种:纯video-based,是否引入3D数据、采集真实物理数据进来训练不是最关键的,最关键的是纯video的形式,训练的数据量、模型参数量有多少,因为引入的其他数据毕竟在数量级上还差得太远。那在这个角度,Google和字节显然优势巨大,搞这块的创业公司未来很难竞争;非纯video-based的,以虚拟世界的3D数据(包括游戏引擎相关的、3D高斯的等)或物理世界的采集数据(虽然也可以是视频形态,但重点是采集)来作主要训练数据。这个最大的问题就是数据量少,搞这个方向的创业就需要从数据飞轮到模型训练到产品商业化都具备,所需资源和能力要求是很高的,这样来看其实能做这块的公司不多,绝不是搞下训练demo就可以干的。所以最近世界模型很热,但不能盲目跟风;我们(Seele AI)尝试了第三条路,这条路我们从科研上已经论证了,跑出的demo在物理一致性、实时交互效果上要优于上面提到的路线2,部分优于路线1(但整体比不过Genie3,毕竟资源数量级差了好几个)。差不多近期会做一些研究成果公布。
Q: 你怎么看具身智能概念?
A:这个不用我回答了,已经有人把基座大模型的Agent装到具身里了,所以大模型可以做,不需要额外搞那么多具身智能(脑子不用,机械部分还是非常需要的)。反而关节物理、制造等才是门槛壁垒,硬件赛道的胜负手在硬件上,不能弄反了;Q: 那到底在基座大模型之外,有什么大机会?A:我一直认为对于大模型而言,差异化只有模态。你选定的创业方向里,模态是否能有优势、有壁垒?这是值得好好思考的问题。当然,不是说模态没有差异化就不能搞,回到本文开头的,那是投机,要快进快出,核心能力是营销。可不能往AGI去搞了。如果选择有差异的模态去做,那么就需要耐得住寂寞了,选的模态肯定是当下比较冷门小众关注点少的、区别于基座大模型的。但同时,也需要在执行动作上加一些投机,这个就属于增长了。
最后
再往后看,AI创业的分化大概率会越来越明显:一类继续走投机路线,靠速度、营销和窗口期赚钱;另一类则要在模态、数据、硬件或其他真正难以内化的能力上建立壁垒。前者拼的是节奏感,后者拼的是耐心和基本功。两条路都能走,但最怕的是嘴上讲AGI,实际做的却是一个没有壁垒的短周期生意。这次还是先用Q&A的方式,快速把最近被问得比较多的几个问题写下来。很多地方其实还可以继续展开,后面如果大家还想聊A2A、Agent创业、世界模型,或者AI创业、投融资相关的问题,欢迎进群交流。