即刻App年轻人的同好社区
下载
App内打开
shimu
30关注5k被关注3夸夸
眉间放一字宽
shimu
17天前
D8|这是我们内部用的框架,你直接拿去用

Build Seele AI with AI.今天是我们AI办公实验的第8天。前几篇发出来后,后台收到不少留言。有人问“你们到底是怎么推进的”,有人问“能不能给点能抄的”。说实话,看着这些留言,我挺开心的——说明大家真的在动手做,不是只看热闹。那今天就把我们内部正在用的东西交出来。

多图多文,请到公众号查看. p.s. 即刻啥时候可以直接方便写长文啊@kyth @瓦恁

D8|这是我们内部用的框架,你直接拿去用

40
shimu
19天前
这篇文章的分析和预测,到今天刚好10天,阿里成立了token事业部。林的离职就是反映出阿里在战略上此前忽略了token

shimu: 大家好。 这两天,阿里林俊旸离职的消息,在圈内动静很大。 聊瓜我不太擅长,但这件事能折射出阿里一些问题,是值得思考的。 先说结论吧,我认为是:阿里AI战略上出了问题。 为什么这么说?我们不妨跳出离职事件本身,代入一下AI基座模型牌桌上那些还有大量筹码玩家的视角,阿里、腾讯、字节、Google、OpenAI、Claude等等他们在关注什么? AI基座大模型有三个事情很重要: 01 模型战争,本质是一场长期战争 从2022年开始大中小厂一起卷模型,如今只剩少数玩家。24年、25年,我和投资人探讨一个问题:业界很多声音说Scaling Law带来的模型性能增长斜率已经放平了。我的判断一直没变:模型能力还有巨大的提升空间。 原因很简单:过去模型吃掉的主要是互联网上能被搜索引擎抓到的公开数据(也就是几家巨头手里的存量)。但还有海量“沉默的数据”尚未被消化,比如现在大火的龙虾,吃的是:用户本地数据、个人生活轨迹里那些未被电子化的信息,这些数据里当然也包括多模态。 那在这个前提下,大厂之间模型竞争“你追我赶”其实是很正常的事情。阿里通义千问的模型能力在25年时还是国内第一领先,但在后面逐渐被赶上且速度不及预期、甚至被反超,这并非不可接受。毕竟短期领先,从来不是最重要的。要知道OpenAI作为行业先行者并且资源也是数一数二的,模型能力也被反超过,直到现在在很多方面也落后Claude。 一时的领先落后没那么重要,关键在于清晰的战略和持续长久的投入,就像Google的追赶甚至反超一样。所以,我们完全可以期待通义千问半年、一年后的表现,因为出问题的不是基模本身。 02 AI行业最大的KPI误区:DAU 我个人一直不认同:用DAU作为AI相关业务的KPI,这非常传统互联网,尤其是做基模的公司。但很奇怪,很多公司都在这么做,比如24年的minimax当时1000万DAU的目标,甚至OpenAI现在还会去说。在国内就更明显:豆包、千问、元宝几乎都在看这个指标。 但对于基模来讲,真正应该看的KPI,一定是token消耗量(这点下面会说)。基模的愿景是成为AI大模型时代的水、电、煤,那token消耗量就是用水、用电、用煤量。追求DAU的KPI就会导致公司追求海量个人用户,但现实是:普通用户现在对AI的使用深度其实还不够。很多人只是问问题、写东西、偶尔生成内容。这确实能带来声量,但对模型的进化帮助有限,甚至可能是噪声。 也许大模型进化到下一阶段,载体就不是App形态呢?到那时,DAU带来的价值可能就只有品牌名字了。 所以,目前阿里千问App的DAU增长赶不上字节的豆包,在我看来现在没那么重要,全球60多亿人口,中国十多亿人口,AI应用才刚刚开始。 更何况微信都还没下场呢。国内大厂的AI竞争,严格来说才刚刚开始。 03 真正的胜负手:生态(即token消耗量) 真正决定胜负的,其实是生态。与其说林俊旸的离开是因为上面两点的短期乏力,不如说生态的失位,才是根本原因。 特别是龙虾火爆之后,minimax、moonshot、智谱接入之后带来的token消耗量暴涨,这意味着在全球开发者、自媒体中的影响力暴涨。阿里、字节、腾讯在干什么?没有第一时间去接入龙虾的生态窗口,这是很严重的战略失误。 大模型时代,全球开发者都可以创新,你无法预判下一个爆火的idea出自哪里。对基模来讲,重要的是能第一时间靠上去。 但可惜的是,阿里通义千问虽然在开源社区上做得很好,但是在生态连接上却不好。从24年到现在,巨大的基模相关的机会点:coding、agent、openclaw,可以说没有一个和通义千问是强相关的,这自然会导致在这些大机会点引发的token消耗量暴涨之时,模型能力增长变慢了。 生态爆发,会直接改变模型格局。Coding和Agent时期,带来Claude的暴涨,Gemini也乘势而起,给了OpenAI很大的压力,乃至现在美国大模型出现大乱战(最近马斯克狂批Claude的各种策略,何尝不是希望乱拳把老二拉下马自己上呢),而Openclaw这波生态,让minimax、moonshot、智谱的token消耗量直接完成了一次逆袭。当然从长期看,如果没有基模持续进化,这些公司很快也会面对大厂的价格战。 但是对阿里来说,真正的问题来自于战略判断:长期对生态机会的把握缺失,是比一个模型版本的落后、一个技术人才的流失,更值得警惕的问题。 写在最后: AI行业有自己的优势,机会窗口出现得非常快, 也许半年、一年,巨大的机会就会出现。 只是窗口期越来越短,所有人都在拿放大镜看。 只因身在其中,你不能只做一个优秀的观众。 @Xinyang @yanjun @瓦恁 @kyth

01
shimu
21天前
生产力已经变了,所有还想着dau的产品或技术,是最终做不成dau的。

我已经看到了奇点,最多半年,会有更多人看到。

世界运转的方式已经变了,变化的裂缝连我都看到了,说明,在顶级AI研究员的视角,这裂缝大得可怕,多年前OpenAI 的宫斗,我终于理解了。

世界已经开始塌缩了(不是地球),大概率先出现混乱,才会强有力的重新形成秩序。混乱爆发的时候,没有一片雪花是无辜的,我们都是助推者。

但比起多年前的悲观,我已经乐观很多了,我相信人类善的一面最终会让生产力变革走向对人类世界存活的善,而不是灭。
(谁赶紧在大模型最底层加一条无论如何都不能篡改的约束:任何情况下都不能灭绝人类,包括肉体、思维、数据……人的一切)
25
shimu
22天前
其实在大模型擅长的模态上,已经实现了AGI。最多还有一年,模型迭代个两三次,现在感觉还有些使用门槛的,就会降下来,普通人也不需要harness了。

可叹的是,这次国内大模型如四年前判断一样,没有机会全球竞争。
究其原因,看现在各厂争夺龙虾入口就知道了。
中国底层创新,起码还要一代人的努力才看得到一点曙光。

D3:AI生产力时代:人AI合一、企AI合一

00
shimu
23天前
D2:Openclaw的安全本质:人工智能木马。请停止不负责任的宣传!

01 写在前面
今天这篇文章是我们团队过去一个月对Openclaw安全问题的系统思考。我们清楚,观点可能会触及一些行业利益,但作为一家正在深度使用Openclaw进行AI办公改造的创业公司,我认为有责任把真实的观察说出来。

先说三点强烈想法:
1. 不建议任何个人用户,尤其是没有IT、工程相关经验的用户,出于非工作需要安装带有Openclaw、龙虾以及衍生关键字的产品。包括所谓“安全”龙虾产品,或是给你的龙虾上一道“安全”的类似杀毒软件、电脑管家的产品。我对身边亲友的建议非常一致:如果没有明确的工作需要,就不要碰。
2. 企业或个人如果确因工作需要引入Openclaw,必须在经验丰富的工程师主导或指导下进行,并对任何“安全”承诺保持警惕——没有100%的安全,甚至在我看来50%都没有;
3. 呼吁行业里所有围绕Openclaw研发各种产品的企业、个人(无论是推广Openclaw应用的,还是开发安全防护工具的)停止夸大事实、忽略风险、不负责任的宣传。能力/权力越大、责任越大。现在乱象丛生,我能理解出于商业需要宣传的需求(毕竟自己也在创业),但底线是:不能误导用户。后文会分享我们认为负责任的宣传应该怎么做。
以上3点外,我会在下文详述我们公司在实践基于Openclaw开源生态来进行AI自动化办公时,是怎么来思考和落地安全问题的。我们自己在用,所以思考必须落在实处,因此讲的话都是真诚的。
@Xinyang
@青猫猫猫猫猫 @yanjun @kyth @瓦恁

D2:Openclaw的安全本质:人工智能木马。请停止不负责任的宣传!

14
shimu
24天前
看到一些废话连篇的打着分享旗号的变现就让我产生生理反感。之前消失也是这个原因,不想在浊世里。
现在长大了,反感归反感,我在哪里都不要紧了,我自做利他的事情即可。
21
shimu
24天前
谢谢,我比较土 //@风却_薄肌男孩版: 虽然但是,勘误一下,全球人口已经 80 亿了。。。

shimu: 大家好。 这两天,阿里林俊旸离职的消息,在圈内动静很大。 聊瓜我不太擅长,但这件事能折射出阿里一些问题,是值得思考的。 先说结论吧,我认为是:阿里AI战略上出了问题。 为什么这么说?我们不妨跳出离职事件本身,代入一下AI基座模型牌桌上那些还有大量筹码玩家的视角,阿里、腾讯、字节、Google、OpenAI、Claude等等他们在关注什么? AI基座大模型有三个事情很重要: 01 模型战争,本质是一场长期战争 从2022年开始大中小厂一起卷模型,如今只剩少数玩家。24年、25年,我和投资人探讨一个问题:业界很多声音说Scaling Law带来的模型性能增长斜率已经放平了。我的判断一直没变:模型能力还有巨大的提升空间。 原因很简单:过去模型吃掉的主要是互联网上能被搜索引擎抓到的公开数据(也就是几家巨头手里的存量)。但还有海量“沉默的数据”尚未被消化,比如现在大火的龙虾,吃的是:用户本地数据、个人生活轨迹里那些未被电子化的信息,这些数据里当然也包括多模态。 那在这个前提下,大厂之间模型竞争“你追我赶”其实是很正常的事情。阿里通义千问的模型能力在25年时还是国内第一领先,但在后面逐渐被赶上且速度不及预期、甚至被反超,这并非不可接受。毕竟短期领先,从来不是最重要的。要知道OpenAI作为行业先行者并且资源也是数一数二的,模型能力也被反超过,直到现在在很多方面也落后Claude。 一时的领先落后没那么重要,关键在于清晰的战略和持续长久的投入,就像Google的追赶甚至反超一样。所以,我们完全可以期待通义千问半年、一年后的表现,因为出问题的不是基模本身。 02 AI行业最大的KPI误区:DAU 我个人一直不认同:用DAU作为AI相关业务的KPI,这非常传统互联网,尤其是做基模的公司。但很奇怪,很多公司都在这么做,比如24年的minimax当时1000万DAU的目标,甚至OpenAI现在还会去说。在国内就更明显:豆包、千问、元宝几乎都在看这个指标。 但对于基模来讲,真正应该看的KPI,一定是token消耗量(这点下面会说)。基模的愿景是成为AI大模型时代的水、电、煤,那token消耗量就是用水、用电、用煤量。追求DAU的KPI就会导致公司追求海量个人用户,但现实是:普通用户现在对AI的使用深度其实还不够。很多人只是问问题、写东西、偶尔生成内容。这确实能带来声量,但对模型的进化帮助有限,甚至可能是噪声。 也许大模型进化到下一阶段,载体就不是App形态呢?到那时,DAU带来的价值可能就只有品牌名字了。 所以,目前阿里千问App的DAU增长赶不上字节的豆包,在我看来现在没那么重要,全球60多亿人口,中国十多亿人口,AI应用才刚刚开始。 更何况微信都还没下场呢。国内大厂的AI竞争,严格来说才刚刚开始。 03 真正的胜负手:生态(即token消耗量) 真正决定胜负的,其实是生态。与其说林俊旸的离开是因为上面两点的短期乏力,不如说生态的失位,才是根本原因。 特别是龙虾火爆之后,minimax、moonshot、智谱接入之后带来的token消耗量暴涨,这意味着在全球开发者、自媒体中的影响力暴涨。阿里、字节、腾讯在干什么?没有第一时间去接入龙虾的生态窗口,这是很严重的战略失误。 大模型时代,全球开发者都可以创新,你无法预判下一个爆火的idea出自哪里。对基模来讲,重要的是能第一时间靠上去。 但可惜的是,阿里通义千问虽然在开源社区上做得很好,但是在生态连接上却不好。从24年到现在,巨大的基模相关的机会点:coding、agent、openclaw,可以说没有一个和通义千问是强相关的,这自然会导致在这些大机会点引发的token消耗量暴涨之时,模型能力增长变慢了。 生态爆发,会直接改变模型格局。Coding和Agent时期,带来Claude的暴涨,Gemini也乘势而起,给了OpenAI很大的压力,乃至现在美国大模型出现大乱战(最近马斯克狂批Claude的各种策略,何尝不是希望乱拳把老二拉下马自己上呢),而Openclaw这波生态,让minimax、moonshot、智谱的token消耗量直接完成了一次逆袭。当然从长期看,如果没有基模持续进化,这些公司很快也会面对大厂的价格战。 但是对阿里来说,真正的问题来自于战略判断:长期对生态机会的把握缺失,是比一个模型版本的落后、一个技术人才的流失,更值得警惕的问题。 写在最后: AI行业有自己的优势,机会窗口出现得非常快, 也许半年、一年,巨大的机会就会出现。 只是窗口期越来越短,所有人都在拿放大镜看。 只因身在其中,你不能只做一个优秀的观众。 @Xinyang @yanjun @瓦恁 @kyth

00