即刻App年轻人的同好社区
下载
App内打开
Kenny_肯尼
501关注4k被关注6夸夸
AI产品经理
内容创作者和观察者
探索普通人和大模型的交互关系
Kenny_肯尼
6天前
Sora 2 有两个非常核心的价值:模型与工具的价值,以及 社交/内容平台的价值。

1. 模型与工具价值:毋庸置疑的最强

这是最明显的一块,目前看来 Sora 2 的模型能力绝对是 Top Tier。拿它跟 Veo 3 (V3) 相比,Sora 2 似乎更强:

音画同步性与物理规律: 它的音画同步性比 V3 更自然,即使语速极快,口型也能跟上。更重要的是,它对 物理规律 的理解更好了。这就能解释为什么 Showcase 里有那么多体操这种“最难”的动作。这和之前 MiniMax 海螺那种通过 LoRA 实现的物理效果(底模没那么强)有本质区别。

素材与脚本构思: 在生成 单个片段 时,画质很真实。更厉害的是,你只需输入一个简单的 Idea,它就能自动构思出一个包含不同 分镜脚本 的短视频。

Agent 公司的影响: 这种能力对那些做 成片 Agent 的公司可能造成冲击,因为它一个模型就把你的工作流(Workflow)给做了。这有点像 剪映的“一键成片”,无限降低了用户门槛,最终比拼的是你那个 Idea 的价值。这会极大地拓宽创意来源。未来可能需要观察:AI 视频 Agent 还能不能在更复杂的领域找到生存空间?

2. 社交平台/内容平台价值:对 TikTok 底层逻辑的完美解构

从产品经理的角度看,Sora App 的设计是真他妈妙了!它把 抖音/TikTok 最核心的逻辑 给研究透了:UGC 的充足供给,而不是单纯依赖强大的分发算法。

Sora App AI 时代是这么做的:

· 你的 IP 素材 变成了你的数字形象,不再需要自己拍摄(Captured Clips)。

· 基于这个 IP 素材的 二创,能够衍生出大量人与人之间的互动。

它做的事情,其实就是 「即梦」 一直想做的事情。但为什么是 OpenAI 能做成?因为他们是 模型足够强,用 模型 + 产品 的方式来驱动。字节更多是 产品驱动和业务驱动 的,做起来会有点拧巴。

Sora TikTok 的底层逻辑都解构出来,然后参考这套逻辑在 AI 视频上再做一遍,它突破的不是简单的上下滑,而是 UGC 的供给机制。OpenAI 今年在产品力上确实厉害。

3. 产品经理的“玄学”隐忧:新的内容范式还没出现

虽然我觉得 Sora 的设计太妙了,但这反倒让我有点担心。

我们产品经理这种人,擅长解构而非建构。当一个新的东西很容易被解构,并且解构后的逻辑非常清晰精妙,它往往缺乏那种 粗砺的、未经设计的妙。
社区、社交 赛道往往更偏向 玄学,这种逻辑过于精妙的东西,就不一定能成。

现在玩 Sora 的大多还是 AI 圈内的人。现实生活中,Gen Z (GZ) 好像并没有很热衷。反倒是我们这些中登老登们 玩得特别嗨,这可不是一个好的信号。

我现在只是一种模糊的感觉,它可能还是时间问题,需要等待一个真正的 Magic Moment。

4. Generated Clips vs. Captured Clips

我认为 生成的(Generated Clips) 拍摄的(Captured Clips) 内容有本质的不同,因此它们的 生产工具、内容分发和组织形式 也会有本质的不一样,我们可能还没探索出来。

这有点像 GPS 在移动端不仅仅是地图导航,它还催生了 Uber 和美团 这种全新的组织形式。AI 视频的新范式,可能还没有被找到。

Sora 只是把 TikTok 的底层逻辑解构了,然后用 AI 视频又做了一遍,没有突破 TikTok 的范式。但期待下一个内容社交平台的形态!
1029
Kenny_肯尼
11天前
今天ChatGPT推出的Pulse,是近期最重磅的产品更新,可能会带来一种新的产品范式。从用户与ChatGPT的聊天,以及邮箱、日历等非结构化的context信息中,生成结构化的内容,进行主动推送,而非被动回答。

看似是一个feed流卡片,但跟传统的feed流有本质的不同,这是真正的个性化生成,而非个性化推荐,它不是单纯的内容,而是融合了内容、信息、服务。

国内真的,微信是最适合抄它的,继续看好腾讯股票。而抖音里,还是太多娱乐性内容了,个人的context不够,期待国内的字节、腾讯、阿里,该怎么做自己的pulse。
01:07
25
Kenny_肯尼
13天前
用了 indigo 之后,再用 iPhone 17 pro,感觉拍照画质甚至下降了,因为 indigo 还不支持 17 系列,万万没想到这个app 让我降低了拿到新机的快乐(⚆_⚆)📱
50
Kenny_肯尼
14天前
今天逛一个菜市场,门口有大屏幕,展示菜市场的实时交易金额,笔数,摊位分布,今日菜价,乍一眼一看,觉得这个菜市场很有科技感,并且也让菜市场信息更加透明。但实际上,互联网技术,在这个场景下,依然没有突破物理菜市场的范畴,只是小优化,甚至把大屏幕去掉,对菜场里商户和消费者的影响也不大。

互联网+菜市场,更大的机会是闪购、叮咚、美团,多多买菜。因为互联网让信息互联互通,菜市场可以突破线下店铺的物理限制,使得摊位的一边是分布各地的仓库、农场、另一边是每个用户的手机屏幕。

其实现在AI在很多老业务里的应用也类似,看似把AI接入到业务中,降本增效,但实际还没有突破固有思维,这也非常难,期待我们能有机会也有能力定义未来的产品形态,无论大的范式,还是小的细节。
11
Kenny_肯尼
19天前
今天有空把我在字节的最后一篇文档《关于AI、产品、组织和人的思考》,脱敏整理后,发到公众号了,之前有很多公司同事说他们读了很温暖,也有启发,希望对大家做AI产品有帮助~

核心内容

1. AI是这个时代最大的变量,请尽量抓住这个机会

2. 理解行业底层逻辑和用户底层需求,思考加入AI,会带来什么新机会

3. AI native的产品,需要匹配AI native的员工、组织形式、工作方式

4. 相信愿景和故事,但不必执着于过于精细的规划

5. 在约束条件下找最优解,在开放世界里识别信号和噪声,是两种能力

6. 有大致的idea,到体系化的方案,再到落地拿结果,每一步都是鸿沟

7. 只有做需要付出成本的决策,你才会真正提升认知

8. 这个世界是复杂的,人是复杂的,不要用单一维度评价别人和自己

9. 感受生活,认识自己,成为一个完整的人,而不只是解题家

https://mp.weixin.qq.com/s/IqHHZ-zZZZ7IpP-Ik-XLBg

2421
Kenny_肯尼
21天前
最近一周租房,每天早起看房,全天刷房源信息,非常折腾,幸运的是最终找到一个一片绿色的有露台房子,并且几百米范围内就有地铁站、图书馆、健身房、各种餐馆咖啡厅的地方。

我其实很不擅长做这个事情,如果把找房的know how做成一个租房agent,应该会很有帮助,虽然有不少工程性难题

需求痛点

1. 好房源会被秒抢,要时刻刷小红书看最新的房源信息

2. 看房之后,需要一套决策框架,不然犹豫的时候,房子就被其他中介抢走了。或者考虑不周,选的房子看似不错,但实际居住体验差。

核心逻辑

1. 收集需求:通过表单或对话,收集客户需求,可以提供一套框架,比如位置、朝向、楼层、采光(边套全明)、装修风格、价格区间、周边配套等,如果是非标准化的需求,可以让用户提供参考房源案例。

2. 查找房源:基于关键词搜小红书、豆瓣、贝壳等平台,比如 「XX地点 租房」。最好每隔1小时,搜一下小红书,筛选项为「最新排序、未看过、一周内发布」,这样确保你可以最快的刷到最新的房源信息,而老的好房源大概率已经租掉。目前我是人工操作,非常消耗精力。

3. 筛选房源:通过多模态理解,如果房源大致符合要求,就自动收藏在评论区留言 「礼貌询价和地址」,然后中介会私信你,根据回复判断价格和位置是否符合要求;或者也可以直接私信中介,不过一天有次数限制

4. 信息推送:通过上述的动作,可以从大量的房源信息中,筛选大致符合要求的几套房源,及时推送给客户,客户再判断是否要与中介线下看房。

5. 选房判断:基于历史数据,判断价格是否合理;看房和下定金时,基于客户提供的房间视频、地理位置等信息,提供看房的决策指导,帮助客户规避问题。

模型依赖

1. Computer use,Search:基于用户需求,以用户身份,去各大平台找房源

2. VLM:分析用户的参考案例,分析小红书豆瓣上的房源图片和视频,判断是否匹配

3. LLM:收集用户需求,判断用户需求与房源信息是否匹配,与中介对话拿到更多信息

租房know how

1. 时间:7-8月是旺季,房源多,租户多,看谁手快;9月初开始淡季,但依然有学生出来租房,这时候房源少,短期内学生需求多,不好抢房子;9月下开始,房源少,需求少,反倒好租房了,价格会降低

2. 周边:距离地铁站的距离,周边是否有餐馆、健身房、图书馆、咖啡馆,快递外卖是否好送货上门,对生活的幸福感很重要

3. 户型:比较贵的是,南北通透,边套全明,三四层楼梯房,或者再高一些的电梯房。窗外不要对着其他住户的窗户,否则隐私得不到保障,最好是推窗见绿。

4. 装修:倾向选择房东自住的,家具品质比较好,尤其那种有钱有文化的房东。那种二房东批量的,看似新,但品质不好。以及新装修的房间,因为甲醛问题,不好租。

5. 细节:
- 放水,看水压是否足;
- 墙角和家具是否有霉点霉味,判断湿气重不重;
下水道是否容易堵,这个看不出来,顶多闻闻味道;
- 衣服是否好晒;
- 最好双层玻璃,这样隔音和冬天保暖都更好。

6. 中介:
- 推荐选择女中介,男的中介磨磨唧唧的,与房东谈判能力弱,而且很难get到你的审美。好的中介,会有很大的帮助,包括选择房源和谈价格;
- 除了链接贝壳(市场份额可能40-60%),还可以在当地路边的房产中介店里问房源,他们手头也有非网上流通的房源;
- 下定金时,要中介提供工作证,避免被骗钱。

7. 综合:价格、位置、品质,是租房的不可能三角,只能在预算范围内,找到最适合自己的房子。但租房不是一个高度标准化和透明化的市场,有时候运气好,你会捡漏到低价好房。
85
Kenny_肯尼
23天前
Cursor 最近发了一篇技术博客《Cursor Tab 的在线强化学习》。用过 Cursor 的同学应该很熟悉 Tab 功能,它会自动预测你的下一步操作,而不是等你手动输入。为了让 Tab 更准,Cursor 用了用户的在线数据做 RL,并且频繁给用户推新模型,实践结果是新 Tab 模型的采纳率提高了 28%。

这可能意味着大模型可以像推荐引擎一样,依赖用户反馈数据自我迭代,形成数据飞轮数据飞轮的壁垒,虽然实践起来没那么容易,但给了很好的方向。

原文地址 cursor.com

双语版本 ybzavo65ti.feishu.cn

核心内容:

1. 在线数据驱动:Tab 每天处理超 4 亿次请求,并在 1.5-2 小时内回传数据做训练更新。核心是快速的数据流和模型部署能力,几乎是“准实时”的在线学习。

2. 采纳即奖励:用策略梯度优化 Tab,奖励用户接受的建议,惩罚拒绝的建议。如果建议被接受概率低于 25%,模型就不显示。

3. 真正的个性化:不是靠 context hack,而是直接基于参数更新,把用户的采纳/满意度转化为 reward signal。

4. 持续学习闭环:不像常规几周/月一次大版本迭代,而是频繁上线新模型+实时优化,形成真正的“持续进化”。

对在探索开放场景下如何做 RL的同学可能有些参考价值,尤其是如何把产品里的“用户满意度”变成 reward,再配合高频模型迭代。
27
Kenny_肯尼
25天前
Nano banana 8.26上线,到9.3就为Gemini拉新1000w+,生图2亿张,让人想起 3月份 GPT4O 生图能力让ChatGP在1小时内新增100w 的神话,再次证明好的模型就是流量本身。

如果大家有similarweb、data.ai的权限,可以后面看看higgsfield、lovart、Gemini等接入nano banana的AI产品,访问量下载量增长有多夸张,看谁拿到了最大的模型红利。

以及期待一下近期seedream 4.0对各个 AI 产品的带动作用,希望可以超越6月3.0版本的数据贡献,6 月它救了我这个Q3 okr
11
Kenny_肯尼
26天前
昨天说到「机械性的数字化程度高的智力型工作会比较危险」。今天跟朋友聊天,知道一个让我震惊但是又喜感的故事,国外一位实力接近联合国翻译员的老师,因为这几年AI翻译进步太快,已经接不到多少翻译活儿,于是偶尔出来摆摊卖台湾小吃来赚钱,明年准备发展为正式的事业,因为如果出摊勤的话,要注册税号。

几个月前跟做模型测评的同学闲聊,对方说先练好厨艺,过几年当厨师,因为AI还没那么快获得嗅觉。几个月前的玩笑话,没想到现在已经发生在另一个人身上。

研究生读的上外高翻,之前因为同传在民间的神话,很难考,学费差不多10w。现在因为AI,笔译专业都很难招到学生。说实话,现在学笔译,就是49年入国军。之前翻译算是比较高精尖的职业,短短两年,就跌得比较厉害了,学新技能,尽量绕开AI进步的主路径。

晚上被朋友带着,蹭了一节免费的瑜伽课,在老洋房里,跟几位家庭主妇们,岁月静好,感受呼吸,我觉得瑜伽老师的工作是挺稳的。
101
Kenny_肯尼
27天前
最近越来越感受到,机械性的数字化程度高的智力型工作会比较危险,而那些看似不高端的工作,反倒更稳,其实我们都是草台班子。

举一些我最近的生活案例:

搬家离开小区,要开放行条,以及退还门禁卡。进入小区的管理处办公室,像二十年前的那种办公室,很多文件,我要手写填各种资料,以及打印资料。AI估计还没办法立即取代办公室的职员,因为AI还拿不利索那么多纸质资料。

去南山图书馆,退300块押金,我要提供身份证,前台小姐姐肉眼判断我是同个人后,从抽屉里拿出三百块现金,我拿到纸币都愣住了,没想到在深圳还能拿到纸币。

上面两个案例,不是什么体力劳动,智力层面也超级简单,AI完全胜任。但问题是,它有一套为人做的基础设施和机制,AI很难快速介入。这些员工做的事情挺简单的,但是很杂很多,工作弹性很大。以及对单个物业,对单个图书馆,通过AI,替代几个职员,带来的收益也有限。所以他们的工作是稳的。

可能大部分人的工作都是稳的,因为这个世界的数字化的程度,比我们这些互联网人想象的还要低。

再来看几个高精尖的案例,已经有一些对员工现有能力模型的不利信号了:

之前起草合同、审合同、写文书,都是要找律师的,花几万块。这两年不少律师也开始用AI写合同再自己review一下,实际工作量很小,但是骗客户说自己花了很多时间写,不然收不到那么多钱。出现一些法律咨询机构,招了不少学生工,这些法律专业学生大量通过AI来写合同,价格非常低,对客户来说,其实也够了。AI在帮助律师提效,但也在蚕食律师的生存空间,只不过不是AI直接替代你,而是AI+更便宜的人来替代你。

程序员现在基本都是用AI coding来提效,纯手写的,可能有点偏古法编程。在大厂里,相对还好,因为屎山代码,直接干爆claude的上下文,只能做一些独立的小东西,或者更偏页面的。而AI创业公司里,没有屎山代码,AI native的逻辑也更简单,所以AI coding的占比比较高,cursor+我=全栈,随着模型的coding能力的继续提升,未来纯写代码的程序员可能也会危险,程序员可能要掌握,如何让AI帮我干活,意味着一线程序员要有leader的架构思维和管理能力。

deep research的写报告能力,已经非常强,是我离不开的工具了,相比人而言,它只是获取到的数据权限还不够多而已。如果你只会基于公开数据写报告给老板看,而没有真正的业务判断,那也会有点危险。

我们经常说这个世界就是一个草台班子,听起来大厂的产品、程序员、战略等等是很高精尖的工种,但我们审视一下自己的工作,的确大部分都没什么技术含量,甚至不用动什么脑子。

而且我们的工作的数字化程度太高了,哪怕把我们的一个员工,关在地牢里,给一根网线,一台电脑,就可以正常干活,其他同事也不知道他其实是被关在地牢里的,反正只是飞书的一个头像。

数字化程度高,意味着AI拿到的数据越多,标准化程度高,意味着reward model更容易找到。互联网带来的数字化,标准化,其实是为AI铺路。

我相信,最终人类还是会驾驭AI,AI让世界变得更好。但是假如有几十年的适应阵痛期,对人类整体来说还好,对个体来说,可能就是极大的痛苦。

每个岗位上的我们,可能都要抽空想一想,假如AI变得更强了(推理、上下文窗口、多模态),为它的基建更好了(context、tool use),那我哪些能力会被替代或弱化,哪些能力是我的真正价值。打败你的不一定是AI,而是另一个更擅长使用AI的人。
13