Kenny_肯尼的个人主页

即刻App年轻人的同好社区

下载

App内打开

Kenny_肯尼

487关注3k被关注6夸夸

AI产品经理
内容创作者和观察者
探索普通人和大模型的交互关系

置顶

Kenny_肯尼

3月前

过去2年，一直在探索如何把大模型跟普通人的创作结合起来，做过亿级规模的大众产品，也做过百万级规模的垂直解决方案，拿到比较多的用户反馈

在此分享AI应用的产品经验，希望可以帮助大家少走弯路，交流经验。拉长周期看，我们现在做的项目本身可能没那么重要，但我们积累的认知和经验会帮助我们迎接更大的机会

核心内容

1. 对过去成功路径的过度依赖，可能是未来成功的阻碍，从基础理论开始学习，上手体验和实践，保持迭代

2. 找到Model-Product-Market-Fit是核心能力，模型能力（现状&未来）匹配用户需求（存量&增量）
用户需求是渐变的光谱，按过去的旧分类，AI只能替代存量解决方案，无法创造增量市场

3. 有些实用价值的伪需求，但其实是有情绪价值的真需求

4. 给用户交付的一个结果，而非单纯做体验，通过管理用户预期，收敛场景，最终满足甚至超出用户预期

5. 把AI封装为原子能力，通过工具->模板->内容，带来乘数效应，而非单纯的漏斗转化逻辑

深度复盘｜做AI产品近2年总结出来的25条核心认知

148 5558

Kenny_肯尼

1天前

有的 agent 产品效果出奇的好，发现他们为部分客户交付的结果，其实背后是有人工牛马在默默劳作

23 102

Kenny_肯尼

7天前

今天在开会，要提一个给内部人员使用的工具，本来是想文字简单说一下逻辑，觉得还是不够直观，于是就 10 分钟用 lovable 做了一个可交互的网页，比我自己画 figma 还轻松。

如果每个公司都有 AI coding，支持调用各种内部服务，那产品经理可不要太爽，各种搭 demo，不需要口若悬河讲 idea 和数据论证了，直接展示 demo，更容易对齐和争取资源

28 33

Kenny_肯尼

7天前

剪映是视频剪辑的一座大山，而视频化表达是更广阔丰富的世界，看到 medeo 在探索一条不一样的路径，鼓掌👏

晨然_: 终于发产品啦 Medeo 一键生成/剪辑视频！这是我们对新视频制作和信息呈现的思考！也是我人生中第一个做产品负责人的产品☺️ 欢迎关注 medeo.app

10 01

Kenny_肯尼

8天前

大模型的尺度稍微放开一些，就意味着流量，但擦边要有一定尺度，过了，风险急剧上升，也损害模型本身的品牌

6 11

Kenny_肯尼

9天前

prompt是非常高门槛的交互，比搜索框还难，这目前基本是圈内共识，那它未来会不会成为大众的主流交互呢？这个还挺有争议

回顾历史，PC互联网的用户门槛其实非常高，核心交互是鼠标和键盘，而键盘上手很难，记得小时候练打字练了很久，尤其记住键盘字母排布，不亚于记日语五十音，而且打印店的一个重要业务是把手写稿打字为电子文档。

而早期上网一个重要消费形式是论坛，需要打字交流，所以用户知识层次较高，后面形式泛化，有淘宝、豆瓣、贴吧、知乎、门户、爱腾优，搜索依然是重要交互。新上网人群，都要学会打字，否则无法接触那么多信息、服务和娱乐。PC互联网巅峰的PC网民应该三亿左右。

移动互联网交互是触摸屏上点击滑动，门槛大大降低，微信语音消息，抖音上下滑，小孩子不用教都会用，网民数量扩张到10亿多，但是对没有经历pc互联网且数字化能力弱的中老年人，使用门槛依然高，我们很多年轻人都要教爸妈使用微信，他们基本也就微信抖音，不会装太多app，淘宝都可能不会用。

他们必须学习使用手机，尤其微信，否则他们在社会上寸步难行，14亿人口都主动被动的学会了手机上网，哪怕当中还有文盲。

现在与大模型的核心交互是对话，而大部分人都没有清楚表达需求的能力，目前的解法有：

1. 把高频常用的prompt或workflow简化为一个按钮，用户点击即可获得对应结果，比如一键翻译、一键润色、一键总结。

2. 语音模式，闲聊陪伴为主，说话比打字容易很多，当然内容也浅很多。

3. 把用户的各种中间产物作为context给模型，比如figma的草稿给模型生成网页，不需要用户用文字描述网页长什么样子。

4. 依赖对话式表达，比如各种agent、copilot、chatbot，目前还是服务Pro C端用户，没有真正进入大众，这种交互的好处是，可以发挥模型的泛化能力，并且随着模型进步，产品的效果和体验会越来越好，突破了预设workflow和一键式的限制，坏处是对用户门槛很高。

去年我对这套交互还是悲观的，觉得prompt主路径的用户规模就在一亿左右，但今年deepseek的热潮，带上家国情怀因素，让三四线用户都开始学习用大模型，甚至deepseek的书籍都成为各大书店热销榜，短短几个月人群就扩张到3亿左右。

有可能，年轻的AI native用户起来，他们成为主流，那么剩余的用户都要学会对话的交互。或者，可能最终有新的交互范式会取代对话式的中间态。

年底再看看。

52 3026

Kenny_肯尼

11天前

写prompt是不是重要的能力？这是个持续两年多的争议话题，哪怕今天也没有真正形成共识。

最开始，大家认为prompt是开启大模型神秘力量的咒语，Midjourney、ChatGPT都有不少专门的prompt收集网站，一个好的回答，一张酷炫的图，评论区都是“求prompt”，以及很多AI产品背后也是prompt engineering（PE），甚至prompt engineer会成为一个新兴职业。

后面出现一个新声音，随着模型越来越强，能更好理解用户意图，prompt engineering已死。而且我在美国做创作者调研时，普遍也反馈现在他们发现prompt越来越像人话，不像早期的prompt非常复杂且带着各种参数，都看不懂。

那实际呢？

我认为普通用户不需要学prompt，就自然表达需求即可，很多复杂的prompt都是多此一举，就像网上一些修图教程把后期操作弄得贼复杂，实际是忽悠小白的。

但作为AI从业人员，是依然需要掌握PE能力的，这里的PE不是照猫画虎写很复杂的看起来很牛逼很专业的大段文字，而是一方面深入理解业务场景，抽象提炼出要求和标准，另一方面理解模型的能力和特性，把模型当作一个人，聪明但自闭症，你来帮助它在你们业务landing，从而发挥它的才智。

PE没有固定技巧，尤其没有固定套路或格式，因为模型一直在进步，你的某些既定套路，甚至你的先验知识，反倒限制了模型的发挥，就是需要不断调，不断测，不断看

推荐看一部美剧《良医》，里面的自闭症天才医生墨菲，在同事们的信任和帮助下，逐渐成为患者信赖的医生，这里有很多磨合、了解的过程，但最重要的就是感受模型，理解业务，其他的技巧都是表面的。

就像谈恋爱，没谈之前，会纠结女生能不能主动约男生，谁来表白，要不要送对方去飞机场，然后到处问老司机这些傻白甜的技巧性问题。

不要想那么多，先去谈，谈了就知道这些都是表面小问题。更难的也更重要的是，是否三观契合，是否真诚，是否真的喜欢，是否性格匹配，是否妈宝，而后者只能自己亲历才知道。

56 2117

Kenny_肯尼

14天前

大神Andrej Karpathy用vibe coding做了一个菜单图片生成器MenuGen，是AI编程非常好的案例，详细说明了需求来源，编程的思路，遇到的各种问题，最终上线的体验。

MenuGen体验地址 www.menugen.app

关于这个需求痛点，我深有同感，在美国欧洲的餐厅点餐，拿到菜单，就是一页纯文字的菜品列表，只有名称+一行文字说明，根本不知道这些菜到底是怎么样的。

我刚开始以为是自己英语菜，但是问了local同事，他们也说其实也经常看不懂，所以他们会查Google maps的食物图片。我问为什么餐厅不改成图文并茂的菜单，比如中餐馆，说这样就不够好看 aesthetically appealing🙄

Karpathy用cursor+claude 3.7编程，拍照，用OpenAI API做OCR识别菜单，用了Replicate API基于菜品描述生成图片，逻辑比较简单，生成图片跟餐厅的实际菜品可能也有差别，但对食客来说已经够用了。

由此对AI编程的一些思考

1. AI编程不是单纯降低传统编程的成本，而是开拓新的场景。大厂程序员的饭碗还是很稳定的，AI编程只能做做小东西，还无法根据产品经理的需求单来生成可用代码，以及多年积攒下来的屎山代码，也不是大模型能驾驭得了的。

2. 很多需求没有被满足，不是单纯编程成本的问题，还涉及到利益格局。比如美国餐厅坚持用纯文字菜单，为了审美调性，不然图文并茂会让餐厅掉价，虽然顾客需要图片参考；比如出版社对采用AI翻译的意愿不高，因为每个语种都可以卖版权，一键AI翻译后，他们没办法赚钱了。围绕用户的个性需求，AI编程可以避开这些传统利益带来的限制。

3. 现在大模型本身可能不是最大的瓶颈，而是服务于大模型的基建缺乏。过去几十年，互联网进行了数字化，线上化，但这套信息基建是围绕人建立的，比如人的鼠标+键盘+显示器对应的交互，或者各种文档、接口是给程序员看的。如果我们接下来把大模型当做一个人，那就需要为它配备对应的基础服务，帮它landing好，否则它没办法好好干活

4. 过去的旧分类，会被新生事物打破。figma是个设计UI的软件，但它这周推出了Figma make，设计师直接基于设计草稿就可以生成可交互的网页；Canva是个图片模板产品，但4月也推出 canva code，图片模板创作者不再是它的唯一供给，营销图片也不是它唯一能满足的场景；秘塔搜索支持对搜索结果，生成可视化的网页，编程这里是内容的呈现方式，而不是功能。