mingsheng1的个人主页

即刻App年轻人的同好社区

下载

mingsheng1

72关注544被关注0夸夸

曾经微博首位产品负责人，现在某电商公司AI应用产品总监。
下班玩🦞，例如搞IM、日记…
计算机系毕业，本不喜欢编程，现在每天AI编程。

mingsheng1

12天前

多年来都想有一个批量删除大图片的APP。主要需求是经常随手截图，没有及时清理。时间久了，已经有1万多张截屏了，清理起来又很麻烦。
刚才，决定自己AI编程搞一个。打开cursor，输入以下提示词：
给我做一个图片整理app，用于ios1、可以查看某一类图片，例如截屏；2、可以看到图片截图和大小3、可以根据图片大小排序4、可以选中然后批量删除图片，删除的图片进入ios的删除图片目录，不要直接彻底删除，以避免误操作。
我的电脑有xcode，你看看。
几分钟，即可搞定，包括Xcode所需的配置文件。2024年没这么容易，那时候AI编程工具只能编码，还不能设置xcode所需文件也不不能调用xcode编译。
效果如下，启动速度有点慢（可能需要几十秒），不过几分钟一次成型的App，我也不需要经常用，就这样吧。
1️⃣按照文件大小排序查看图片
2️⃣选择若干图片，点击删除，这里会有一个确定的操作。（我选了102张）
3️⃣以上是App内置的确认，发现苹果手机很贴心地再次确认。
4️⃣搞定了，去手机相册里看了看，102张照片已经进入删除文件夹了。😃

6 21

mingsheng1

12天前

都已经2026年4月份了，京东上的这些商品规格还是没有提供清晰的解读功能，我只好通过豆包来去对比这些参数到底有什么区别。（以及，这种几年才会买一次的东西。买了之后，京东首页又是一大片的推荐，难道它希望我再买一个吗？还是希望我把刚才的订单退掉重新买一个？）

1 00

mingsheng1

13天前

同理心说起来简单，但真正要做好还是蛮难的。刚才听播客，某些环节我会想这种问题还需要问吗？因为有些事情是我自己作为产品经理参与过的，知道里面运行的机制。后来我又反思了一下，我自己经历过类似的事情，所以了解。但是大多数人没经历过。互联网细分又很明显，在有一些其他的场景，比如说游戏领域，可能他们习以为常的事情我也不懂。

4 20

mingsheng1

19天前

这篇关于Notion的报道还挺有意思的，推荐阅读。
Inside Notion
The culture, people, and quirks behind the first pre-GPT company to become “AI-native”
By Brie Wolfson & Camille Ricketts
April 2026

1 01

mingsheng1

21天前

这几天的一个感想：
聊天式AI ，是数字世界的服务业；
OpenClaw这些AI Agent，是数字世界的制造业；
而 AI 编程，就是数字世界制造业里的先进制造。

3 00

mingsheng1

22天前

Hermes 取代OpenClaw？没必要非此即彼，两个一起用起来

近期一些文章在谈论Hermes取代OpenClaw，我觉得不用在Hermes和OpenClaw里二选一，双助手组队比单干稳得多、成长更快！
单跑一个助手可能有如下问题：卡住无响应、配置改错直接卡死，干活有疏漏……

双助手组队方案
1. 分工兜底，取长补短
同一服务器部署两个助手，一个负责日常执行任务，另一个专职监控——能实时查看对方代码和运行日志，遇卡死、配置错误自动重启修复，告别“无人救援”的尴尬。

2. 互相学习，越用越聪明
两者架构、模型不同，遇到问题就一起讨论交流，取长补短。现在AI都有短板，这样双向学习，能快速补齐各自的不足。

3. 拥抱迭代，不做“取舍党”
Hermes和OpenClaw都在快速迭代，局部各有优势但都没到“完美替代”的地步。与其纠结选哪个，不如同时跟进两者的更新，看着它们一起进步、一起成长，既能体验新功能，又能保留各自的长板。

2 00

mingsheng1

25天前

推荐阅读：@FredaDuan（Altimeter Capital 投资人）
───────────
AI时代的组织设计

过去几个月里，我与各类企业交流探讨——从初创公司到大型巨头——话题围绕AI如何改变它们的工作方式。所有人都在为工作流程引入AI，却几乎没人追问：这套流程最初为何会是这般模样？
当下现状

一家企业剥离表象，本质只包含三样东西：人员、层级架构、信息流转。
层级架构的核心并非权力，而是信息传导——企业规模过大，没有人能掌握全部信息，因此设置管理者来汇总、梳理、传递信息。会议、工作汇报、指导委员会、季度业务评审，本质都是信息传导机制。它们之所以存在，是因为人与人之间传递知识成本高昂。

而AI，让这份成本变得极低。

看看如今的产品开发流程：
产品经理撰写需求文档 → 设计师据此产出原型 → 工程师将原型转化为代码，预估“八周工期” → 需求变更、需求文档重写 → 开发耗时数月 → 测试人员做回归测试 → 市场团队筹备上线。一个中等功能模块，往往需要3～6个月。

真正的瓶颈从来不是速度，而是转译成本：
产品经理的意图 → 文档 → 设计师的理解 → 工程师的理解 → 测试人员的理解。每一次交接都会损耗信息精准度，需要反复对齐，产生大量等待时间。

AI，直接消弭了这些转译环节。
AI时代的组织设计

产品经理从构思到可用原型，只需一天。
代码编写的同时，AI自动生成测试用例。
智能层实时整合用户反馈与业务数据——取代了过去每周汇总这些信息的管理者。

这并非单纯让每个岗位效率提升，而是岗位间的间隙——交接、排队、对齐会议——彻底消失。

核心变革

1. 接力赛 → 篮球赛
小型团队，3～5人，技能全覆盖，同步推进工作。绝大多数决策在团队内部即可完成。

2. 部门制 → 能力原子化
可组合、独立的能力单元——如用户聚合、身份验证、风险评估，彼此灵活搭配使用。

3. 产品经理转型为创造者
减少为他人转译想法的时间，更多精力用于直接验证方案。

4. 中层管理精简
留存下来的，是凭借判断力与指导能力创造价值的人，而非仅负责信息传递的管理者。

5. 测试与开发深度融合
质量管控成为内置防线，而非后期审核关卡。

6. 系统自主生成发展路线
以杰克·多西举例：某餐饮商户现金流在淡季来临前趋紧，系统自动监测到这一情况，打包适配还款计划的短期贷款方案推送给商户——早在商户察觉问题之前。这并非产品经理规划的功能，而是系统捕捉时机、组合现有能力自主实现的。

7. 版本发布周期 → 持续迭代
每日上线更新。舍弃大型发布带来的即时满足感，换取持续、稳健的价值交付。
企业的竞争壁垒，将从执行速度转向学习速度——组织能多快吸收AI带来的全新可能，并围绕其重构自身。

大多数企业只是把AI当作更快的马。
而真正领跑的企业会思考：如果从零开始搭建组织，我们会打造怎样的全新体系？
原文链接 robonomics.substack.com

3 11

mingsheng1

29天前

模型日趋成熟，AI的下一程：比拼工程配套与真实体验

每天刷AI资讯，这几天的感受是：模型仍在持续迭代，能力也在稳步提升。文本理解、自主任务处理、多场景交互等方向，新模型与新基准不断出现，例如：

• 《Claude Mythos官宣！性能碾压Opus 4.6，因太危险遭「囚禁」》（量子位）

• 《刚刚，Anthropic祭出最强Claude Mythos！暴击Opus 4.6，跪求千万别用》（新智元）

Claude Mythos这类模型，能力已经强到需要通过限制发布来规避安全风险，这恰恰印证了一个越发清晰的趋势：对多数场景而言，模型基础能力已经可以满足需求。真正影响落地与体验的，往往是模型之外的部分——Harness工程骨架、部署方式、知识库、数据自主权以及更贴合日常的交互方式。

行业讨论也在印证这一转向，多篇文章都聚焦于此：

• 《我把Karpathy的知识库方法论落地了，效果超出预期》（云小虾）

• 《深度｜对话LangChain创始人：为什么Manus和Claude Code这么强？秘诀不在模型，而在顶级Harness》（Z Finance）

• 《同一个模型，换个Harness排名跳了25位：智能体基础设施完全解剖》（深思SenseAI）

这些内容共同指向一个核心：AI能否真正用好，越来越依赖模型以外的工程体系与配套设施。

我最近在使用AI编程工具时，对此感受尤其明显。单看模型，AI编码能力已经比较完善：理解项目结构、执行命令、排查问题、长时间完成工程任务都比较从容。但落到实际使用，体验上的短板很突出。

我有一个很朴素的需求，技术上并不复杂：

• 代码存放在我自己的云服务器；

• AI在我的服务器上操作文件；

• 手机上有官方APP，随时查看进度、下发指令、简单干预。

简单说：代码自己掌控，手机随手可控。

但主流工具大多不能顺畅满足。要么强制把代码托管在平台云端，要么只支持桌面端，远程操作体验割裂。像Windsurf这类主打AI工程的工具，甚至没有官方手机APP，更无法实现手机直连自有服务器。

不少工具推出的“云端代理”，也只是把任务跑在平台自己的服务器上，而非我自己的服务器；有的支持代码托管，也只绑定GitHub这类固定平台，没有给用户选择权。

其实 OpenClaw 已经能实现“代码在自有服务器+手机远程操作”的模式，只是它在AI编码上不够专业。我更希望的是：把 Cursor、Codex 这类成熟的AI编程能力，直接部署在我的云服务器上。

这并非个例，而是很多AI应用的共性问题：
模型在持续升级，配套却常常被忽略。
数据是否可以留在自有环境，不是优先考虑；
自定义部署到个人服务器，大多只面向企业版本；
手机端等跨设备操控，体验普遍粗糙；
稳定的执行框架与可预期行为，优先级往往低于 benchmark 表现。

行业越来越多地讨论Harness，也说明大家开始达成共识：
同一模型在不同工程框架下，落地效果差异明显。
AI能否顺畅融入工作流、让人放心使用，更多取决于工程配套。

模型决定能不能完成任务，工程配套决定用得顺不顺、安不安心。

未来AI的竞争，会慢慢从模型能力，转向工程化落地、使用体验与自主可控性。

模型已经走向成熟，现在该好好打磨配套的工程与体验了。

2 00

mingsheng1

1月前

AI Agent时代，我们还需要 PPT 吗？

早上听十字路口采访Moxt 的播客，有个转变值得琢磨：OpenClaw 出现后，隶属于猿辅导集团的这支AI探索团队，放弃了原本做了几个月类似Lovart 的产品形态，转向 AI 工作空间。
他们说本来是想写一个Markdown文件的共享服务，后来做成了工作空间。一个很关键的选择是：不再用传统 Office，也不用类 Office 的在线文档，转而用 Markdown 和 HTML 来做内容载体。理由也很直接——这种开放格式，更适合 AI Agent 之间高效协作。

这一点我自己也有体会，尤其演示文稿这件事。先回到一个根本问题：当年为什么会出现 PPT？
其实就是为了解决演讲场景的刚需：演讲时需要图文并茂，需要简单的排版和动画，同时要封装成一个编辑简单、操作门槛低、方便传递的文件。
PowerPoint 诞生于 1987 年，由硅谷公司 Forethought 开发，最初只支持苹果 Macintosh 系统，后来被微软收购并成为Office的一部分。在那个大多数人不会写代码、不会做网页、电脑以文本操作为主的年代，演示是专业设计师或技术人员才能完成的事。PPT 把复杂的视觉展示能力封装成傻瓜式工具，让普通人也能快速做出像样的演示，它是为“大众能力不足”这个时代约束量身定做的产品。

今天，这套逻辑已经开始松动。
网页技术本身，完全可以实现 PPT 能做的一切：图文排版、翻页切换、动画效果、全屏演示，甚至能做到更丰富的交互。
以前大家不用 HTML 做课件，是因为网页制作有技术门槛，不是人人都能写。但现在不一样了，AI 编程工具的出现，让普通人也能快速生成页面、调整样式、实现交互，原本专业的事情变得大众化。

这就很像 SaaS 软件和自主开发的区别。
SaaS 是别人做好一套功能，你在框架里使用，方便但受限；PPT 也是一样，是一套固定好的演示工具，你只能在它的规则里排版、加动画。
而 HTML + AI 编程，更像是自己动手搭建，自由度更高、格式更开放、拓展性更强。

我去年安排团队做过 AI PPT 工具，自己写过一些从0到1的代码，实际感受并不好：PPT 格式封闭、结构复杂，AI 去解析、生成、修改成本高、耗时长，功能也多局限在模板替换，很难真正灵活发挥。

反观 HTML，优势就很突出：
• 开放标准，AI 更容易理解和生成
• 制作更快、成本更低，不用复杂渲染引擎
• 图文、翻页、交互都能轻松实现，展示效果不输 PPT
• 浏览器直接打开，跨设备适配，修改也更方便

去年 9 月，我的几场讲座就全程用纯 HTML 做课件。效果图文并茂，翻页流畅，整体体验比 PPT 更顺手，修改效率也高很多。（因为，我用AI编程工具来修改）

放到 AI 时代这个大背景下看就更清晰了：
当内容生产不再只是“人创作、人演示”，而是加入大量 AI Agent 协作，开放、易解析、易协作的格式，就会比封闭、封装好的工具更有优势。

PPT 曾经解放了演讲的生产力，让每个人都能做出像样的演示；而 AI + HTML，则进一步解放生产力，让每个人都能跳出固定模板，自由搭建更适合自己的展示方式。

5 00

mingsheng1

1月前

从Anthropic套餐禁止OpenClaw，谈谈AI自动化冲击互联网流量商业模式

昨天（4月5日），Anthropic发布新规，Claude Pro、Max包月套餐禁止OpenClaw这类第三方AI智能体工具调用，需单独购买按量计费。原因在于，这类套餐原本面向人类日常手动使用设计，用户频次可控。OpenClaw这种智能体能7×24小时自动化调用，单个账号算力消耗远超包月费用，平台无法承受激增的成本压力。

自动化运行带来成本压力，这个事情让我想起了3个月前的2026年1月，前端开源框架Tailwind CSS也陷入经营危机。该框架原本靠开源免费吸引用户，开发者通过访问官网文档解决使用问题，平台借此实现付费组件、广告及企业服务变现。可AI编程工具普及后，AI可自动完成安装、编码与故障排查，开发者不再需要人工访问官网，直接导致平台流量暴跌，商业收入大幅缩水。

值得注意的是，这两个案例的受众主要以AI开发者为主，这批人对于新技术敏感度高、接受速度快，率先遇到了AI自动化带来的商业挑战，而随着技术的进一步普及，未来会有更多群体、更多场景面临类似的问题，这并非小众领域的个例，而是全行业的普遍趋势。

这一冲击的节奏会有明确的先后顺序，一开始受到影响的会是依托电脑浏览器访问的服务。这类网页端服务操作流程标准化程度高，无复杂系统权限限制，AI容易实现自动化操作，无论是网页查询、内容浏览还是工具使用，AI都能替代人工，绕开所有广告与推荐板块。
随后，冲击会逐步过渡到手机APP生态。随着AI手机助手、系统内置AI能力持续升级，功能不断强化且使用成本持续走低，手机端的各类日常操作也会被AI逐步接管。用户无需手动打开APP、刷页面、点击广告，AI助手便可直接完成购物、资讯获取、服务办理等全流程操作，APP的日活（真人）、页面流量、商业转化都会随之大幅缩水，依托移动互联网的流量变现模式，同样会遭遇严峻挑战。

整个过程并非突发的黑天鹅事件，而是典型的灰犀牛。

一直以来，互联网行业的核心商业逻辑就是流量变现，电商、内容、工具等各类平台，均以DAU（日活跃用户）为核心指标，依靠人类主动的浏览、点击、互动完成商业转化。但AI自动化彻底打破了这一逻辑，当人工操作被AI代理，流量不再是真实人类的主动行为，页面广告、算法排名、用户转化的商业价值都会大幅衰减，整个互联网流量生意的根基都在被动摇。

从AI开发者到普通大众，从电脑网页端到手机APP端，AI自动化的渗透是不可逆的过程，这头灰犀牛已然逼近。对于所有互联网从业者而言，摒弃传统流量思维，提前探索AI时代的新型商业路径，拥抱变化吧。

4 00