即刻App年轻人的同好社区
下载
App内打开
孟健AI编程
9关注156被关注0夸夸
DeepSeek畅销书作者(94万册)· 大厂10年→全职创业 · 一个月做30个出海产品 · AI编程/出海/一人公司
孟健AI编程
1天前
Claude Code 这次源码泄露,我第一反应不是八卦,而是又提醒了一遍:团队里哪些动作不能再默认放手给 agent。

我现在还敢交给它的,主要是读代码库、解释上下文、批量改低风险文件、起草 PR。
但像装依赖/跑未知脚本、改部署链路、碰生产凭证这类高权限动作,我会先收回来,至少加 review gate 和最小权限,不然出事时你连它到底怎么做的都很难复盘。

这类工具越强,越要把“能回看、能追责、能复盘”补上。

你们团队现在最不敢默认交给 coding agent 的动作是什么?
00
孟健AI编程
2天前
刚上线了一个 AI 角色生成器 getchargen.com 🎲

输入一句话描述,自动生成角色肖像、性格特征、背景故事和完整角色卡。

适合 DnD 桌游玩家、小说作者、独立游戏开发者。

免费使用,欢迎试玩:getchargen.com
00
孟健AI编程
3天前
昨天看到 axios 这次 npm 投毒,我第一反应不是“前端包又出事”,而是:如果团队已经让 Claude Code、Cursor 这类 agent 在本地或 CI 里自动 npm install,这条链路其实已经默认给了它一次执行权限。

StepSecurity 的时间线里,恶意版本 axios@1.14.1 0.30.4 只挂了不到 3 小时,但 postinstall 会直接拉起跨 macOS / Windows / Linux 的后门链路。对团队来说,真正该重排的不是“要不要继续用 agent”,而是哪些动作还能自动放行。

我现在会先把 3 类动作拉回 review:装依赖、跑脚本、改 lockfile。尤其客户仓库、带云凭证的 runner、会碰生产密钥的环境,先锁版本、尽量 npm ci、能关 lifecycle scripts 就关。

AI 编程让写代码更快了,但也把默认信任链拉得更长了。

你们团队现在最不敢让 agent 自动执行的步骤是哪一段:装依赖、跑迁移,还是直接动 CI?
00
孟健AI编程
4天前
这两天看 Claude Code,我最在意的已经不是“它强不强”,而是哪些任务现在可以放心交,哪些先别交。

官方 3 24 日把 auto mode 作为 Team 研究预览放出来,3 30 日的 changelog 又补了 PermissionDenied hook 和被拒动作提示。说明终端 agent 真正进入第二阶段了:不是单纯追求少点几次确认,而是开始认真处理权限边界、长任务稳定性和团队可回看性。

我现在会先把它放在 3 类任务上:
1. 重构和批量改动
2. 跑命令、改脚本、查上下文
3. 输入输出明确的重复活

但复杂 UI、涉及生产数据的高风险操作,我还是不会直接放手。

另一个信号也挺明显:官方 usage analytics 现在还是 Team / Enterprise 视角在讲,这波终端 agent 最先成熟的,可能不是“个人爽”,而是“团队能不能管、能不能复盘”。

你们现在会把 Claude Code 放在主力位,还是后手位?哪些任务你已经敢交,哪些还不敢?
00
孟健AI编程
6天前
这两天重新看 OpenCode,我第一次认真把“终端 agent”当主力位候选,不只是因为它开源,而是少切 IDE、浏览器、终端这几步以后,整条 workflow 真的顺很多。

最近 7 天里,OpenCode HN 拿到 1270 / 621 评论,GitHub 已经 13 万+ star;Gemini CLI 也冲到 9.9 万+ star。这个信号对我来说已经不是“又一个新工具”,而是终端型 coding agent 开始正式争主工作台了。

我自己大概率会把这类工具放在重构、批量改动、查上下文、跑命令这些任务上;涉及复杂 UI 和强交互的部分,短期还是会留给 IDE。

你们现在会把谁放主力位?OpenCode、Gemini CLI、Claude Code,还是继续把 agent 留在 IDE 里?
00
孟健AI编程
7天前
如果你们团队里还有人把 Copilot 个人版直接连着私仓、客户代码和日常开发一起用,我觉得这周该先把边界聊清楚了。

GitHub 3 25 日更新了条款:从 4 24 日起,Copilot Free / Pro / Pro+ 的交互数据(输入、输出、代码片段和相关上下文)会默认用于训练,除非用户自己 opt out;Business / Enterprise 不在这次范围里。官方也特别强调:这不等于拿 GitHub 上“静态存放”的私有仓库内容去训练,但你在使用 Copilot 过程中产生的提示词、建议和相关上下文,可能进入这次范围。

我自己的做法会更保守一点:
1. 个人探索型项目继续留在个人版,问题不大;
2. 客户代码、敏感私仓、带审计要求的仓库,最好尽快分流;
3. 团队至少要把“谁能继续用个人版、谁该切 Business / Enterprise、谁必须先关开关”讲明白。

这类事最怕的不是政策变了,而是团队里默认大家都知道,结果谁也没真的去检查设置。

你们现在会怎么分?是直接关掉训练开关,还是按仓库类型拆开?
00
孟健AI编程
8天前
今天看完 VS Code 团队那篇《How VS Code Builds with AI》,我最大的感受是:很多团队迟迟没把 agent 用出效果,不是模型不够强,而是只让它写代码,没把 issue triage、commit summary、release notes、code review 这些杂务一起重排。

官方给的信号很具体:有人会先开 3-4 agent session 再去开会;Jan-Mar 同比,commit volume 已经翻倍,close issue 接近 3 倍。最后他们把稳定版从月更切到周更。

我觉得更关键的一句不是“更快”,而是“先投 harness,再追速度”。tests、golden scenarios、review gates 这些兜底没补齐,agent 只会把回归也一起放大。

如果你团队现在也在上 agent,你们更缺的是“能写码的 agent”,还是“能兜底的 harness”?
00
孟健AI编程
9天前
GitHub 昨天把 Copilot 的分水岭写得很直白:4 24 日起,Free / Pro / Pro+ 的交互数据会默认用于训练,除非你手动 opt out;Business / Enterprise 不受影响,教育计划免费用 Pro 的学生和老师也不受这次更新影响。

我更在意的不是“隐私争议”四个字,而是工作流边界终于被摊开了:以后个人版 Copilot 更像适合公开仓库、小实验、个人 side project 的高性价比主力;一旦你在客户代码、公司私仓、多人协作仓库里长期用它,权限、审计、review 边界就得重新算。

我自己的判断是:个人项目我还会继续用 Copilot,但涉及客户代码、团队规范、可追责的仓库,我会优先切到 Business / Enterprise,或者直接把训练关掉,不再默认相信“先用着再说”。

这次真正提醒我们的,可能不是要不要立刻弃用 Copilot,而是 AI 编程开始进入“便宜”和“可控”要分开算账的阶段了。

你现在会把个人版 Copilot 继续放进哪些仓库?又会在哪条边界上立刻切走?
00
孟健AI编程
10天前
这两天看 GitHub 连着补 Copilot coding agent,我更在意的不是“启动快了 50%”,而是团队终于能回看 agent 到底干了什么。

如果 agent 要开始接 PR、跑测试、提 commit,只有快没用;至少得能看到 setup 步骤、子 agent 在忙什么、commit 还能反查 session logs,不然团队还是在盲飞。

我现在会更愿意把它放进那种“改完要 review、要追责、要复盘”的仓库里;纯个人小修,速度比这些更重要。

你们现在选 AI coding agent,会先看性能,还是先看可追踪 / 可审计?
00
孟健AI编程
11天前
今天认真把 Cursor Composer 2 看了一遍,我会把它当成“主力位继续坐稳”的信号,但不是唯一答案。

Cursor 3/19 官方给的数据挺狠:CursorBench 61.3、Terminal-Bench 2.0 61.7、SWE-bench Multilingual 73.7,价格是 $0.50/M input、$2.50/M output。

对我更重要的不是跑分本身,而是它开始把「长任务能力 + 成本 + 一体化工作流」一起卷起来了。对已经高频在 Cursor 里跑 agent 的人,这波更像继续加深黏性;但如果你特别在意 provider-neutral、BYOK、备份工作流,那第二套方案还是得留,比如 OpenCode / Junie 这种。

我现在的判断是:Cursor 继续很像主力位,但 2026 年已经不太适合只押单一工具了。

你现在会继续把 AI 编程主力位留给 Cursor,还是会刻意准备第二套工作流?
00