即刻App年轻人的同好社区
下载
App内打开
歸藏
565关注26k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
00:21
明天就可以在 CodePilot 里面提前体验 Claude Code 还没有上线的重磅宠物功能了!

歸藏: CodePilot 用户有可能优先尝试所有Claude code 未发布能力 先点个收藏:https://github.com/op7418/CodePilot

60
歸藏
1天前
CodePilot 用户有可能优先尝试所有Claude code 未发布能力

先点个收藏:github.com
43
歸藏
1天前
感觉过个两周,每个大厂人手一个顶尖 Agent 产品要发布

歸藏: “正在自研世界一流 Agent ”

01
歸藏
1天前
“正在自研世界一流 Agent
81
歸藏
1天前
Claude Code 也能使用前几天 Anthropic 发布的 Computer Use

你可以用它这个能力来自己去验证一些 UI 上的问题:验证编码中的一些 UI 走查,模拟人工点击的链路测试

它也可以操作:
已经编译的 SwiftUI 应用
本地的、跨平台的应用
完全没有 CLI 的一些其他应用

Pro Max 账号能用,三方的 API 不行,使用/MCP 启用里面的 computer-use 就行
21
歸藏
1天前
Claude Code 最近是真不当人。

很多人反馈自己的 Token 额度消耗翻了 5 10 倍,甚至 20 倍。

有个 Reddit 用户逆向了一下 Claude Code 的代码,发现有两个可能导致缓存失效的 bug。

这大概解释了为什么(Token 消耗)刚好是这个倍数,因为缓存了的 Token 比没缓存的 Token 大概便宜 10 20 倍。

具体有两个问题:
那个 Band 二进制字符串替换改变时,会改变提示词的某些细节,导致缓存失效。
这个 —resume 恢复会话的命令,只要你用了恢复会话,你的缓存就肯定会挂。

再叠加上他们现在高峰期的政策,即高峰期额度增加的政策,会导致你的额度瞬间爆炸。

其实我记得之前就有很多人反馈过,但是他们一直说在调查,却一直没有修复,很难不怀疑他们是故意的。

官方的反馈是还在调查,因为他们说情况很复杂,需要更多证据才能下结论。

另外,还有人反馈 API 用户的消耗也不正常。

目前来看,避免这种情况的主要方法有:
尽量少用独立的二进制版,直接用 npx 安装就行
别用那个--resume恢复命令
1311
歸藏
1天前
昨晚果子(Apple)在中国推送了 Apple Intelligence。

然后早上古尔曼(Mark Gurman)说是失误,本来不应该上线的,现在已经被下掉了。

但是很多人说,升级 iOS 26.4 以后依然可以更新和安装,而且这个功能没有被关闭,想要体验的可以试试。
56
歸藏
1天前
OpenAI 现在比 Anthropic 开放多了!

现在能在 Claude Code 里调用 Codex 帮你审查代码!

省得我来回复制了,还想自己写一个来着,没想到官方的就来了。

Open AI 出了一个官方插件,可以帮你在 Claude Code 里调用 Codex

总共支持 3 个命令:

/codex:review 运行标准的只读 Codex 审查。

/codex:adversarial-review 运行可引导的挑战性审查,可以质疑实现逻辑。

/codex:rescue 直接将任务交给 Codex 处理。

安装插件:

/plugin marketplace add openai/codex-plugin-cc
/plugin install codex@openai-codex
/codex:setup
59
歸藏
2天前
几天没发视频,上抖音一看,1 万粉了。
20
歸藏
2天前
企业微信甚至都做了 MCP!

写了一篇文章分析了一下,为什么一夜之间大家都开始做 CLI 了,甚至是国内这些以封闭著称的厂商。

从 CLI 为什么突然变重要,到如何为 AI 构建 CLI。

和我在 CodePilot 里让 AI 管理自己工具的实验。

而且对关键概念都做了解释,即使你是个小白也能看懂。

长文在这里:mp.weixin.qq.com

======

AI 天生就在命令行里

GUI 是给眼睛看的,AI 没有眼睛。CLI 是纯文字的,AI 天生就在这个世界里运作。

Karpathy 最近写文章记录自己用 AI 做 app,大部分时间不是在写代码,是在浏览器标签之间跳来跳去配 API Key。他的结论很直接:"你的服务应该有一个 CLI 工具。不要让开发者去访问、查看或点击。直接赋能他们的 AI。"

AI 的实际能力 = 它能调用的工具 + 它拿到的上下文。装了飞书 CLI,AI 能查日程发消息。装了 Google Workspace CLI,AI 能管邮箱和云盘。没装?"不好意思,这个我做不了。"

------

新旧 CLI 已经是两种东西

传统 CLI 给程序员用,弹交互式菜单,输出彩色文字。AI 遇到弹窗直接卡住。

新一代 CLI 从设计之初就假设调用者可能是 AI:所有操作通过参数一次性传入,不弹菜单;输出 JSON,AI 直接解析;自带 Skills 说明书;支持 --dry-run 预览;AI 还能问工具"你有哪些命令?需要什么参数?"

飞书 CLI 装完 200 多条命令覆盖 11 个领域。Google Workspace CLI 一条命令启动 MCP 服务,AI 直接通过标准协议操作 Gmail、Drive、Calendar。

------

CLI 就是事实上的 AI Plugin

先说三个概念:MCP 是 AI 和外部服务的通信协议,Skills 是告诉 AI 怎么用工具的说明书,Plugin 是把工具、协议、说明书打包在一起的扩展。

新一代 CLI 把这三样全打包了。Google Workspace CLI 就是典型:CLI 命令提供执行能力,内置 MCP 服务提供通信协议,自带 Skills 文件当说明书。飞书、Stripe、ElevenLabs 全是这个模式。

而且比 Plugin 多几个好处:

▸ 跨平台。Claude Code 的 Plugin 只能在 Claude Code 里用,飞书 CLI 装了以后 Claude Code、Cursor、Gemini CLI 都能用
▸ 免审核。往 npm 上 publish 就上线了
▸ 人也能用。不装 AI 也能在终端里直接敲命令
▸ 可组合。两个 CLI 用管道串起来,前一个的输出变成后一个的输入。Plugin 之间是隔离的,没有标准的组合方式

------

问题也很明显

安全是最大的结构性缺陷。Plugin 在沙箱里跑,有权限控制。CLI 是直接执行 shell 命令,没有细粒度的"只读不写"控制。

我在 CodePilot 里接 CLI 工具踩了三个坑:

▸ 说明书太大,占掉上下文窗口一大块,推理质量下降。Google Workspace CLI 的 Skills 平均只有 1.6KB,精准给 AI 需要的信息
▸ 交互式提示卡死 AI。Stripe CLI 早期弹选择菜单,AI 直接卡住,后来加了 --no-interactive 才解决
▸ 输出太长淹没有用信息。一个查询返回几万字符 JSON,真正需要的反而找不到

共同根源:"为 AI 设计"和"在 AI 中验证"是两件事。

------

让 AI 管理自己的工具

做 CodePilot 时的思路转变:一开始是传统软件思路,写代码嗅探系统装了什么、写 UI 管理工具。

后来想明白了:产品里已经有 AI 了,为什么要绕过它?安装工具直接让 AI 来,它能读 --help、判断操作系统、处理权限错误、引导认证配置。报错了它能读错误信息自己判断要不要 sudo、先装个依赖。

别用软件帮用户管理 AI 的工具,让 AI 管理自己的工具。

------

还缺什么

行业不缺工具,不缺协议,不缺说明书。缺的是让这三样东西被发现、被安装、被信任的那一层基础设施。

发现机制是空白的。你怎么知道有个飞书 CLI 能让 AI 操作飞书?目前靠口口相传。认证也是问题,装五个工具登录五次。安装体验更不靠谱,npm 和 brew 是十几年前给开发者设计的。

谁做出来这个,谁就是 AI 时代的 npm。
19