即刻App年轻人的同好社区
下载
App内打开
歸藏
565关注26k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
11:12
Claude Code 也能使用前几天 Anthropic 发布的 Computer Use

你可以用它这个能力来自己去验证一些 UI 上的问题:验证编码中的一些 UI 走查,模拟人工点击的链路测试

它也可以操作:
已经编译的 SwiftUI 应用
本地的、跨平台的应用
完全没有 CLI 的一些其他应用

Pro Max 账号能用,三方的 API 不行,使用/MCP 启用里面的 computer-use 就行
21
歸藏
10:04
Claude Code 最近是真不当人。

很多人反馈自己的 Token 额度消耗翻了 5 10 倍,甚至 20 倍。

有个 Reddit 用户逆向了一下 Claude Code 的代码,发现有两个可能导致缓存失效的 bug。

这大概解释了为什么(Token 消耗)刚好是这个倍数,因为缓存了的 Token 比没缓存的 Token 大概便宜 10 20 倍。

具体有两个问题:
那个 Band 二进制字符串替换改变时,会改变提示词的某些细节,导致缓存失效。
这个 —resume 恢复会话的命令,只要你用了恢复会话,你的缓存就肯定会挂。

再叠加上他们现在高峰期的政策,即高峰期额度增加的政策,会导致你的额度瞬间爆炸。

其实我记得之前就有很多人反馈过,但是他们一直说在调查,却一直没有修复,很难不怀疑他们是故意的。

官方的反馈是还在调查,因为他们说情况很复杂,需要更多证据才能下结论。

另外,还有人反馈 API 用户的消耗也不正常。

目前来看,避免这种情况的主要方法有:
尽量少用独立的二进制版,直接用 npx 安装就行
别用那个--resume恢复命令
911
歸藏
09:46
昨晚果子(Apple)在中国推送了 Apple Intelligence。

然后早上古尔曼(Mark Gurman)说是失误,本来不应该上线的,现在已经被下掉了。

但是很多人说,升级 iOS 26.4 以后依然可以更新和安装,而且这个功能没有被关闭,想要体验的可以试试。
56
歸藏
09:42
OpenAI 现在比 Anthropic 开放多了!

现在能在 Claude Code 里调用 Codex 帮你审查代码!

省得我来回复制了,还想自己写一个来着,没想到官方的就来了。

Open AI 出了一个官方插件,可以帮你在 Claude Code 里调用 Codex

总共支持 3 个命令:

/codex:review 运行标准的只读 Codex 审查。

/codex:adversarial-review 运行可引导的挑战性审查,可以质疑实现逻辑。

/codex:rescue 直接将任务交给 Codex 处理。

安装插件:

/plugin marketplace add openai/codex-plugin-cc
/plugin install codex@openai-codex
/codex:setup
49
歸藏
2天前
几天没发视频,上抖音一看,1 万粉了。
20
歸藏
2天前
企业微信甚至都做了 MCP!

写了一篇文章分析了一下,为什么一夜之间大家都开始做 CLI 了,甚至是国内这些以封闭著称的厂商。

从 CLI 为什么突然变重要,到如何为 AI 构建 CLI。

和我在 CodePilot 里让 AI 管理自己工具的实验。

而且对关键概念都做了解释,即使你是个小白也能看懂。

长文在这里:mp.weixin.qq.com

======

AI 天生就在命令行里

GUI 是给眼睛看的,AI 没有眼睛。CLI 是纯文字的,AI 天生就在这个世界里运作。

Karpathy 最近写文章记录自己用 AI 做 app,大部分时间不是在写代码,是在浏览器标签之间跳来跳去配 API Key。他的结论很直接:"你的服务应该有一个 CLI 工具。不要让开发者去访问、查看或点击。直接赋能他们的 AI。"

AI 的实际能力 = 它能调用的工具 + 它拿到的上下文。装了飞书 CLI,AI 能查日程发消息。装了 Google Workspace CLI,AI 能管邮箱和云盘。没装?"不好意思,这个我做不了。"

------

新旧 CLI 已经是两种东西

传统 CLI 给程序员用,弹交互式菜单,输出彩色文字。AI 遇到弹窗直接卡住。

新一代 CLI 从设计之初就假设调用者可能是 AI:所有操作通过参数一次性传入,不弹菜单;输出 JSON,AI 直接解析;自带 Skills 说明书;支持 --dry-run 预览;AI 还能问工具"你有哪些命令?需要什么参数?"

飞书 CLI 装完 200 多条命令覆盖 11 个领域。Google Workspace CLI 一条命令启动 MCP 服务,AI 直接通过标准协议操作 Gmail、Drive、Calendar。

------

CLI 就是事实上的 AI Plugin

先说三个概念:MCP 是 AI 和外部服务的通信协议,Skills 是告诉 AI 怎么用工具的说明书,Plugin 是把工具、协议、说明书打包在一起的扩展。

新一代 CLI 把这三样全打包了。Google Workspace CLI 就是典型:CLI 命令提供执行能力,内置 MCP 服务提供通信协议,自带 Skills 文件当说明书。飞书、Stripe、ElevenLabs 全是这个模式。

而且比 Plugin 多几个好处:

▸ 跨平台。Claude Code 的 Plugin 只能在 Claude Code 里用,飞书 CLI 装了以后 Claude Code、Cursor、Gemini CLI 都能用
▸ 免审核。往 npm 上 publish 就上线了
▸ 人也能用。不装 AI 也能在终端里直接敲命令
▸ 可组合。两个 CLI 用管道串起来,前一个的输出变成后一个的输入。Plugin 之间是隔离的,没有标准的组合方式

------

问题也很明显

安全是最大的结构性缺陷。Plugin 在沙箱里跑,有权限控制。CLI 是直接执行 shell 命令,没有细粒度的"只读不写"控制。

我在 CodePilot 里接 CLI 工具踩了三个坑:

▸ 说明书太大,占掉上下文窗口一大块,推理质量下降。Google Workspace CLI 的 Skills 平均只有 1.6KB,精准给 AI 需要的信息
▸ 交互式提示卡死 AI。Stripe CLI 早期弹选择菜单,AI 直接卡住,后来加了 --no-interactive 才解决
▸ 输出太长淹没有用信息。一个查询返回几万字符 JSON,真正需要的反而找不到

共同根源:"为 AI 设计"和"在 AI 中验证"是两件事。

------

让 AI 管理自己的工具

做 CodePilot 时的思路转变:一开始是传统软件思路,写代码嗅探系统装了什么、写 UI 管理工具。

后来想明白了:产品里已经有 AI 了,为什么要绕过它?安装工具直接让 AI 来,它能读 --help、判断操作系统、处理权限错误、引导认证配置。报错了它能读错误信息自己判断要不要 sudo、先装个依赖。

别用软件帮用户管理 AI 的工具,让 AI 管理自己的工具。

------

还缺什么

行业不缺工具,不缺协议,不缺说明书。缺的是让这三样东西被发现、被安装、被信任的那一层基础设施。

发现机制是空白的。你怎么知道有个飞书 CLI 能让 AI 操作飞书?目前靠口口相传。认证也是问题,装五个工具登录五次。安装体验更不靠谱,npm 和 brew 是十几年前给开发者设计的。

谁做出来这个,谁就是 AI 时代的 npm。
19
歸藏
3天前
昨天最牛逼的开源项目 Pretext

快速而且精准的文本测量算法,可以实现类似报纸的动态图文环绕效果。

这个对 AI 时代的 UI 实时生成非常有用。

有了这个以后,AI 就能清楚地知道每个字符的宽度和总宽度,不会出现闪烁、超出范围和抖动等问题。

想今天把它搞到 Codepilot 那个生成式 UI 的组件里试试。

详情:github.com
00:12
1024
歸藏
4天前
藏师傅在 CodePilot 里做了一个 AI-native CLI 管理系统!

新发布的网易云 CLI、飞书 CLI 和即梦 CLI,都可以在 CodePilot 一键安装和使用!

在对话中告诉 AI 你想装什么工具,它会自动执行安装、处理权限问题、引导认证配置、生成工具简介。

每个 CLI 工具有 Agent 友好度评分(★★★★★)。

JSON 输出、Schema 自省、Dry Run 5 个维度评估对 AI的友好程度。

CLI 正在成为 AI Agent 的标准操作接口。藏师傅尝试让这个过程丝滑一点。
31
歸藏
4天前
飞书真牛逼,刚刚开源了他们的 CLI 工具!

现在任何的 AI Agent 产品都可以调用飞书的所有能力。

飞书现在是全国所有产品里边,AI Agent 的友好度和开放程度、产品适配度都是最高的。

不只是小龙虾,哪怕是 CodeX、Claude Code 或者是其他类似的本地 AI 产品。

都可以用飞书帮你:创建文档、查看和编辑日历、管理群消息、创建多维表格,还有邮箱、视频会议的内容、任务、云空间,包括聊天和群管理,都开放了。

几乎你能想到的飞书所有能力,都在里面。

比如说让你的 AI 帮你去更新飞书日程,你跟他说创建什么日程、邀请哪些人之后,他就会自动去查看这些人的日历,同时帮你找一个合适的时间安排日程。

我自己让它连续创建三个日程,很快就创建好了。

同时它还能帮你编辑评论和创建飞书文档。

比如说,我本地可能有一些 Markdown 文件需要跟同事们分享,那我就可以让他帮我把本地的这个 Markdown 文件创建一个飞书文档。

最主要的是,它还可以帮你把这个 Markdown 文件变成飞书的文档格式,帮你美化这个文档,效果非常牛逼。

它还能编辑和创建多维表格。

我们知道,多维表格以及其配套的仪表盘看板是非常强大的功能,但由于表格本身具有复杂性,很多人觉得上手门槛比较高。

不过现在你不用担心了,AI 全部能帮你搞定。比如我这里让它分析了我过去一个月看过的所有文档(无论是我自己创建的还是别人发给我的),梳理之后,它帮我创建了一个非常清晰的仪表盘看板。

所有数据都是同步的:它会自动同步现有的数据,以后再有新文档发布,它也会实时同步更新。

我为了更新我的 Code Plan,还整了一个 CLI 工具的 Agent 友好评估。飞书的得分是最高分 5 分,基本上为 AI Agent 原生做的 CLI 工具该做的事它都做了。

比如说Json 格式输出、Dry Run,还有快速授权登录等。只需要跟 AI 说安装,然后让它帮你登录配置就可以。

完全不需要你在飞书后台操作那堆权限,只需要点一个按钮就可以完成授权。

而且这个东西是完全开源的,你可以自己去改和优化。

跟你的 AI 这么说就能安装:

帮我通过以下命令安装 lark-cli npm install -g @larksuite/cli 然后通过以下命令安装相关 skills npx skills add github.com -y -g
安装完成后,请给我发送应用配置链接,引导我完成应用的配置。

用小龙虾的朋友们,飞书的小龙虾官方插件很快也会包含这些内容,可以不用下载CLI。
224