即刻App年轻人的同好社区
下载
App内打开
歸藏
565关注25k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
1天前
25 年更新了 395 篇公众号内容,343 天更新差点全勤,太卷了。

​新增 6 万粉丝,阅读量 266 万次,感谢大家🙏
80
歸藏
1天前
试了一下 OpenAI 新出的 Codex App,有些亮点

Skills 的适配还是有点问题,模型的主要问题就是慢

OpenAI Pro Plus 用户的 Codex 额度在未来两个月内全部翻倍了

👇看一下详细的能力介绍:

Skills 可视化管理

有一个专门的 Skills 列表界面,预置了一些官方 skills,也可以扫描你已经安装的 skills。注意这里只能扫描 NPX 安装的,本地创建的(比如在 Claude Code 里创建的)扫不出来。

还支持 Skills Creator 创建的 skills,可以直接在 APP 里用它去创建新 skills。

------

定时任务功能,这个挺实用的。

可以让 AI 定期执行某些任务,比如每周给你一个解决问题的报告,定期去解决某个项目的 PR 问题,或者定期 review 代码。

对于需要持续维护的项目来说,这个功能还是挺有价值的。

------

Codex APP 现在支持计划模式了。

因为它跟 Codex CLI 共享后端,所以现在 Codex CLI 也同步支持计划模式了。这意味着 AI 会先规划任务步骤,让你确认后再执行。

------

用量显示的样式做得挺好的。

进度条、余量、使用情况都很清楚,一眼就能看到你还有多少额度。

还有 code review 的快捷方式,可以快速调用你的 skills。MCP 的添加也支持。

======

实测:用 video-wrapper skill 跑了一遍

我测试主要是让它跑了一个我最近做的 skill,可以一键给视频添加视频包装,比如卡片、花字、人物条、章节标题这些。

这个 skill 挺复杂的,所以很适合用来测试。

------

第一次运行的问题

可以工作,但第一次它选了 PIL 这个方案,比较差。

核心问题是什么?它跟你没有交互。

我的 skill 里边写清楚了:要先问用户要哪套方案,再给出包装方案让用户确认,用户确认了再开始包装。

但在 Codex 这里,明显没有交互。它就直接跑,把所有决定都自己做了,跑完就完了。出错了也不管,直接用降级方案。

------

修复后的效果

我让它修复以后,它倒是能修复。重新跑了一遍,效果也不错。

最终生成的视频包装效果还行:
左下角有人物卡片
有花字
有各种卡片和章节标题
结论卡片也加上了

因为我们用前端代码约束了样式,所以它在样式上不会出什么错误。

------

体验总结

整个过程很不可控:

速度很慢 - Codex 本身速度就慢
交互明显不够 - 你根本不知道进到哪个阶段了,也不知道它的方案是什么
只管执行 - AI 一直在执行,不会停下来问你

可能是它不太适应 skills 规范,只是简单做了一下适配,没有 Claude Code skills 的适配那么好。
03:26
20
歸藏
1天前
昨晚 OpenAI 发布了 Codex Mac App

早上满心欢喜用一下,结果不断地报错,真服了

我主要遇到两个问题,如果大家也遇到了,可以按照我这个方法去处理:

首先是配置文件错误
首先是配置文件有个错误,提示有不该有的符号,但那个配置文件居然达到了 26 万行。

解决方法:移除并备份这个文件。我移除以后,报错就不再出现了。

可以参考一下这两个命令:

cd /Users/your user name/.codex/
mv config.toml config.toml.bak

第二个错误就是说我的登录 key 无法刷新,“Your access token could not be refreshed”。

一般来说,这个时候我们重新登录一下就行。

结果我找了半天,没有在它的界面上找到登录和注册的个人页面。最后发现登录居然在左上角的选项里,太不符合逻辑了。

这时候大家退出登录,再重新登录就可以了。
27
歸藏
2天前
小道消息 Claude Sonnet 5 即将发布,也有说是 4.6:

Fennec 代号: 泄露的 Claude Sonnet 5 内部代号。据称其技术水平比 Gemini “Snow Bunny” 领先整整一代。

发布在即: Vertex AI 的一条错误日志中列出了 claude-sonnet-5@20260203,预示其发布窗口指向 2026 2 3 日。

激进定价: 据传其价格比 Claude Opus 4.5 便宜 50%,但在各项指标上均能实现超越。

海量上下文: 保留了 100 万(1M)token 的上下文窗口,但运行速度显著提升。

TPU 加速: 据称该模型在 Google TPU 上进行了训练与优化,从而实现了更高的吞吐量和更低的延迟。

Claude Code 进化: 能够派生出专业化子智能体(如后端、QA、研究员),这些智能体可在终端同步并行工作。

“开发团队”模式: 智能体在后台自主运行;你只需提供简要说明,它们就能像人类队友一样构建出完整的功能。

跑分猛兽: 内部泄露声称其在 SWE-bench 上超过了 80.9%,有效超越了目前所有的编程模型。

Vertex 侧面证实: 针对特定 Sonnet 5 ID 404 错误表明,该模型已经存在于 Google 的基础设施中,正等待激活。

来源 X:pankajkumar_dev
410
歸藏
2天前
Claude Code 的创建者 Boris 再次分享

Anthropic 内部总结的 Claude Code 使用技巧

简短而清晰,很多技巧都非常有用,强烈推荐看看:

------

并行工作是头号生产力秘诀

同时开 3-5 git worktree,每个跑一个独立的 Claude 会话。这是团队公认的最大生产力提升点。

Boris 自己用多个 git checkout,但团队大多数人更喜欢 worktree。这也是为什么 Claude 桌面应用专门加了原生支持。

有人给 worktree 起名字,设置 shell 别名(za、zb、zc),一个按键就能切换。还有人专门准备一个"分析"worktree,只用来读日志和跑 BigQuery。

------

复杂任务先做计划

每个复杂任务都从计划模式开始。把精力投入到计划里,Claude 就能一次性完成实现。

有人让一个 Claude 写计划,然后启动第二个 Claude 以幕僚工程师的身份审查。另一个人说,一旦事情跑偏,立刻切回计划模式重新规划,不要硬推。

他们还会明确要求 Claude 在验证步骤进入计划模式,不只是构建步骤。

======

维护 CLAUDE. md 是长期投资

每次纠正错误后,都以这句话结尾:"更新你的 CLAUDE. md,确保不再犯同样的错误。"

Claude 非常擅长为自己写规则。随着时间推移,毫不留情地编辑你的 CLAUDE md,不断迭代直到 Claude 的错误率明显下降。

有个工程师让 Claude 为每个任务/项目维护笔记目录,每次 PR 后更新,然后把 CLAUDE. md 指向那个目录。

======

把重复操作做成技能

创建自己的技能并提交到 git,在每个项目中复用。

团队的建议:

如果你每天做某件事超过一次,就把它变成技能或命令
做个 /techdebt 命令,每次会话结束时运行,找出并消除重复代码
设置一个命令,把 7 天的 Slack、Google Drive、Asana GitHub 同步到一个上下文转储
构建分析工程师风格的智能体,写 dbt 模型、审查代码、在开发环境测试变更

------

Claude 自动修复 bug

大部分 bug Claude 都能自己修。

启用 Slack MCP,把 Slack 里的 bug 讨论帖粘贴给 Claude,只说一句"修复它"。不需要切换上下文。

或者直接说"去修复失败的 CI 测试",不要微观管理怎么做。

Claude Docker 日志来排查分布式系统故障,它在这方面能力出奇地强。

======

提升提示词水平

挑战 Claude。说"针对这些改动严厉审查我,在我通过测试之前不要创建 PR"。让 Claude 当你的审查员。

或者说"向我证明这行得通",让 Claude 对比 main 分支和功能分支的行为差异。

------

在平庸的修复后,说:"基于你现在掌握的所有信息,废弃这个方案,实现那个更优雅的解决方案。"

------

交付任务前,写详细的规格说明,减少歧义。你描述得越具体,输出越好。

======

终端和环境设置

团队很喜欢 Ghostty。很多人看中它的同步渲染、24 位色彩和完善的 Unicode 支持。

/statusline 自定义状态栏,让它始终显示上下文使用情况和当前 git 分支。

很多人给终端标签页做颜色编码和命名,有时配合 tmux,每个任务或 worktree 一个标签页。

------

用语音听写。你说话比打字快 3 倍,提示词会变得详细得多。macOS 上连按两次 fn 键就能开启。

======

使用子代理

在任何希望 Claude 投入更多算力的请求中,加上"use subagents"。

把单个任务分给子代理,保持主代理的上下文窗口整洁专注。

通过钩子把权限请求路由到 Opus 4.5,让它扫描潜在攻击并自动批准安全请求。

======

Claude 做数据分析

Claude Code "bq" CLI 即时提取和分析指标。

团队在代码库里集成了 BigQuery 技能,每个人都直接在 Claude Code 里用它做分析查询。Boris 说他已经 6 个多月没写过一行 SQL 了。

这适用于任何有 CLI、MCP API 的数据库。

======

Claude 学习

/config 里启用"解释型"或"学习型"输出风格,让 Claude 解释它改动背后的"原因"。

Claude 生成可视化的 HTML 演示文稿来解释不熟悉的代码。它做幻灯片的水平出奇地好。

Claude 画新协议和代码库的 ASCII 图表,帮你理解它们。

构建间隔重复学习技能:你解释自己的理解,Claude 通过提问填补知识空白,并存储结果。

详情:x.com/bcherny/status/2017742741636321619?s=20
022
歸藏
2天前
没想到 Clawdbot 里的 K2.5 还真能免费

但需要选择 OpenCode Zen 的渠道

所以这里的免费用的是 OpenCode 提供的免费 K2.5

如果想体验 K2.5 也可以去 OpenCode 里面玩
47
歸藏
3天前
有些人管得真是宽,昨天被折磨了一下午。说个“妈的”开头,就被指指点点说脏话;说做自媒体的傻逼。

我真服了,要求真多呀!看不了拉黑就完事了。一个语气词上纲上线批判上了
111
歸藏
3天前
他妈的,拉胯了,这里的免费不是真免费

他指的是 Kimi 2.5 是开源的所以叫免费,真离谱

我就说怎么 kimi 没搭茬
122
歸藏
3天前
Clawdbot 昨晚的更新

将moonshotai/Kimi-K2.5 添加到了模型库;
MiniMax Coding Plan 现在支持直接通过网页授权登录。

如果你也被这俩模型的添加困扰可以更新一下。

更新推荐直接重新运行安装命令,他会自动升级和修复
02
歸藏
3天前
很难想象自己会有一个 2000 Star Github 开源项目

当然复制这个项目,拿去卖的估计已经赚翻了
618