即刻App年轻人的同好社区
下载
App内打开
Yibie
822关注4k被关注4夸夸
用好奇心行走江湖
以热爱行侠仗义
置顶
Yibie
2年前
Yibie 的自我策展

我整理之前发过的帖子,这些是值得推荐一看的。也顺道向你暴露我的世界观、性格、兴趣和观点,有机会的话交个朋友😊

✨ AI 与新世界

得到 Prompt 系列(共 18 个) ⭐️已被“提示词图书馆收录”
m.okjike.com

Promopt: 文章精炼大师
web.okjike.com

Promopt: 概念卡片制作专家
web.okjike.com

Promopt: PPT 大纲制作助手 ⭐获得即刻精选推荐
web.okjike.com

Promopt: Kiweb. 文章精华浓缩专家
web.okjike.com

开发 12 Weeks LifeRPG 背后的过程与思考
web.okjike.com

用 AI 帮忙总结笔记(测试了 ChatGPT、Gemini、Kiweb.、豆包)
web.okjike.com

微软 CTO Kevin Scott 接受 every 访谈
web.okjike.com

吴恩达总结 AI 工程师制作 Promopt 的经验
web.okjike.com

OpenAI 2024 年春季发布会源文件, 包括演讲稿和演示用代码
web.okjike.com

视频内容识别是 Gemini Pro 1.5 的杀手锏
web.okjike.com

Perplexity 的官方 Promopt
web.okjike.com

大模型公司对 Token 的计算方法都不一样
web.okjike.com

AI 与创作者经济
web.okjike.com

------------------------------------

🤔我对这个世界有点看法

every 长文: AI 将冲击广告业, 后果很严重
web.okjike.com

Vision Pro 之我见
web.okjike.com

社会生活的趋同让人恐惧
web.okjike.com

「探索式」笔记法 ⭐获得即刻精选推荐
web.okjike.com

子弹日记法
web.okjike.com

商业价值的 3 个重要特征
web.okjike.com

Arc 这家公司的特点
web.okjike.com

新产品形态: Jina AI 将 URL 变为 API
web.okjike.com

------------------------------------

📒囤了一些清单

值得推荐的豆瓣小组
web.okjike.com

包豪斯设计的精华链接
web.okjike.com

Design Engineer 的 Twitter List
web.okjike.com

------------------------------------

📖️那些值得推荐的好书

读完斯多葛主义代表人物塞涅卡的书信集 <短暂的生命>
web.okjike.com

程序员超强大脑笔记
web.okjike.com

读完<巨人的工具>
web.okjike.com

读完<为什么伟大不能被计划>
web.okjike.com

精要主义读书笔记
web.okjike.com

读《了不起的盖茨比》
web.okjike.com

------------------------------------

💭️脑海里闪过的一句话

天才税
web.okjike.com

高度抽象的现代生活损害人类天生的类比能力
web.okjike.com

你能列出充分反映时代精神的 3 家公司吗?
web.okjike.com

解决拖延症的办法是找出之前最想完成但一直没做的事
web.okjike.com

美 = 深刻的简洁
web.okjike.com

尊重常识 = 不犯基本错误
web.okjike.com

与其花 1 小时如昙花一现, 不如花 10 倍时间震惊四座
web.okjike.com

这个世界有种人,以好人为食。
web.okjike.com

最难沟通的,是被灌输了标准答案的人
web.okjike.com

拖延 = 甩锅给未来的自己
web.okjike.com

折腾的定义
web.okjike.com

------------------------------------

🛠喜欢折腾工具

开启 Mac 系统自带白噪音音乐的方法
web.okjike.com

20-20-20 护眼原则
web.okjike.com

用哔哩哔哩替代网易云音乐
web.okjike.com

中国著名羽毛球运动员郑思维学习英语的工具和方法
web.okjike.com

------------------------------------

📁未归类的答案

「参考答案」的策展原则
web.okjike.com
1620
Yibie
1天前
当前大部分工具都无法解决 AI Agent 内含的「膨胀」问题:上下文膨胀,记忆膨胀,技能膨胀,架构膨胀,对话膨胀,Agent 膨胀。
00
Yibie
2天前
# 字节跳动把「教 AI 写代码」这件事产品化了——TRAE 企业编程实践手册解读

---

过去一年,教 AI 写代码的经验是散落在各处的。

Karpathy 说「先想再写」。Anthropic 说「渐进式披露」。开源社区搞出了 Skills 格式。Cursor 和 Claude Code 各自摸索出了 Spec-Driven Development。Context Engineering 这个词在不同文章里有不同的定义。

每个人都在自己摸索。每个团队都在重复造轮子。

字节跳动说:别各自摸索了。我们把整条链路产品化了。

---

他们做了一件事:把 TRAE(The Real AI Engineer)内部的开发经验打包成了一份《2026 企业级 AI 编程实践手册》,同时上线了 TRAE 企业版 SOLO 模式。

这不是一篇 blog。这是一套完整的、可复制的**人机协作操作系统**。

---

## 从「AI 辅助编码」到「人机协同」

手册开篇就划了一条清晰的分界线。

过去的范式:「人类写代码,AI 辅助纠错」。
新的范式:「人类定策略,AI 做执行」。

开发者从写代码、调试、写文档这些机械劳动中解放出来,聚焦业务本质洞察、架构设计和复杂逻辑决策。AI 承担全流程执行——需求拆解、任务规划、代码编写、测试调试、部署提交。

三个维度的跃迁:
- **效率**:CRUD 接口开发效率提升 340%
- **能力**:AI 自主完成全链路工作,甚至连续工作数天搭建完整系统
- **场景**:从编码延伸到需求评审、合规检查、技术债清理、跨团队协作

---

## 五层架构:把散落的经验串成一条线

手册最核心的价值是把这些概念串成了一条清晰的链路:

**Context Engineering → Skills → Spec & Rules → MCP → Agent**

**第一层:Context Engineering(上下文工程)**

让 AI 真正理解业务逻辑。不只是读代码,是理解代码背后的「画外音」——业务约束、历史决策、团队规范。

关键创新:**渐进式索引(Progressive Indexing)**。借鉴 Anthropic 的渐进式披露思想,不给 Agent 一次性灌入所有文档,而是先提供轻量级「目录」让 AI 按需精准定位。解决了上下文过载的经典瓶颈。

**第二层:Skills(技能模块化)**

把企业知识模块化封装。一个 Skill = 一个领域知识包。Agent 按需加载,实现能力复用。

手册里推荐了一系列 MCP 和 Skills——TRAE 内部验证过的,不是纸上谈兵。

**第三层:Spec & Rules(规范与约束)**

这是「可信」的基石。

Spec(规格说明)定义「要做什么」。Rules(规则约束)定义「怎么做才算对」——编码标准、合规要求、安全红线,全部转化为 AI 可执行的规则。

企业场景最大的信任问题,在这里被解决:不是「AI 写得快不快」,是「AI 写出来的代码敢不敢直接用」。

**第四层:MCP(模型上下文协议)**

AI 与开发工具的标准化接口。IDE、Git、CI/CD、APM——通过 MCP 协议被 AI 统一调用。以 Figma AI Bridge 为例,TRAE 能直接读取设计稿、理解结构、还原实现。

**第五层:Agent(智能体自主执行)**

SOLO Coder 自动串联前面四层:理解上下文 → 加载技能 → 遵守规范 → 调用工具 → 产出代码。人类只需要在关键节点介入。

---

## 最狠的一章:用 TRAE 开发 TRAE

手册第二部分讲了一个「自举」的过程——TRAE 团队用 TRAE 开发 TRAE。

不是 demo。不是玩具项目。是真实的、企业级的自举。

团队还引入了一个叫 **Trae Loop** 的自循环机制:每次成功修复都成为下一次的 Context。Loop 从此有了业务记忆。Skills 提升了 Loop 的自动修复率。

同时,团队做了一个很务实的选择:**放弃「一键生成整页代码」的幻想**,采用模块化拆分——把页面拆成独立模块,逐个让 AI 还原、逐个确认。把准确率提到了可接受的水平。

这个选择说明了很多事。字节没有在吹「我们的 AI 能一键生成一切」。他们在说「我们找到了让 AI 可靠工作的方法」。

---

## 为什么这很不一样

在 TRAE 之前,「教 AI 写代码」是一件高度手工的事。

你需要自己理解 Context Engineering 是什么,然后手动写 CLAUDE.md。你需要自己摸索 Skills 怎么组织。你需要在 Claude Code 和 Cursor 之间手动搬运上下文。你需要从 Karpathy 的推文、Anthropic 的博客、开源社区的经验里拼凑出一套工作流。

TRAE 的手册把这些变成了一个**产品化的操作系统**。

Context Engineering → Skills → Spec/Rules → MCP → Agent。五层架构,每一层都有产品实现,每层之间的衔接是设计好的,不是靠开发者手动拼的。

SOLO 模式把这个操作系统变成了真正的自动驾驶——需求进来,代码出去。人类审核心节点。

---

## 一个产品化时代的信号

Karpathy Skills(220K 星)证明了「把经验编码为规则」的需求有多大。

但一个 GitHub repo 解决的是单点问题。TRAE 解决的是链路问题。

从「一个文件四条规则」到「五层产品化架构」,2026 年的 AI 编程正在经历跟云计算一样的演进——从手搓脚本到平台化服务。

这是第一个把「教 AI 写代码」这件事做成完整产品的公司。不会只有它一个。

---

来源:
- 字节跳动《2026 企业级 AI 编程实践手册》(飞书文档)
- developer.volcengine.com
- 甲子光年报道
-
@shao__meng
X 推荐

手册在线:lcnziv86vkx6.feishu.cn
06
Yibie
3天前
@Matt_Pocock 将大模型的「上下文空间」分为「聪明区」和「降智区」。原因是,大模型的注意力机制的关系,当上下文里塞入太多内容,注意头就会变得紧张,而无法有效进行正确地推理。

在他的实践中,「上下文空间」的前 120K 左右是「聪明区」,而超过 120K 的则是降智区。
20
Yibie
3天前
直觉告诉我,Qwen 3.7 应该不会再开源了。下一步,应该是推广 Qoder 了吧?
00
Yibie
4天前
跑了一个 2 个星期的手动多 Agent 编排(在终端里开几个窗口,然后从 Agent A 复制对话内容到 Agent B,如此类推)后,总觉得不是非常地顺畅。

这两天实在忍不住了,勒令这几个 Agent 规范相互的 Handoff 格式,才终于顺畅起来。
00
Yibie
4天前
一个 CLAUDE.md 文件,220,000+ 星——Karpathy 的四条规则

---

1月26日,Karpathy 发推列出 LLM 编码的失败模式。第二天 Forrest Chang 把它变成了四条规则,写进一个 CLAUDE.md。

GitHub 史上增长最快的仓库之一。

四条规则:

1. Think Before Coding — 动手前澄清歧义
2. Simplicity First — 永远选最简单实现,YAGNI
3. Surgical Changes — 每一行 diff 都追溯到需求
4. Goal-Driven Execution — 做完了怎么证明做完了

---

Devtalk 上开发者反馈:
「Surgical Changes 改变最大。以前修 bug 的 diff 里混了类型标注+重命名+格式化。现在只改该改的。」
「反抽象的规则最有用的——Agent 太爱建不必要的 class 层。」

两条命令安装:
/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills

---

意义不止于一个文件。最好的 Skill 不是 AI 生成的,是有人把真实痛苦翻译成了 Agent 能执行的约束。

Karpathy 命名了问题。Chang 编码了解法。220K 星是开发者的投票。

github.com
00
Yibie
13天前
# 字节跳动的 AI 编程团队,推荐了这 10 个 Skills

---

上个月字节 TRAE 团队发布了一本《2026 企业级 AI 编程实践手册》,里面有一份 Skills Top 10 排行榜。这是目前我看到的第一份来自大厂的 Agent Skills 推荐清单。

先说背景。TRAE 是字节基于 Doubao-Seed-2.0-Code 模型做的企业级 AI 编程工具,定位是「真正的 AI 工程师」——不只是帮你补全代码,是自主拆需求、做任务规划、写代码、跑测试、部署,全流程。

他们内部大规模使用 Agent 之后,沉淀出了这 10 个最常用的 Skills。排名有先后:

1. frontend-design —— 前端设计。为什么排第一?因为 AI 写的 UI 真的太丑了。这个 Skill 教 AI 什么是好的设计。

2. cache-components —— 组件缓存。让 AI 复用已生成的组件,而不是每次都重新造。省 token,也省时间。

3. fullstack-developer —— 全栈开发。给 AI 一个全栈开发者的心智模型:前后端一起考虑,数据流怎么走,API 怎么设计。

4. frontend-code-review —— 前端代码审查。

5. code-reviewer —— 通用代码审查。注意:前 5 名里有两个 review Skill。说明字节很重视 AI 写出来的代码质量——不是能跑就行。

6. webapp-testing —— Web 应用测试。

7. pr-creator —— 自动创建 PR。写完代码 → 自动提 PR,省一步。

8. fix —— Bug 修复。专门用来处理「这里有个 bug,帮我修」。

9. update-docs —— 文档更新。代码改了,文档自动跟上。

10. find-skills —— 发现 Skills。这个最特别——让 AI 自己去搜索和推荐 Skills。

看完这个清单,有几个观察:

第一,设计类 Skill 排第一不是偶然。字节的人显然被 AI 生成的紫色渐变和圆角卡片折磨够了。任何人只要用过 AI 写前端,就知道 frontend-design 为什么是刚需。

第二,Top 10 里有两个 review Skill 和一个 testing Skill。这说明字节对 AI 代码的策略是「写得多不如写得对」——和 SkillsBench 那篇论文的结论一致:好 Skills 能提升 51%,差 Skills 能拉低 39%。

第三,find-skills 这个 Skill 很有意思。它本质是一个元技能(meta-skill)——让 AI 自己去发现还需要什么技能。这个思路和 EvoSkill 的「自动进化」一脉相承:最好的 Skills 配置不是人写的,是 AI 在实践中自己找出来的。

如果你在用 Claude Code 或 Codex,这份清单可以直接照搬。前 5 个装上去,你的 Agent 就已经有了大厂级别的 Skills 配置。

手册全文:lcnziv86vkx6.feishu.cn
11178
Yibie
13天前
Claude Code 源码级拆解:SKILL.md 有 15+ 个隐藏字段

有人把 Claude Code 的 TypeScript 源码翻了个底朝天。我读了原文,发现几个细节远比「主循环是 while-loop」有意思。

1. SKILL.md 不只是 Markdown

parseSkillFrontmatterFields() 函数解析至少 15 个字段:allowed tools(给 Skill 授权额外工具)、model overrides(指定用哪个模型)、argument hints(参数提示)、execution context(设为 fork 就是隔离执行)。

大多数人只用了 name + description。前 4 个才是真正的隐藏能力。

2. 权限系统里藏了一个 ML 模型

yoloClassifier.ts —— 两阶段分类器。Stage 1 快速过滤,Stage 2 Chain-of-Thought 推理评估风险。

纵向数据:使用 50 个 session 内,自动批准率约 20%;超过 500 个 session 后上升到 40% 以上。

3. 画边界,不逐条审批

传统做法每个操作弹窗 → 疲劳审批形同虚设。Claude Code 的做法是画一个圈(sandboxing + auto-mode classifier),圈内自由,圈外审批。和 Apple App Sandbox 同思路。

4. 上下文压缩是 append-only

五层管线:摘要 → 去重 → 保留 → 精简 → append-only 存储。压缩只减少当前窗口 token,原始记录永不丢失。

5. 27 种 Hook 事件

不只是 file save。文件变化、工作区事件、权限决策、上下文注入、MCP 结果转换、重试控制……15 种有专门的输出 schema。本质是把整个 Agent 生命周期事件都暴露出来。

论文没有新理论,就是老老实实翻了一遍源码。但正因为全是工程,所以特别值得看。

arxiv.org
02
Yibie
14天前
多 Agent 协作,从论文走进了终端

二月份我写过一篇笔记,讨论怎么构建可靠的 LLM 蜂群。那篇的核心问题是四个:Agent 失败了谁能发现?结果怎么收敛?任务怎么拆?Agent 之间怎么互相喊人。

上周 GitHub 热门榜第一的项目,有人把它们做成了能跑的产品——ruflo,4 万多 star。

核心思路:你给需求,Planner Agent 先翻代码库、拉文档、反问模糊点,生成依赖图。然后一次性启动多个 Agent,写代码的、跑测试的、做安全审计的、搞部署的,各干各的。做完调度器汇总验证。

有个细节我很喜欢:Planner 生成计划后,会额外 spawn 一个子 Agent 来 review 计划有没有漏洞。Agent 检查 Agent——这就是二月份我在蜂群笔记里说的「收敛系统」,现在变成了代码。

最近 X 上有人把多 Agent 协作总结成四种模式:

Pipeline 流水线:适合固定步骤,像生产线
Supervisor 主管:统一调度,这个项目用的就是这种
Swarm 转接:无固定主管,灵活但要防踢皮球
Mesh 网状:自由度最高,最难调试

四种模式没有谁碾压谁。重点是——这不再是论文。4 万多 star 说明一件事:单 Agent 已经不够用了。

而且它直接对接 Claude Code 和 Codex。不是替代你的工具,是让它们组队。

项目地址:github.com
01
Yibie
14天前
没想到《人物》的谢梦瑶老师离职了,还指称主编张跃搞职场霸凌
11