今天看到 openai 华人员工翁嘉译去了 why not TV 的播客。花了两小时听完了这期播客。干货太多了。
翁嘉译2022年加入OpenAI,是ChatGPT、GPT-4、GPT-4o到GPT-5背后的核心贡献者,搭建了整个post training的RL infra。
他在清华开源作业打破信息差,开源强化学习框架天授,做免费签证查询系统——把代码工具视作一种慈善。
几个核心观点
1. 工程vs研究:教researcher做好engineering,要远比教engineer做好research难得多
2. bug决定性能:每家的infra都有不同程度的bug,谁修的bug越多,谁的模型性能就越好
3. 迭代速度生死线:Idea is cheap,单位时间内能验证多少有效idea才是关键,这是OpenAI最警觉Deep Seek的点
4. PhD的困境:如果目标是工业界,读PhD就是浪费生命,应该以master为跳板攒差异化优势
5. 开源的价值:清华学生都认识我,因为大家都看我的作业——比捐楼有用
6. 不发paper:我不想发paper,觉得完全没有意义,更想做天授和退学这种慈善项目
7. 卖铲子哲学:我不擅长调参,更喜欢搭infra让别人发paper,每个OpenAI模型release都有我名字
8. 一致性原则:天授两周完成第一版,r-lib几十万行是因为多人协作导致腐化,好项目核心是consistency
9. 组织宿命:公司大了必然变慢,OpenAI迭代速度已不是第一,这是人类组织的宿命,context分享不可能无限扩展
10. 学习悖论:我学东西比别人慢2-3倍,但一旦理解就用得飞快——需要时间建立知识树的shortcut
11. 评价体系:GPA三年后连简历都不写,应该创造自己的评价体系:论文、比赛、GitHub三位数star
12. 人生游戏:高三突然顿悟,人生结算分数是"死时记得你名字的人数",所以要做impact
13. 宿命论实践:我相信世界是确定性的,未来可以预测,但最好的方式是忘掉它去体验当下
全文地址:
my.feishu.cn