看罗永浩和李想的播客将关于人成长路径类别成大模型训练的过程觉得很有意思,总结下:
① 基因 = 基座模型(Base Model)
天赋和身体条件是起点和底层框架,但还没有决定最终表现。
② 读书学习 = 预训练(Pre-train)
早期的大量学习和知识积累,决定了基础宽度和理解能力的潜在上限。
③ 找高手对齐 = 监督微调(SFT, Supervised Fine-Tuning)
与高手的互动有效对齐可以快速避免低级错误,把“会”转化为“能用”。
④ 实践反馈 = 强化学习(RL, Reinforcement Learning)
最终成就不是学来的,而是通过实践中不断试错与迭代养成的。
天赋决定起点,学习决定潜力,高手指路避免弯路,实践反馈成就高度。