这两天一直在看吴恩达和Andrej Karpathy两位大佬新出的教程,很有收获,推荐给大家。
- 吴恩达推出了全新的《Agentic AI》课程,教我们如何构建能够思考、规划并行动的智能体;
- AK在前天开源了“nanochat”项目,让我们能以极低的成本,从零开始复现一个微缩版的ChatGPT。
这两者结合来看,非常有意思,恰好是AI学习的两个核心方向:
一是向上走,聚焦应用,将AI作为强大工具,构建解决实际问题的复杂系统;
二是向下探,深入原理,亲手搭建大模型,彻底理解其背后的魔法。
先说 Agentic AI,它代表了一种构建软件的全新方式,利用 LLM 完成复杂任务中的部分或全部步骤。核心是 四大“Agentic”设计模式:
- Reflection:让 Agent 自我复盘、迭代改进;
- Tool Use:让 LLM 会调工具;
- Planning:把复杂任务拆成可执行子任务并动态调整;
- Multi-Agent:像公司分工一样组织多个专长 Agent 协同完成复杂工作。
这门课程不依赖任何特定框架,用纯Python代码从零开始实现每个模式。
🔗
www.deeplearning.ai再来看 nanochat,AK佬一直以其“从零复现”的教学风格而闻名,这次发布的从零构建 LLM 训练和推理的项目也不例外。
nanochat 用大约八千行代码把训练与推理的全链路拼成闭环:
分词 → 预训练 → 中期训练 → SFT → 评测 →(可选)RL → 推理引擎 + WebUI,全都打包在一个尽量极简、可读、可 hack 的代码库里。
基本上跟着操作完成就可以链接LLM训练的所有步骤了。。你可以在云端开一台 8×H100 机器,几小时后就能和自己的小模型对话,写诗讲故事,做基础题。
项目🔗:
github.com项目Guidebook:
github.com/discussions/1
AI时代,既要能驾驭它解决问题的“术”,也要能理解它运行逻辑的“道”。
等你做出第一个可用的 Agent、跑完第一份 report card,
你会发现:
AI 不再神秘,它只是你的新生产力。