张小珺:享受模型溢出的能力。
杨植麟:对,它本质做的是逆向工程这个模型的训练过程。因为模型训练过程也是通过各种手段——你可以认为Anthropic在内部(in-house)的环境、工具、脚手架,可能训练出这样一个模型,但它没有直接开放给你。你通过逆向,更接近拟合它的分布——到底用什么工具效果会好?到底用什么样的System Prompt(系统提示)效果会好?到底用什么样的Context Engineering(上下文工程)效果会好?这是一个逆向的过程。
但你会发现,如果模型公司去做“一方的产品”,逻辑完全不一样。你不再需要这个逆向的过程,更多是正向的做法。我先把这些工具设计好,我的Context Engineering(上下文工程)的方法都设计好,我就在这个环境里训练这个模型,所以模型天然在你的环境里表现更好。这是两种不同思路,但第二种思路上限也许更高。
你可以更好整合工具和模型。模型如果有些地方解决不好,你可以调整工具设计,把它设计得更好,同时又可以端到端训练。这也是在开发方式一个比较大的变量。