一项新技术的采用通常会经历 top-down 的路线,即先 to G 再 to B 最后 to C,比如无人机最早用于越战,后来 Amazon 等企业用在了配送环节提高效率,再到后来的大疆领导的消费级市场,同样的例子还有 GPS,VR/AR 等
这波 LLM 及相关应用却呈现了相反的采用路径,它们为 C 带来了明显益处,而在 G 和 B 中的影响则相对较小且滞后,典型的例子是 ChatGPT 成为全球最快突破 1 亿用户的产品
为什么LLMs在 G 和 B 领域的益处要小得多呢?Andrej Karpathy 在 X 里提到了三个他理解的原因:
1. LLM 知识广泛但浅薄:大模型擅长许多领域,但每个领域的知识只达准专家水平,且容易犯错。对于个人来说,这意味着可以完成以前无法独立完成的任务,而组织原本就聚集了各领域专家,这种“浅而广”的能力并不能带来根本的突破,仅能让已有专家稍微提高效率。
2. 组织需求复杂且容错率低:企业或政府面临更多复杂约束,如安全性、合规性、隐私保护和技术集成,导致无法简单、快速地引入LLM。一旦模型产生严重错误,可能带来严重的法律或商业风险。
3. 组织惯性较大:大型机构有明显的文化惯性、内部政治、历史负担以及再培训成本,难以快速适应这种全新的、易错的通用技术。因此,在短期内,LLM 对个人的正面影响远超企业和政府机构。