很多时候我们简单的认为,Agent无法完成全栈应用开发、无法在小红书看攻略后在携程上面订票、无法写出非常棒的研究报告,是智商问题。
其实llm的智商早已过了那个线,不然也不能完成这么复杂的数学和代码竞赛。
我们很容易造出扫地机器人,因为它的奖励函数极其简单:地面干净。但是我们很难造出捕猎机器人,他需要寻找干净的水源、独自搭建庇护所、设置陷阱,追寻猎物、生火等等一系列复杂的操作,并且需要实时判断,奖励的函数又往往不直观。
现代人类能够完成这么多混合操作的任务,建立在非常长时间的奖励函数的培养当中,和非常高效持久的记忆力基础,以及一个强大的预训练模型(基因)的基础上。如果让现代人类突然回到原始社会捕猎,也需要花很长时间适应,甚至大部分人无法生存。
显然,LLM还没学会怎么和世界相处,越是复杂越是面向人类的任务,越难找到高质量数据。同时,我们的网络世界也并不是面向LLM设计的,我不认为browser use和operator这样的交互方式是优雅的。