科研者出来创业的理由是科学范式(paradigm)转移完成带来的研究性工作的收缩,此时研究者红利下降,工程师红利上升。
范式转移的自然延展是:problem → knowledge → solution → engineering
VLA ➕ 快慢思考的工程化需要经验数据,这意味着没办法仅仅依靠逻辑推理就能拿到圣杯,那么快慢思考的“风洞实验”是什么?
修复的越快代表恢复能力越强,一个人的生命力体现在恢复力上,一个国家的生命力也一样。
以智能维度划分的行业阶段: L0 工业机器人;L1 单一任务解决者;L2 固定场景多任务解决者;L3 固定场景通用任务解决者;L4 多场景通用任务解决者。
人形与非人形机器人的决策点在于具身智能所处的环境是为什么主体打造的,如果是手工劳动密集场景,则人形更优。
现阶段的技术共识:端到端>分层架构;现阶段的技术方案:端到端≈VLA
高阳对具身智能架构的理解:端到端产品 = 具身大脑 + 机器人 Body。
具身大脑 = VLA 模型 = 互联网数据预训练 + 遥操数据微调 + 强化学习 = 100 亿有效数据 + 1 亿遥操数据 + 千万级强化学习数据
叠衣服是 L1 阶段具身智能的试金石:柔性材料带来的状态数爆炸让手搓变得不可能,模型必须要理解连续的真实世界。
下一步“L2 阶段”的挑战:机器人的泛化性提升难题
人的肌肉记忆是某种强化学习数据
非共识:想要实现具身智能的 GPT-3.5 时刻,需要 4-5 年
遥操也存在 scaling law
身心之争:只做大脑,缺乏操作身体的能力。只做身体缺乏最大的价值——通用性带来的底层革命与成本的非线性下降。