Context 真的很重要,重要到要当做油田来抢夺。我想简单粗分为三大类:
1.个性化生活信息(衣食住行事件时间戳,居住地址,车牌车型,电商记录,用户偏好历史记忆)
2.情绪化视频信息(生活中感动的记录瞬间,麦克风ASR与社交关系链,用户情绪的分析感知)
3.资产类结构信息(房产银行账单,电脑截图,工作知识库,工作日报/滴答清单/flomo数据)
其中情绪化信息的部分,如何打通context获取到落地?我觉得小米有最大优势,配合小米 AI 眼镜补全第一视角,剩下的用米家AI监控摄像头,真AI那种。
做上两个摄像头,一个常规低分辨率记录,一个 1 英寸高画质摄像头堪比手机。当家里发生一些生活中的小趣事,比如狗狗按按钮,下班后的拥抱,乃至烛光晚餐生日派对,然后借助本地的 NAS 的 本地 PC 显卡算力,定期跑跑视觉模型分析任务,配合Agent tool use模型,把视频自动剪辑输出,这不比iphone里的那年今日感动多了?
甚至如果高斯技术成熟,共视范围更大的多视角摄像头监控,还能还原4D高斯场景,这些都可能是下一个智能时代硬件厂商要卷的“新影像赛道”。