Kimi 家的 OK Computer 灰测了有一小段日子,也和在 Kimi 的朋友聊了聊认知:
数月前,我就把 Kimi 第一款 Agent:Researcher,在线下大量推荐给朋友们。
因为 Research 过程非常长且细致,幻觉也相对可控,时常能关联分析出意外的好观点。非常适合用来研究国内网络信息。
这次的 OK Computer 也依然延续了模型即 Agent 路线,对模型进行端到端强化训练。将 K2 模型放置在问题环境中,给予可 Use 的 Tools,模型自然涌现出解决复杂问题的能力。
——————
说实话,经过 3 月 Manus 到现在半年多的发酵,通用 Agent 赛道已经颇显拥挤,短期内留给通用 Agent 新品做出突破的机会并不明显。
设计了些 Benchmark,OK Computer 的表现,相较于 Manus、Lovable、Skywork 等,依然算的上可圈可点。
第 1 个任务:生成一个 Html 版宝可梦游戏
Kimi 的游戏功能规划最为丰富,游戏交互自洽;Manus 则更有意识的复现了地图移动功能(虽然有 bug);Lovable 则明显功能设计过于单薄,考虑较少
第 2 个任务:综合上千条 IMDb 剧集数据,输出可视化分析网页
Kimi 能有意识使用太阳图、小提琴图,甚至三维可交互的散点图,较别家更倾向提供更加复杂、多维的效果。
另外,在 AI PPT、网页设计上,继承了 K2 模型的审美与 Coding 能力(适合普通用户)
当然,也有一些待改进的地方:
暂时还不支持用户接管 Browser,所以无法让 Kimi 替自己调研一些需要登录的网站内容;
在给 PPT 配图时,有时也会过度依赖 AI 生图,而不是正确使用网页图表组件,创建数据图。
这些问题我也一一反馈给了在 Kimi 的朋友,期待他们的改进。
——————
回过头来不能忽略的一点是:与全球化 Agent 产品不同,Kimi OK Computer 始终使用的都只是 Kimi K2 这款自研 LLM 模型。
不依靠 Claude Coding 、不用 Gemini 规划,OK Computer 在 Agent 红海之中,依然能展示出其独到的优势:
1️⃣ One prompt 下更长远的规划,和多轮积极执行
2️⃣ 继承 K2 的优秀 Coding 能力,支撑一流的轻量网页开发效果
3️⃣ 丰富的工具能力,包括图片、音频生成,浏览器、虚拟电脑、文件系统等
4️⃣ 目前最自由的 AI PPT 自定义后编辑功能
但如果仅仅将这三点看作孤立的优势,我们就错过了 OK Computer 真正想表达的立意:
把 AI 从文本模型,扩展为能「拆解任务目标、规划长程任务、通过行动-反馈达成更优结果」的全能型 Agent。
又名,模型即 Agent。