manus真的好吗?好在哪里?
简单来说 manus 展现了极强的产品工程能力。把目前基于 plan/tool use 的ai agent 方式做了一个非常高水平的实现。ux 也有很好的创新,进一步通过展示 ai 工作细节从而提高用户体验和信任。
另外,manus 团队各种 tool 都做得非常好,远高于目前能用的开源或者 saas 工具。包括:
1 浏览器:如 manus 自主浏览网页时候,出现验证码的频率很低,出现了也被解决了
2 数据抓取:获取各类数据的 api
3 代码执行
4 网页部署:看起来的流畅程度就不输专门的自动化部署工具
5 markdown 的各种编辑渲染
应该还有很多
一些思考:
1 总体来说 manus 把目前前沿模型的能力用一个很友好的方式呈现出来了。但我比较好奇谁会真的长期付费,人们真正愿意一个月支付几十上百美元的工具产品大概率还是在自己的专业领域工作中。这方面通用 agent 是否能超越垂直 agent?
2 对比claude code 就是选择了一条完全不同的 agent 产品理念,纯 cli,对非程序员极度不友好。我不知道哪个更好,唯一确定的是 2025 的确会迎来 agent 的真正落地。
3 Manus 宣传 GAIA 超过 OpenAI Deep Research,但 deep research 并不是 gaia 的 sota。这进一步说明了23 年的 benchmark 不再适合 2025,需要新的 benchmark,和大量 agent 数据。
4 前几天尤洋怼 deepseek 和硅基流动时候说 Maas 需要 5 倍机器才能商用,未来 token 大户会包括 agent 这样大量使用 token 却能接受一定程度的延迟的客户。Maas 如果提供同一模型不同价格不同延迟保证的服务,就可以依靠市场力量负载均衡进一步降本增效。