最近豆包手机爆火,很多人问我,豆包手机的自动操作到底能不能在普通手机上实现。我最近集中测试了三款不同的智能体,它们都能在手机上执行真实动作,完成跨应用的复杂任务。这里按我自己的真实体验整理,方便大家选择。
1. AutoGLM Phone Agent
它用 ADB 控制安卓手机,也是我最早上手成功的智能体。对我来说,它的最大优势是稳定。我第一次测试时,只给它一句指令,让它打开小红书并搜索上海咖啡店。它能判断自己当前在桌面,从桌面启动应用,再定位到搜索框并输入内容。整个过程的动作序列很自然。我又试了淘宝、微信等应用,识别率和执行质量都不错。更重要的是,它支持无线调试,只要电脑和手机在同一个网络里就能直接操作,这一点对我做自动化测试特别有用。
2. MobiAgent
相较于 AutoGLM,它更像是一个“会思考的手机大脑”。我在密集测试中发现,它最大的特点是能进行多任务处理,而且具备一定的偏好记忆和经验检索能力。我给它设计了一个完整流程:先在小红书找畅销牛仔裤,再切到淘宝比价,最后把结果通过微信发给同事。原本以为会中断,但它整个链路都执行下来了。尤其是跨应用跳转时的判断,很接近真实用户操作。用几次之后,它执行同类任务的速度明显更快,这说明经验模块确实在起作用。如果你希望手机自动处理复杂流程,这款的上限更高。
3. PhoneAgent
这是我在 iPhone 上找到的可行方案。因为 iOS 生态限制多,我原本不抱太大希望,但它使用 Xcode 的测试框架获取界面信息,再让模型做规划和动作执行。我第一次试的时候,让它给朋友发消息。它能准确打开信息应用、定位对话框、输入内容并发送。虽然速度比安卓方案略慢,但考虑到无需越狱,这个能力已经非常突破。我后来又试了设置类操作,例如切换某些系统项,也能正常完成。对纯 iPhone 用户来说,它算是真正能执行动作的智能体,而不是只停留在“问答层面”的助理。
4.总结干货
整体体验下来,如果你需要的是稳定、通用、能快速落地的安卓智能体,AutoGLM Phone Agent 足够胜任。如果你追求更强的理解能力、复杂任务规划和持续学习效果,MobiAgent 会更像一个可以培养的数字助理。而如果你是 iOS 用户,目前 PhoneAgent 是最接近豆包手机体验的方案,可以让你的 iPhone 获得基础的自动操作能力。
这段时间的持续测试让我更加确认,手机智能体正在重塑人与手机的交互方式。过去需要手动脚本才能完成的操作,如今模型已经能自己看界面、想步骤、动手执行。前段时间我那篇“解放双手的 AI 读微信”文章之所以爆火,也说明大家已经准备好接受这种新范式。
它的意义不在于自动化本身,而是普通手机也能拥有“代理人”能力,不再依赖特定机型。结合最近豆包手机因自动发微信引发的封号讨论,更能看出行业正处在从“人做事”到“人机协同”的关键过渡期。
#手机智能体 #手机自动化 #豆包手机平替 #AI工具 #安卓自动化 #iOS自动化
#人机协同 #AI实测体验 #工作提效