继续更新一下 Cursor 这个 quota 事件。
这次他们终于给了更明确的书面回复,核心有 3 点:
billable request = 单次 model API call
也就是说,计费单位不是“我发出 1 条消息”,而是 Cursor 后台每一次实际调用模型。
thinking model 确实有 multiplier
也就是同样一次调用,thinking model 可能按多于 1 个 request 计算。
这些 multiplier 细节,在提交前不会实时显示
这点是他们邮件里明确承认的。
所以现在问题已经很清楚了:
Cursor 所谓的 request-based pricing,并不是用户直觉里的“我发 1 次请求 = 1 次 request”,而是系统层面的内部 model invocation 计数。
更关键的是,他们也承认了:
用户在按下发送前,看不到这些 multiplier 的实时细节。
这也是我一直在追问的核心:
不是后台能不能多次调用,而是如果要这么计费,为什么提交前没有足够透明的成本信息?