使用了一天第三方的渠道采买的DeepSeek V4pro,感觉体验奇奇怪怪的,关键也不便宜。今晚试了下官网的token,整个CC都变得不一样了,它甚至在我让它读文档的时候自己拆出了十几个助手帮我一起读,同一个问题给出的回答区别超级大,是我的错觉么,而且缓存命中率夸张,超级便宜
让CC拆了一下原因 🔍
1. 流畅度:官方的国内直连节点 vs 代理的海外 VPS 多跳转发,延迟差了一个数量级。代理高峰期排队等 GPU,官方专业级负载均衡。卡不卡,本质是物理距离。
2. 推理深度:这个最要命。Claude Code 会发 thinking 参数让模型做长链路推理,很多代理的 API 转换层不认识这个字段,直接丢弃或者截断。你以为用了同一个模型,实际少了背后那层深度思考。
3. 缓存命中率:官方完整实现了 Prompt Caching,命中后只收 10% 费用。大部分代理根本没做缓存层,每次请求从头算,Token 全价。这是杀手级差异——即使代理标价便宜 20-30%,实际每轮对话成本可能是官方的 3-5 倍。
4. 模型行为差异:切到官方后 Claude Code 会自动并行调用多个子 Agent 处理任务,之前根本没见过。原因就是 thinking 被阉割后模型没有能力做这种层级的规划。
核心结论:第三方代理本质上是「打折但阉割」——丢了 thinking 支持和 prompt caching 两项关键能力。官方 API 看起来单价贵一点,但缓存命中率碾压价格差,实际更省钱。
所以不是错觉,也不是心理作用。便宜的东西最贵的地方,往往不在价签上。