即刻App年轻人的同好社区
下载
App内打开
紫豪Pair
469关注91被关注0夸夸
📱 Pair心译(IOS)
🦐 github.com/JayShna/sms-rpg
🫧 WX:songzihao
紫豪Pair
21天前
使用了一天第三方的渠道采买的DeepSeek V4pro,感觉体验奇奇怪怪的,关键也不便宜。今晚试了下官网的token,整个CC都变得不一样了,它甚至在我让它读文档的时候自己拆出了十几个助手帮我一起读,同一个问题给出的回答区别超级大,是我的错觉么,而且缓存命中率夸张,超级便宜🫪

让CC拆了一下原因 🔍

1. 流畅度:官方的国内直连节点 vs 代理的海外 VPS 多跳转发,延迟差了一个数量级。代理高峰期排队等 GPU,官方专业级负载均衡。卡不卡,本质是物理距离。

2. 推理深度:这个最要命。Claude Code 会发 thinking 参数让模型做长链路推理,很多代理的 API 转换层不认识这个字段,直接丢弃或者截断。你以为用了同一个模型,实际少了背后那层深度思考。

3. 缓存命中率:官方完整实现了 Prompt Caching,命中后只收 10% 费用。大部分代理根本没做缓存层,每次请求从头算,Token 全价。这是杀手级差异——即使代理标价便宜 20-30%,实际每轮对话成本可能是官方的 3-5 倍。

4. 模型行为差异:切到官方后 Claude Code 会自动并行调用多个子 Agent 处理任务,之前根本没见过。原因就是 thinking 被阉割后模型没有能力做这种层级的规划。

核心结论:第三方代理本质上是「打折但阉割」——丢了 thinking 支持和 prompt caching 两项关键能力。官方 API 看起来单价贵一点,但缓存命中率碾压价格差,实际更省钱。

所以不是错觉,也不是心理作用。便宜的东西最贵的地方,往往不在价签上。
11
紫豪Pair
24天前
🦞的热度大减,但我的使用时长却越来越多。分享我使用时长最多的三个场景:
1. flomo回顾。和自带的回顾不一样,我让AI随机吐一篇给我,然后我给笔记打分,让AI慢慢学习我对于笔记价值的判断(skill:
/flomo-grading)
2. flomo随机漫步。复刻端的体验,每次随机给你推一篇笔记+10个相关笔记并编号,回复编号继续漫步🚶,可以一直玩儿下去(skill:/flomo-random-walk)
3. 武侠X。做了一个小说生成引擎,和直接对话让AI生成小说不一样,能记录角色状态、故事线、背包状态(skill:
/wuxia-x)
00
紫豪Pair
26天前
OpenClaw最近热度降得很快。

我琢磨了一下原因。其实很多人根本不需要远程控制电脑,也不需要在微信上让AI做个PPT。这些场景离普通用户太远了。

但游戏不一样。游戏大家都会玩。

可搜了一圈,没人做游戏。

---

这就让我想起20年前的一件事。

那时候还是诺基亚时代。我接触到一款"短信游戏"——运营商给你发一条剧情,末了给你ABC三个选项,你回复字母,它按预设好的剧情回你下一条。

就这么个简陋的东西,我玩了一整天。

然后我妈收到话费账单,几十块钱没了。差点挨打。

这事儿我记到现在。

---

最近在微信上一来一回跟AI聊天,那个感觉突然回来了。

我去网上找当年那游戏的截图。

没有。找不到。

一个时代的东西,就这么没了。

---

找不到,那自己做一个吧。

武侠X——文字冒险游戏引擎。

在微信里就能玩。没有固定剧情,AI现编。你选什么,故事就往哪边走。

不为啥,就是想复刻那个差点挨打的下午。

---

有没有人当年也玩过这种短信游戏的?

skill地址:github.com
00
紫豪Pair
1月前
挽救计划,本来只想翻开打发下时间,结果连续看了3个小时
00
紫豪Pair
1月前
flomo这个视角也太酷了。最令我哭笑不得的是一座叫做“情绪福利”的山峰,那是早年间,即刻还流行“今日任务完成✅”的时候,搜集的福利图,只有图,没有字🙂‍↔️,等高线特别均匀🫪🫪🫪
30
紫豪Pair
1月前
flomo出生几个月之后相遇的,是一个让人嫉妒到“为什么不是我做的”的那种产品,已经用了2049天了

少楠Plidezus: 明晚 flomo 6 周年直播, 欢迎新老朋友来唠唠嗑σ(゚ε゚σ)♫, 聊聊今年 flomo 会发生的变化。 微信扫码预约哈~ 当然,还准备了一些福利

00
紫豪Pair
2月前
微信clawbot在电脑微信上也能使用了,但它依然有push重复推送的bug 👀
00
紫豪Pair
2月前
微信clawbot每次都会重复推送两次,很神奇的bug🙂‍↔️
00