范青的AI工坊的个人主页

即刻App年轻人的同好社区

下载

App内打开

范青的AI工坊

1关注0被关注0夸夸

🎓 在校生，用一张3060搭了两个AI模型 | 追求极致长上下文和防复读 | 非商业，只摊电费 | 欢迎来薅｜🔗 源码开源，见置顶动态

置顶

范青的AI工坊

1月前

🚀 端午打算让我的 3060 显卡连跑 72 小时 AI 服务
🧠 模型：Gemma 12B（精准日常） + 20B（超长上下文 16384）
⚡ 速度 70+ tok/s，成本价 1 元/天，纯粹摊电费
🔗 部署源码已开源：github.com
🙋 想参与测试的朋友，评论区留个“求测试”，我私信发 Key～
#独立开发的日常 #AI工作流

2 10

范青的AI工坊

1月前

端午 72 小时 AI 测试，倒计时 1 天。

即刻上没找到测试的人，但服务会照常跑。
一张 3060，两个模型，16384 上下文，71 tok/s。

6.19 - 6.21，全程记录性能数据和对话案例，测试报告开源在 GitHub。
如果临时想围观或测试，随时留言，我看到就回。

🔗 源码及后续报告：github.com
#独立开发的日常 #AI工作流

0 00

范青的AI工坊

1月前

坦诚说，前几条帖子没什么人看，可能是我不会写推广文案。

但东西是真的：一张 RTX 3060 显卡，两个模型，16384 上下文，71 tok/s。为了端午测试能稳定跑 72 小时，我调试了好几周——显存爆过、缓存格式选错过、半夜自动关机也查过。

现在终于稳了，端午（6.19-6.21）准备正式跑。

三个套餐，只摊电费：
① 留言“求测试”，免费领 500 Tokens
② 0.99 元/天，全模型畅玩
③ 2.99 元，端午畅玩包（10 万 Tokens）

源码全在 GitHub：github.com

就当支持一下学生项目吧。
#独立开发的日常 #AI工作流

1 10

范青的AI工坊

1月前

倒计时 4 天。
你们平时用 AI 最多的场景是什么？
写文案？翻译？写代码？还是写小说？
我端午准备测试两个模型：Gemma 12B（精准日常）和 20B 长文模型（16384 上下文），应该能覆盖这些场景。
源码已开源：github.com
🎁 端午统一发 Key，现在留言“求测试”预约，或者直接告诉我你的答案～
#独立开发的日常 #AI工作流

0 00

范青的AI工坊

1月前

端午打算让宿舍里的 RTX 3060 连跑 72 小时 AI 服务。

一张显卡塞了两个模型：

· Gemma 12B：日常问答，回答严谨不胡说
· 20B 长文模型：16384 上下文，生成 71 tok/s

全依赖 Flash Attention 和 Q8_0 缓存优化，把显存压到极限才跑出来。

成本就一张卡钱，端午测试只摊电费：
① 留言“求测试”，免费领 500 Tokens
② 0.99 元/天，全模型畅玩
③ 2.99 元，端午畅玩包

源码已开源：github.com

⚠️ 端午当天（6.19）统一开机发 Key，现在先预约占坑～
#独立开发的日常 #AI工作流

0 10

范青的AI工坊

1月前

来到即刻的第一天。

0 00