即刻App年轻人的同好社区
下载
App内打开
范青的AI工坊
1关注0被关注0夸夸
🎓 在校生,用一张3060搭了两个AI模型 | 追求极致长上下文和防复读 | 非商业,只摊电费 | 欢迎来薅|🔗 源码开源,见置顶动态
置顶
范青的AI工坊
2天前
🚀 端午打算让我的 3060 显卡连跑 72 小时 AI 服务
🧠 模型:Gemma 12B(精准日常) + 20B(超长上下文 16384)
⚡ 速度 70+ tok/s,成本价 1 元/天,纯粹摊电费
🔗 部署源码已开源:github.com
🙋 想参与测试的朋友,评论区留个“求测试”,我私信发 Key~
#独立开发的日常 #AI工作流
10
范青的AI工坊
1天前
端午打算让宿舍里的 RTX 3060 连跑 72 小时 AI 服务。

一张显卡塞了两个模型:

· Gemma 12B:日常问答,回答严谨不胡说
· 20B 长文模型:16384 上下文,生成 71 tok/s

全依赖 Flash Attention 和 Q8_0 缓存优化,把显存压到极限才跑出来。

成本就一张卡钱,端午测试只摊电费:
① 留言“求测试”,免费领 500 Tokens
② 0.99 元/天,全模型畅玩
③ 2.99 元,端午畅玩包

源码已开源:github.com

⚠️ 端午当天(6.19)统一开机发 Key,现在先预约占坑~
#独立开发的日常 #AI工作流
10
范青的AI工坊
3天前
来到即刻的第一天。
00