即刻App年轻人的同好社区
下载
App内打开
一啸-Skoo
457关注1k被关注2夸夸
一个做过10年infra现在AI应用还是喜欢infra的程序员
硬地骇客播客
Podwise.ai
一啸-Skoo
8天前
“There’s a difference between believing in something and seeing it work.”
00
一啸-Skoo
23天前
Life is an anthology of destruction. Everything you build eventually breaks. Everyone you love will die. Any sense of order or stability inevitably crumbles. The entire universe follows a dismal trek toward a dull state of ultimate turmoil.

What Is Entropy? A Measure of Just How Little We Really Know. | Quanta Magazine

00
一啸-Skoo
28天前
Podwise 算力资源的几个阶段:
1. mvp 时期的本地 mac 🥹
2. Google 小哥友情赞助的 4090 pc 🙏
3. aws 赞助 (国内云厂要努力)😔
4. azure 赞助 (国内云厂要努力)😔
5. runpod 按需弹性 GPU (好使,感觉走上了正道) 👍
00
一啸-Skoo
29天前
所有做 infra 产品的,要努力成为 infra 用户。
00
一啸-Skoo
1月前
runpod serverless,一个下午(包括改自己的代码) 差不多就本地测试通过了。

GPU 资源多,还便宜,目前感觉真不错。等上线运行。

一啸-Skoo: 用 cog 打包 replicate 模型,搞了两个下午了,无果 🌚

00
一啸-Skoo
1月前
最近每天晚上都要喝掉这一大瓶椰汁🥥 离谱
40
一啸-Skoo
1月前
cog 打包 replicate 模型,搞了两个下午了,无果 🌚
11
一啸-Skoo
1月前
花了一个小时就给podwise 添加了 “基于AI 问答的个性化推荐”,随着使用的时间越长推荐效果越好。

用户历史行为分析的代码还是靠 AI 写的 😎

这都是我平时听得比较多的主题 😍
01
一啸-Skoo
1月前
文章是用来读的,播客是用来听的,视频是用来看的。

你可以做得更好,但不能逃出这个基本定律。
01
一啸-Skoo
1月前
replicate 符合我心中的理想推理平台,serverless 模式,秒级计费,自定义模型。以前用容器做serverless,一定绕不开如 java 环境启动时间长的问题,但现在模型推理环境比 java 长多了。所以 replicate 目前同样存在的一个痛点问题就是 “低频访问的模型,很难用到需要实时性的推理场景“。

Infra 问题才让人着迷。
21