个人vibe coding第二弹 做了个播客转录摘要工具 主要为了解决英文播客听起来太累的问题
流程是RSS抓取- Azure Speech转录 - GPT摘要+ gpt-image-1.5出图 - 生成静态站点 截图是移动端和PC浏览器效果
因为国内坑爹的网络还把抓取转录模块做成远程可以在海外云端执行 只需要拉生成后的文本和图片回来就好
目前遗留问题就是可能prompt需要再优化(直接让Gemini给写的prompt总觉得还差点意思特别是出图的部分)
后续可能再加个自动发公众号
感想是非程序员体验了一把软件工程,其实这里还是迭代了好几个版本的 ,现在模型的能力足够完成这种小工具,但关键还是你的脑袋要知道需要做什么不能让AI放飞自我. 特别理解SPEC DRIVEN模式 ,这对有PM经历的人反而是个优势了