摸索 C 端产品在工程上的 Wrapping 也是我的乐趣之一。
最近 Notebooklm 更新了一个新的选项,可以在生成的音频时长上选择“默认”或“较短”。
我不是一直在做那个全 AI 生成的 15-20 分钟短播客(《商业甜点》🔗
www.xiaoyuzhoufm.com)么?考虑到之前 Notebooklm 生成的默认长度是 7-8 分钟,并且gemini-2.5-flash-live 这个音频模型系列之前的最大输出是 10 分 55 秒。
Notebooklm 在更新之前,虽然默认是 8 分钟音频,但我已经摸索了一个方法,能让它稳定的突破这个限制生成 15-20 分钟的音频。
按照模型极限来推测,是如果预判内容超出单次生成极限,会对音频文稿进行截断后发起第二次生成再把两个音频文件做拼接。这也是为什么播客会在中间的某个位置,两个主持人的语音语调会突然有一次接不上的情况。
所以我第一反应是,现在我应该选择这个“默认”来继续生成我 15-20 分钟的短播客。
但结果是,在这个选项下,我尝试了许多限制性 Prompt 都不起作用,生成的音频通通在 30 分钟左右。
看起来是在产品层面,它对“默认”这个长度的音频文稿做出了最低限制,以保障生成的音频一定会超出某个时长。
切换回“较短”(默认的 8 分钟长度),然后使用旧 Prompt,稳定的 15 分钟输出又回来了。