前段时间测试了一批平台的 AI 中文播客生成功能,
当我看着它们整齐地交上“作业”,脑海里突然闪过一个念头:
不如搞一场测评比赛吧!
当然,我这个糙人做不了评委,
那就请出我们永远的知识评审 —— GPT老师!
🤖 评委登场:GPT-5(a.k.a. G老师)
虽然大家都在怀念曾经的白月光 4o,
但我觉得 GPT-5 也依然胜任评委一职。
我请 G 老师设计了一套评分标准,
再把这些平台生成的中文播客文字稿都扔给它(毕竟它不会听音频)。
使用的是 GPT 的代理分析模式,评分维度包括:
• 忠实度
• 结构与逻辑
• 语言表达
• 听感与可听性
• 信息增量
然后,G老师就开始认真阅卷啦~
📊 最终评分结果见图3
这边也为大家贴一下G老师给的评语👇:
🟠 豆包 & 扣子空间:
像是简化版新闻播报,能快速了解主题,但细节还原较少,有些术语翻错了……
有时还会“凭空添加”未出现的内容(比如价格、段子),建议加强对原文忠实度。
🔵 腾讯混元:
分析角度偏离主题太多,更像一个AI助手讲AI新闻,没怎么讲清楚 GPT-5 和 Alexa+ 的新内容。
🟣 IMA & ListenHub:
语言自然,有创意。
ListenHub 的内容覆盖最全,还用了类比+延展分析,把 AGI、开源大战、语音助手的逻辑串起来了,是本次评测最优秀的一档!
IMA 也不错,但观点稍微多了一点八卦味,如果能更贴主题会更好。
📝 总结一下:
如果你想听得快、听得准、听得舒服:
🔝 ListenHub 绝对可以一试;
😌 IMA 适合喜欢“轻口味行业观察”的听众;
⏩ 豆包和扣子 适合当成快餐听听。
叠个甲:以上内容均由G老师提供,与本人无关