Sam 狂喜,OpenAI 的年底答卷 GPT 5.2 正式发布
不要被他的版本号欺骗,这是今年 OpenAI 的年底大招。
官方定位是:迄今为止面向专业知识工作的最强大模型。
模型性能大幅提升,价格也大幅提升了 40%。
在降本的大趋势下,模型涨价,一般都需要底气。
这个模型的底气在哪里?
前阵子 OpenAI 设计了 GDPval,一个以国内生产总值(GDP)这一关键经济指标为灵感。
1320个专业任务,覆盖了美国 GDP 贡献排名前 9 大行业中精选出的 44 个职业。
任务要求提交真实的成果作品,例如销售演示文稿、会计电子表格、急诊排班表、制造流程图,或短视频。
刚发布 GDPval 的时候,Claude Opus 4.1 以 47.6 的分数遥遥领先。
但是今天, GPT-5.2 直接把分数刷到了 70% 以上。
mp.weixin.qq.com