GPT-5 昨天发布了,宣称具备更好的代码能力和更强的架构,平时我用Claude4居多,于是用同样的prompt让GPT-5 和 Claude 4开发网站,对比下他们在代码场景的表现。
✅ 速度:GPT-5 比较慢,不知道是思考时间过长还是代码场景适配不够,尤其在多文件任务中。Claude 4 在长时间会话中依然保持响应流畅。
✅ 代码质量与架构:Claude 4 模块边界更清晰,测试覆盖更完善,异常处理更全面。GPT-5 往往需要额外追问来补齐。
✅ 项目完整度:Claude 4 一次就能产出可直接合并的代码;GPT-5 则会留下需要后续处理的 TODO。
✅ 上下文处理:Claude 4 在长时间对话中更稳定地保持上下文一致性。
Twitter上都是夸的,翻了翻Reddit,有人跟我的体验一致。
📌 在我的用例中,GPT-5 表现远不如 Opus 4.1……Opus 是唯一能‘学会’规则并写出可运行代码的模型。
📌 在大型重构方面,Claude Code 是王者。GPT-5 在我详细的提示下表现平平。
📌 在复杂调试中,GPT-5 可能更精细,但速度更慢。
因此如果你在意可直接投入生产的代码、且希望尽量减少返工,截至 2025 年 8 月,Claude 4 依然是赢家。(不知道下个月有没有重量级模型发布…
GPT-5 谨慎的推理方式在复杂问题解决中依然有价值,但是相应地速度变慢。
GPT5在非代码场景还是有一些优点的,可以根据任务类型切换。