在Cursor里用了半天GPT-5,总体觉得它很务实,没有什么灵光一现的时刻,但是交代的内容能基本按预期完成,agentic调用非常流畅,在我心目中很接近Claude Sonnet 4 了,不知道GitHub何时能将其作为默认。大概OpenAI也发现了,还是得先苦一苦AI,让AI去当工具,当工具的人才能回去当人。联想到Cursor将其免费一周,大概率这也是要被用来制衡一下Claude的溢价。
我现在是越来越不看SWE-Bench这种评测了,智能分好几种,我只需要LLM能贯彻我的意志,至于我的意志,那是我不能放弃的东西。每一次我想放弃我的主体性,只是用Wispr Flow胡诌几句都会被眼前的一堆垃圾教训。我没有责怪它的意思,它至少能记得我让它记忆的东西。
我看很多人说GPT-5 变得没人味儿了,这跟它幻觉减少大概率是相关的。能够做梦不也是一种智能吗?但这不是我们希望它拥有的智能。就像老板在DDL面前也不希望我太挑剔一样。