即刻App年轻人的同好社区
下载
App内打开
禹创
86关注43被关注3夸夸
Learning | Thinking | Connecting | Practicing
探索智能的未来与人机协作新范式
禹创
1天前
Cline 官方这样评价 GPT-5:

它严谨、执着,且能力出众。在规划阶段,它善于协作;在执行阶段,它是一位勤奋的操作员。它会进行周密的规划,在需要时提出带有选项的追问,然后就直接上手交付代码。在处理长任务时,它会持续工作,直到一个阶段才停下来征求反馈。它会严格遵循指令。最重要的是——它写的代码质量很高。

Augument 官方:
使用 GPT-5: 复杂的调试、跨文件重构,需要谨慎、完成、彻底的情况。在大型上下文场景中表现更好。

我的实际体验呢?

切到 GPT-5 用了一会,感觉怪怪的。虽然一开始也有惊艳之处,比如默默干活而不话痨。

但切回 claude,原来的感觉又回来了...

我主要提供的都是较精细的任务,GPT-5 prompt 很精细的任务上完成的可以,但有时会在长任务下忽略某些指令。不知道在模糊性问题下如何。

不过,GPT 性价比不错。目前没有出现像是 claude 一贯的任务完成的幻觉(实际未完成)。

GPT-5 也不像 claude 有时会过度设计与开发(目前未发现)。

但还是 claude 更好用。
01
禹创
7天前
LLM 状态污染真可怕。系统返回一串 json加到上下文中,结果后面输出直接被 json 污染了...一直都以为是代码出问题了,调试了一天,最后释放一下上下文解决了...
20
禹创
7天前
构建对软件工程流程和体系的整体理解,提升与 coding agent 的沟通、设计和判断的能力。

应该关注什么、为什么重要,并且能用工程语言清晰地表达想法,代码细节交给 AI,判断是否靠谱仍需要自己审查。

可靠、高效、可持续地把一个软件做出来,并一直维护。

在和 AI 协作中经历并主导了整个系统的生命周期:需求分析、架构设计、模块划分、接口协议、测试流程、部署策略...

趋势上,AI coding 越来越不需要让人手动编码。

需要系统思维、工程方法论和大量的项目实战锻炼(哪怕和 AI 协作)

这种路径是从架构出发-利用 AI 实现-以工程标准评估
00
禹创
10天前
虽然 AI 还是自信地坚持他的方案,但我想到一个更优雅的实现方法,果断附和我。AI 果然还不能脱离人类(确信🤓)
10
禹创
13天前
Cursor CEO Michael Truell在一次访谈中提到:

我们创建 Cursor 的目标是发明一种新型的编程方式,一种非常不同的软件构建方式。
在我看来,这是一个某种程度上代码之后的世界,越来越多的工程师会开始觉得自己像是逻辑设计师。实际上,这将是关于明确你对于一切如何运作的意图。……它看起来像一个你拥有软件逻辑的表达的世界,这个表达更像英语,对吧?你已经写下来了,你可以想象成文档形式,你可以想象成编程语言朝着伪代码演进。
我认为品味将变得越来越有价值。……成为一名工程师会开始感觉像是成为一名逻辑设计师。而且实际上它将是关于详细说明你希望一切如何运作的意图。...它将更多关于“是什么”,而较少关于你将如何在底层具体地“如何”做事情。

在我的实践中,对此颇有体会。

我们总会看到两种极端论调:AI编程是阶段性共识幻觉,或是鼓吹其完全替代程序员。前者往往源于缺乏有效且高质量的协作实践,而后者则局限于让AI生成简单的Web应用。

当然,模型的能力仍在进步,就当前的这一范式仍然需要人类的结对协作。至于更进一步的AI,无法得知、无法评价也无法预测。

我看到的是,上下限变得越来越大...

AI或许会取代 coding,但在 engineering 方面仍有很长的路。对于那些足够了解AI并能高效协同的工程师,他们的价值将变得前所未有的“高级”。模型会将工程师从繁琐的“如何实现”中解放出来,更专注于“构建什么”和“为何构建”。

“品味将变得越来越有价值”。竞争力也会来源于技术品味、架构直觉和对需求的深刻洞察力。我们的主要工作,也许是向AI清晰地表达我们的意图。

构建一个沟通框架:模块化、简单、组合、文档依赖,这是目前的实践所得,也应该继续探索深化。

coding agent 已经足够有效且高效,不仅被市场验证,更是被公司普遍采用。大厂与创业公司都在争先恐后涌入AI IDE、CLI或是AI coding

不得不说,市面上大多数所谓的Agent,本质上是基于LLM的多轮工具调用。这更像是一种被精心编排的工作流,尽管因LLM的存在而具备了一定的不确定性和灵活性。

我越来越感受到,下一轮的agent的智能体现不仅在外部工具调用,还有工程实现的内部状态演化,不仅是上下文工程、记忆反思、缓存优化...我仍旧认为Manus走在Agent行业前沿。

继续探索...
00
禹创
13天前
人与 AI 协作的一个风险来源于隐性知识和模糊约定。人与人之间也是。
00
禹创
15天前
Goodhart's law 古德哈特定律:

当一项经济指标被设定为政策目标时,该指标将失去反映真实情况的能力。

类似地,当一个衡量标准成为目标时,它就不再是一个好的衡量标准。
00
禹创
18天前
有一种学习模式是值得推荐的:“学技术,泛读十本书不如精读一本书十遍。”这句话适用于任何领域的学习。挑一本最精华的书,把这本书当做主体,然后用其他书辅助从而来弥补这本书的缺陷。
00