体验了一下 TRAE 新的 SOLO Coder Agent,用它做了一个相当复杂的项目
AI 可以帮你分析你的力量训练数据,给出非常详细且直观的训练报告,我教练看得都震惊了
打破了我以前的认知,规划能力和多次修改的稳定性很突出。
下面介绍一下他们这次更新的主要内容,以及我这个项目的构建过程👇
懒得等施工🚧的话可以在这里看长文:
mp.weixin.qq.com-----------------------------------------------------
首先是这次新增的一个模式叫 Solo Coder
相较于之前的 Solo Builder 模式,它的整个能力会更加的强大,非常适合这种复杂代码库的维护,支持智能任务的规划以及多 Agent 的协同进行并发工作。
在创建新任务的时候就可以选择 Solo Coder 模式。
选择完成之后可以发现,整个软件编程了三栏的交互设计:
最左边是多任务列表,你可以看到每个任务目前的状态,它的任务是正在进行完成了,还是已经中断了。
中间的就是主页面,就是你跟当前选择 Agent 的主要交互界面就在这里,你可以输入信息,然后看到 Agent 当前的执行细节。
最右边就是一些不同的窗口的预览,它会根据当前的 Agent 进行的状态,切换不同的工具,帮你展示不同的信息。
比如说当前是要预览网页的,就是浏览器。
当前是要让你看这个编码的效果或者更改的效果的话,就是代码变更页面。如果说你是要看具体的代码,它就是具体的 IDE 的那个编辑器界面。
包括它还支持实时跟踪,就能够当时自动的给你打开对应的页面进行预览。在右侧。
Coder 模式的多 Agent 并发能力。
你完全可以创建多个 Agent 窗口,让他们同时进行不同的任务。这样可以不同的 Agent 进行规划,一个进行操作,一个进行设计。
我这里第一个就是用来让 AI 去优化它的交互和设计。让他查找一些交互设计存在的问题
第二个就是分析项目的优化点,就是分析一些目前其他 Agent 写出来的代码存在的问题
最后就是一个正常的正在迭代的写代码。
而且多任务并发这里,你可以自己去创建新的 Agent。
目前创建 Agent 的时候,那些表单你可以不用自己去填写了,你只需要大概描述一下需求,它会去帮你去创建 Agent 所需要填写的表单,你只需要稍微的微调就可以,这个自动生成的智能体图标也很有意思。
它现在就会有个计划模式,如果你开启了这个 plan 模式的话,它在执行操作前就会自己进行规划任务。
然后会告诉你哪个任务执行完,哪个任务还没有执行,执行的结果是什么样的,会让你有一个清晰的认知,对目前的进度。
而且他们的表现形式和 UI 处理得很好,表现得很清晰。
然后是上下文压缩,我觉得很好,尤其是它会让你直观地看到正在进行上下文压缩。
给出了一个非常好的解决方案:你可以主动触发上下文压缩,也可以在达到上下文长度时由 AI 自动压缩。
在上下文达到 70% 的时候,我看见它出了一个窗口自动总结和上下文。这个时候你会感觉很安心,就会觉得一切尽在掌控。
它非常智能,不会因为上下文爆了而导致最后瞎改乱改,会把关键信息全部总结好存起来。
然后一些有感知的改动介绍完之后呢,再它整个的能力的提升。
--------------------------------------------------------
这里的话我就会讲一下我这个项目是怎么做的。
这个需求来自于我在健身的时候跟教练的对话,因为他每次都会给我发这次训练的表格。
后来我就想要是可以做个 AI 分析系统就好了,根据每次训练状态打分,然后是总的介绍和建议,最后将数据可视化展示,告诉我每个动作的要点和用图表直观的看到进步。
刚开始我就是简单的说了一下要求,也没有让他解析,就是想直接把数据放在文档里面。
它启动了一个 React 项目,中间有几次小的报错,然后右边内置的浏览器可以把报错内容发给左边的输入框,它就正常都修复了,没有进行干预,我也没有给提示。
生成结果,就三个圆环,数据统计非常简单,这个介绍等于没说。
然后我就想说,不行,就跟他讨论一下这种分析应该是有哪些元素?就比如说他需要更详细一点之类的。
这是第一次,我感觉到这个东西好像不太一样,他认真地读了我所有的数据,然后设定了一个非常详细的报告。
然后他就搞定了,因为整个的内容是非常详细的,中间的动作分析呢每一个动作都有。
你想想我训练的时候可能涉及到几十个动作,每一个动作的分析都有。训练科学的介绍和解释也比较详细。
后面我还对这个页面做了很多零碎的修改。
就比如说它原来是 emoji 图标。然后原来的图表没有调用这种正常的折线图或者什么图表,它都是自己写的一个,就是有很多问题。这些修改呢最后都完成了。
不过上下文我看已经到了百分之七八十了,我就心想这是不是见好就收就这样了。
再写的话,一般来说这种 Agent 这个时候它可能就要报错或者是遗忘上下文了。
但是心想反正都是了,他现在都写这么好了,我就直接让他做一做试试呗。
于是就让他把这个改成一个真正的产品,可以接受任何人的数据以及设置,进行分析。
我就看到他开始压缩上下文,压缩完上下文以后,他就开始正式地进行这个完整产品的迭代。
最后在运行的时候,经过几次 debug,完全是他自己进行的。它启动自带的浏览器,发现控制台有报错,然后自己去修复;经过一段时间的修复,终于搞定,所有功能都 OK。
-------------------------------------------------------------
来看一下这个产品最后的结果:
你首先是填写自己的基本信息,然后上传那个 CSV 表格。
之后的话填写你自己的 Gemini API,这个也是免费的。
再之后的话,它会去等待 Gemini 的分析。
最后的话分析结束是三个部分:
第一部分就是总览,你训练的怎么样。
第二部分是训练科学,就是你现在的 AI 给你的建议。
第三部分是每个动作的动作数据,然后动作的要点以及这个动作重要性,以及当前你现在的进度。
在之后的话,我看到它右上角有个部署,我就部署了一下,然后部署上去以后发现是需要连接那个 vercel 的。
然后上去之后发现它是 404 了,由于我也没有用过 vercel,所以说我也不知道它应该是什么问题。然后我看了那个 log 页面,我没有看,我也没有看出问题来。
于是我就 404 截图,还有 Vercel 那个平台的 log 页面截图发给他了。然后让他分析,没想到他真找到了问题,然后也修复了,修复了以后上传上去就好了。
而且他找到的问题和开发者朋友发现的问题是差不多的。
-----------------------------------------------------------------
整体下来最震惊我的是它的规划能力和多次修改的稳定性。
包括应该输入什么内容、每个部分的内容分析是什么样的,以及交互体验应该是什么样的,我都没有给他细说。
以前作为 Vibe coding,为了避免 AI 模型自己发挥或者报错,我们都要说得很细,但这次我故意什么都没说。
每次都是想到什么了,或者报错了,我才开始改,或者让他说。
但是它像信息的填写表单有哪些内容,包括中间 AI 去分析的时候,等待页面他都考虑到了。