即刻App年轻人的同好社区
下载
App内打开
歸藏
560关注23k被关注48夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
2天前
NotebookLM 里程碑式的一 步,终于支持用图像作为数据源了

你的课堂拍摄的板书以及一些教科书的内容,还有表格,或者是街面上临时拍摄的照片,都可以作为数据源,然后检索。

感觉对于学生党和听课的一些人来说非常有用。
00:36
99
歸藏
2天前
Steam Machine 这个可以自定义的磁吸前面板太好玩了

他们还开源了参数你可以自己 3D 打印和定制,墨水屏显示数据这个估计后面会卖爆

Steam Machine Valve 推出的 SteamOS 客厅主机:

它用定制的 AMD Zen 4 + RDNA3 APU,性能号称超过 Steam Deck 六倍,体积却只有一台小型机顶盒那么大,直接接电视就能以 4K 为目标畅玩你的整套 Steam 游戏库
00:30
14
歸藏
2天前
Gemini 上的 Veo 3.1 现在支持多图参考了

可以提取不同图片的元素参考后生成视频
00:08
01
歸藏
2天前
杨立坤也喷了昨天 Anthropic 的傻逼研究,他们目的太明显了
11
歸藏
2天前
刚发现 MuleRun 发布 2.0 版本了,他们说上线一个月用户突破了 50 万,美国占比最高。

新版本可以帮用户配置专属的 Agent 团队,而且上线了非常多的垂直行业 Agent 专题。

他们跟相关行业专业公司和团队合作创建 Agent 的方向也发展良好,创建了很多关于电商、数据分析和内容创作的专业 Agent。

现在进到官网会让你选择适合你职业的 Agent 团队,用户可以选择将多个 Agent 组合使用然后成体系的解决问题。

比如里面有阿里国际的 PicCopilot Agent ,封装了一堆适合电商的工具,比如 AI 商品展示图、风格克隆、虚拟试穿等。

可以帮助商家快速处理电商图片和视频素材,然后重新生成用于投放和宣传的内容。

另外还有 Quick BI 这个 AI 商业分析平台创建的数据和报表分析 Agent,可以快速对用户数据报表进行处理发现其中的机会或者异常。

我这手头没啥报表,拿前几天的健身数据表试了一下,居然也可以,而且他分析过程中会调用 Python 等编码工具所以不用担心 LLM 的幻觉问题。

我这里问了他对于下半身锻炼,使用负荷在10到30单位之间的练习的训练量分布(组数 × 次数)是多少?

他会先用工具分析和提取对应数据,然后 AI 才会介入分析提取出来的数据。

我还翻了一下其他的 Agent,现在基本你想到的 AI 能做的里面都有,甚至还有 sora 视频生成和去除 Sora 水印,哈哈

这种 Agent 市场一旦规模化对于用户还是非常方便的,啥功能都有,迭代速度也很快。
219
歸藏
3天前
NotebookLM 的深度研究上了,但是他们这个交互非常有意思。

不是像之前一样给你出个报告。而是把所有收集到的上下文信息全部填充到左边的这个上下文列表里。

然后你愿意咋问咋问,你想让他输出啥就输出啥,包括输出音频概览和视频概览。

如果你想要研究一些东西的话,我感觉这种比较合适。
69
歸藏
3天前
不是,Open AI 真要干社交啊

前几天泄露的群聊功能上了,会先在日本、新西兰、韩国、台湾上线,免费用户也可用

点击 APP 右上角的人物添加人物图表就可以邀请好友,上下文会保持并且新开一个对话

模型用的是 GPT‑5.1 Auto ,会根据提问者的会员等级切换模型,一点漏洞不给钻,真有你的 Sam

支持搜索、图像和文件上传、图像生成以及听写功能。

ChatGPT 在群聊中会遵循对话的流向,并根据群聊的上下文决定何时回复、何时保持沉默。

群组管理能力也有,可以添加移除群成员,管理群名称等。
1617
歸藏
3天前
中美两国在AI上一个没电,一个没卡,也是一对苦命鸳鸯了
4115
歸藏
3天前
让 Trae 把昨天写的 AI 健身分析项目所有组件迁移到了 Shadcn UI 设计系统,全程没有干预,这里试试:traezxkjhjlo.vercel.app

歸藏: 体验了一下 TRAE 新的 SOLO Coder Agent,用它做了一个相当复杂的项目 AI 可以帮你分析你的力量训练数据,给出非常详细且直观的训练报告,我教练看得都震惊了 打破了我以前的认知,规划能力和多次修改的稳定性很突出。 下面介绍一下他们这次更新的主要内容,以及我这个项目的构建过程👇 懒得等施工🚧的话可以在这里看长文:https://mp.weixin.qq.com/s/k-BlZN-IL_Gbf7hW1V8aZA ----------------------------------------------------- 首先是这次新增的一个模式叫 Solo Coder 相较于之前的 Solo Builder 模式,它的整个能力会更加的强大,非常适合这种复杂代码库的维护,支持智能任务的规划以及多 Agent 的协同进行并发工作。 在创建新任务的时候就可以选择 Solo Coder 模式。 选择完成之后可以发现,整个软件编程了三栏的交互设计: 最左边是多任务列表,你可以看到每个任务目前的状态,它的任务是正在进行完成了,还是已经中断了。 中间的就是主页面,就是你跟当前选择 Agent 的主要交互界面就在这里,你可以输入信息,然后看到 Agent 当前的执行细节。 最右边就是一些不同的窗口的预览,它会根据当前的 Agent 进行的状态,切换不同的工具,帮你展示不同的信息。 比如说当前是要预览网页的,就是浏览器。 当前是要让你看这个编码的效果或者更改的效果的话,就是代码变更页面。如果说你是要看具体的代码,它就是具体的 IDE 的那个编辑器界面。 包括它还支持实时跟踪,就能够当时自动的给你打开对应的页面进行预览。在右侧。 Coder 模式的多 Agent 并发能力。 你完全可以创建多个 Agent 窗口,让他们同时进行不同的任务。这样可以不同的 Agent 进行规划,一个进行操作,一个进行设计。 我这里第一个就是用来让 AI 去优化它的交互和设计。让他查找一些交互设计存在的问题 第二个就是分析项目的优化点,就是分析一些目前其他 Agent 写出来的代码存在的问题 最后就是一个正常的正在迭代的写代码。 而且多任务并发这里,你可以自己去创建新的 Agent。 目前创建 Agent 的时候,那些表单你可以不用自己去填写了,你只需要大概描述一下需求,它会去帮你去创建 Agent 所需要填写的表单,你只需要稍微的微调就可以,这个自动生成的智能体图标也很有意思。 它现在就会有个计划模式,如果你开启了这个 plan 模式的话,它在执行操作前就会自己进行规划任务。 然后会告诉你哪个任务执行完,哪个任务还没有执行,执行的结果是什么样的,会让你有一个清晰的认知,对目前的进度。 而且他们的表现形式和 UI 处理得很好,表现得很清晰。 然后是上下文压缩,我觉得很好,尤其是它会让你直观地看到正在进行上下文压缩。 给出了一个非常好的解决方案:你可以主动触发上下文压缩,也可以在达到上下文长度时由 AI 自动压缩。 在上下文达到 70% 的时候,我看见它出了一个窗口自动总结和上下文。这个时候你会感觉很安心,就会觉得一切尽在掌控。 它非常智能,不会因为上下文爆了而导致最后瞎改乱改,会把关键信息全部总结好存起来。 然后一些有感知的改动介绍完之后呢,再它整个的能力的提升。 -------------------------------------------------------- 这里的话我就会讲一下我这个项目是怎么做的。 这个需求来自于我在健身的时候跟教练的对话,因为他每次都会给我发这次训练的表格。 后来我就想要是可以做个 AI 分析系统就好了,根据每次训练状态打分,然后是总的介绍和建议,最后将数据可视化展示,告诉我每个动作的要点和用图表直观的看到进步。 刚开始我就是简单的说了一下要求,也没有让他解析,就是想直接把数据放在文档里面。 它启动了一个 React 项目,中间有几次小的报错,然后右边内置的浏览器可以把报错内容发给左边的输入框,它就正常都修复了,没有进行干预,我也没有给提示。 生成结果,就三个圆环,数据统计非常简单,这个介绍等于没说。 然后我就想说,不行,就跟他讨论一下这种分析应该是有哪些元素?就比如说他需要更详细一点之类的。 这是第一次,我感觉到这个东西好像不太一样,他认真地读了我所有的数据,然后设定了一个非常详细的报告。 然后他就搞定了,因为整个的内容是非常详细的,中间的动作分析呢每一个动作都有。 你想想我训练的时候可能涉及到几十个动作,每一个动作的分析都有。训练科学的介绍和解释也比较详细。 后面我还对这个页面做了很多零碎的修改。 就比如说它原来是 emoji 图标。然后原来的图表没有调用这种正常的折线图或者什么图表,它都是自己写的一个,就是有很多问题。这些修改呢最后都完成了。 不过上下文我看已经到了百分之七八十了,我就心想这是不是见好就收就这样了。 再写的话,一般来说这种 Agent 这个时候它可能就要报错或者是遗忘上下文了。 但是心想反正都是了,他现在都写这么好了,我就直接让他做一做试试呗。 于是就让他把这个改成一个真正的产品,可以接受任何人的数据以及设置,进行分析。 我就看到他开始压缩上下文,压缩完上下文以后,他就开始正式地进行这个完整产品的迭代。 最后在运行的时候,经过几次 debug,完全是他自己进行的。它启动自带的浏览器,发现控制台有报错,然后自己去修复;经过一段时间的修复,终于搞定,所有功能都 OK。 ------------------------------------------------------------- 来看一下这个产品最后的结果: 你首先是填写自己的基本信息,然后上传那个 CSV 表格。 之后的话填写你自己的 Gemini API,这个也是免费的。 再之后的话,它会去等待 Gemini 的分析。 最后的话分析结束是三个部分: 第一部分就是总览,你训练的怎么样。 第二部分是训练科学,就是你现在的 AI 给你的建议。 第三部分是每个动作的动作数据,然后动作的要点以及这个动作重要性,以及当前你现在的进度。 在之后的话,我看到它右上角有个部署,我就部署了一下,然后部署上去以后发现是需要连接那个 vercel 的。 然后上去之后发现它是 404 了,由于我也没有用过 vercel,所以说我也不知道它应该是什么问题。然后我看了那个 log 页面,我没有看,我也没有看出问题来。 于是我就 404 截图,还有 Vercel 那个平台的 log 页面截图发给他了。然后让他分析,没想到他真找到了问题,然后也修复了,修复了以后上传上去就好了。 而且他找到的问题和开发者朋友发现的问题是差不多的。 ----------------------------------------------------------------- 整体下来最震惊我的是它的规划能力和多次修改的稳定性。 包括应该输入什么内容、每个部分的内容分析是什么样的,以及交互体验应该是什么样的,我都没有给他细说。 以前作为 Vibe coding,为了避免 AI 模型自己发挥或者报错,我们都要说得很细,但这次我故意什么都没说。 每次都是想到什么了,或者报错了,我才开始改,或者让他说。 但是它像信息的填写表单有哪些内容,包括中间 AI 去分析的时候,等待页面他都考虑到了。

20
歸藏
3天前
体验了一下 TRAE 新的 SOLO Coder Agent,用它做了一个相当复杂的项目

AI 可以帮你分析你的力量训练数据,给出非常详细且直观的训练报告,我教练看得都震惊了

打破了我以前的认知,规划能力和多次修改的稳定性很突出。

下面介绍一下他们这次更新的主要内容,以及我这个项目的构建过程👇

懒得等施工🚧的话可以在这里看长文:mp.weixin.qq.com

-----------------------------------------------------

首先是这次新增的一个模式叫 Solo Coder

相较于之前的 Solo Builder 模式,它的整个能力会更加的强大,非常适合这种复杂代码库的维护,支持智能任务的规划以及多 Agent 的协同进行并发工作。

在创建新任务的时候就可以选择 Solo Coder 模式。

选择完成之后可以发现,整个软件编程了三栏的交互设计:

最左边是多任务列表,你可以看到每个任务目前的状态,它的任务是正在进行完成了,还是已经中断了。

中间的就是主页面,就是你跟当前选择 Agent 的主要交互界面就在这里,你可以输入信息,然后看到 Agent 当前的执行细节。

最右边就是一些不同的窗口的预览,它会根据当前的 Agent 进行的状态,切换不同的工具,帮你展示不同的信息。

比如说当前是要预览网页的,就是浏览器。

当前是要让你看这个编码的效果或者更改的效果的话,就是代码变更页面。如果说你是要看具体的代码,它就是具体的 IDE 的那个编辑器界面。

包括它还支持实时跟踪,就能够当时自动的给你打开对应的页面进行预览。在右侧。

Coder 模式的多 Agent 并发能力。

你完全可以创建多个 Agent 窗口,让他们同时进行不同的任务。这样可以不同的 Agent 进行规划,一个进行操作,一个进行设计。

我这里第一个就是用来让 AI 去优化它的交互和设计。让他查找一些交互设计存在的问题

第二个就是分析项目的优化点,就是分析一些目前其他 Agent 写出来的代码存在的问题

最后就是一个正常的正在迭代的写代码。

而且多任务并发这里,你可以自己去创建新的 Agent。

目前创建 Agent 的时候,那些表单你可以不用自己去填写了,你只需要大概描述一下需求,它会去帮你去创建 Agent 所需要填写的表单,你只需要稍微的微调就可以,这个自动生成的智能体图标也很有意思。

它现在就会有个计划模式,如果你开启了这个 plan 模式的话,它在执行操作前就会自己进行规划任务。

然后会告诉你哪个任务执行完,哪个任务还没有执行,执行的结果是什么样的,会让你有一个清晰的认知,对目前的进度。

而且他们的表现形式和 UI 处理得很好,表现得很清晰。

然后是上下文压缩,我觉得很好,尤其是它会让你直观地看到正在进行上下文压缩。

给出了一个非常好的解决方案:你可以主动触发上下文压缩,也可以在达到上下文长度时由 AI 自动压缩。

在上下文达到 70% 的时候,我看见它出了一个窗口自动总结和上下文。这个时候你会感觉很安心,就会觉得一切尽在掌控。

它非常智能,不会因为上下文爆了而导致最后瞎改乱改,会把关键信息全部总结好存起来。

然后一些有感知的改动介绍完之后呢,再它整个的能力的提升。

--------------------------------------------------------

这里的话我就会讲一下我这个项目是怎么做的。

这个需求来自于我在健身的时候跟教练的对话,因为他每次都会给我发这次训练的表格。

后来我就想要是可以做个 AI 分析系统就好了,根据每次训练状态打分,然后是总的介绍和建议,最后将数据可视化展示,告诉我每个动作的要点和用图表直观的看到进步。

刚开始我就是简单的说了一下要求,也没有让他解析,就是想直接把数据放在文档里面。

它启动了一个 React 项目,中间有几次小的报错,然后右边内置的浏览器可以把报错内容发给左边的输入框,它就正常都修复了,没有进行干预,我也没有给提示。

生成结果,就三个圆环,数据统计非常简单,这个介绍等于没说。

然后我就想说,不行,就跟他讨论一下这种分析应该是有哪些元素?就比如说他需要更详细一点之类的。

这是第一次,我感觉到这个东西好像不太一样,他认真地读了我所有的数据,然后设定了一个非常详细的报告。

然后他就搞定了,因为整个的内容是非常详细的,中间的动作分析呢每一个动作都有。

你想想我训练的时候可能涉及到几十个动作,每一个动作的分析都有。训练科学的介绍和解释也比较详细。

后面我还对这个页面做了很多零碎的修改。

就比如说它原来是 emoji 图标。然后原来的图表没有调用这种正常的折线图或者什么图表,它都是自己写的一个,就是有很多问题。这些修改呢最后都完成了。

不过上下文我看已经到了百分之七八十了,我就心想这是不是见好就收就这样了。

再写的话,一般来说这种 Agent 这个时候它可能就要报错或者是遗忘上下文了。

但是心想反正都是了,他现在都写这么好了,我就直接让他做一做试试呗。

于是就让他把这个改成一个真正的产品,可以接受任何人的数据以及设置,进行分析。

我就看到他开始压缩上下文,压缩完上下文以后,他就开始正式地进行这个完整产品的迭代。

最后在运行的时候,经过几次 debug,完全是他自己进行的。它启动自带的浏览器,发现控制台有报错,然后自己去修复;经过一段时间的修复,终于搞定,所有功能都 OK。

-------------------------------------------------------------

来看一下这个产品最后的结果:

你首先是填写自己的基本信息,然后上传那个 CSV 表格。
之后的话填写你自己的 Gemini API,这个也是免费的。
再之后的话,它会去等待 Gemini 的分析。
最后的话分析结束是三个部分:
第一部分就是总览,你训练的怎么样。
第二部分是训练科学,就是你现在的 AI 给你的建议。
第三部分是每个动作的动作数据,然后动作的要点以及这个动作重要性,以及当前你现在的进度。

在之后的话,我看到它右上角有个部署,我就部署了一下,然后部署上去以后发现是需要连接那个 vercel 的。

然后上去之后发现它是 404 了,由于我也没有用过 vercel,所以说我也不知道它应该是什么问题。然后我看了那个 log 页面,我没有看,我也没有看出问题来。

于是我就 404 截图,还有 Vercel 那个平台的 log 页面截图发给他了。然后让他分析,没想到他真找到了问题,然后也修复了,修复了以后上传上去就好了。

而且他找到的问题和开发者朋友发现的问题是差不多的。

-----------------------------------------------------------------

整体下来最震惊我的是它的规划能力和多次修改的稳定性。

包括应该输入什么内容、每个部分的内容分析是什么样的,以及交互体验应该是什么样的,我都没有给他细说。
以前作为 Vibe coding,为了避免 AI 模型自己发挥或者报错,我们都要说得很细,但这次我故意什么都没说。

每次都是想到什么了,或者报错了,我才开始改,或者让他说。

但是它像信息的填写表单有哪些内容,包括中间 AI 去分析的时候,等待页面他都考虑到了。
63