即刻App年轻人的同好社区
下载
App内打开
甲木未来派
109关注702被关注0夸夸
👀 ENFJ | LangGPT | Prompt
🤖《智能体设计指南》作者
在AI世界中,虚心求教,交个朋友
👉公众号:甲木未来派
甲木未来派
19:33
为什么在上海打车很少有体验好的时候……

而且还有一种“老克勒”式的“傲娇”?
佛了
00
甲木未来派
4天前
10 个让 Multi-Agent 系统更稳健的实操建议

看完一泽关于“有效的 Context 工程”的分享后,里面提到了关于Multi-Agent,然后跟朋友Ivan聊了一些关于Agent实践的讨论,几点建议分享给大家,欢迎大家指点、补充。

1、简化为王,先稳再多
很多场景下,一个“单Agent + 工具链 (RAG/Tools)”的架构,已经能高效地解决绝大多数问题。先从最简单的架构开始,验证其核心价值。确认可靠并且业务实在需要后再拆分为多智能体协作。

2、Prompt 优先
系统的效果差,根源往往不在于架构,而在于每个 Agent Prompt 本身设计不足。先把每个 Agent Prompt 优化到最小可行高效,再考虑扩展。

3、契约式交互,控制输出,不控过程
为每个 Agent 规定固定的输入/输出结构(schema),关注最终产物一致性,而非中间推理细节。在 Agent 间使用统一的格式(如 JSON、YAML 或模板化文本)传递信息,防止语义漂移。

4、引入Router Agent,实现路由与规划
Router Agent引入,进行统一调度:规划、拆解,重构等等,智能模型路由再选择轻量级或者重量级模型。

5、逐个升级,不全量替换;灰度测试 + 输出漂移监控
- 一次只更新一个 Agent;使用 shadow 模式对比新旧版本输出差异,避免系统级崩溃。
- 小流量灰度验证新模型;对比输出语义相似度,防止迭代后质量下降。
(通过 embedding 语义相似度 + 结构一致性校验实现自动监控,再结合人工抽样与 LLM 评估闭环)

6、建立“观察者” Observer Agent
设置监控 Agent 评估系统整体输出质量、异常率、任务成功率,触发告警或回滚。

7、共享记忆中心,打破信息孤岛
让所有 Agent 共用同一Memory Store(如向量数据库),避免信息割裂或记忆污染。

8、日志与回放机制
保存每个节点输入输出,支持 replay diff 检查,快速定位问题节点。

9、冻结核心节点,松绑边缘节点
关键逻辑节点保持稳定版本;辅助 Agent 可灵活替换或动态加载。核心节点要包括“对抗性测试”和“边界情况”

10、Human-in-the-Loop
人类的纠偏、确认和监督是系统安全的最后一道防线。

多智能体复杂度高,调试成本高,维护成本指数增加,非必要真是无需搞…

欢迎大家补充更多心得!
02
甲木未来派
10天前
这两天一直在看吴恩达和Andrej Karpathy两位大佬新出的教程,很有收获,推荐给大家。

- 吴恩达推出了全新的《Agentic AI》课程,教我们如何构建能够思考、规划并行动的智能体;
- AK在前天开源了“nanochat”项目,让我们能以极低的成本,从零开始复现一个微缩版的ChatGPT。

这两者结合来看,非常有意思,恰好是AI学习的两个核心方向:
一是向上走,聚焦应用,将AI作为强大工具,构建解决实际问题的复杂系统;
二是向下探,深入原理,亲手搭建大模型,彻底理解其背后的魔法。

先说 Agentic AI,它代表了一种构建软件的全新方式,利用 LLM 完成复杂任务中的部分或全部步骤。核心是 四大“Agentic”设计模式:
- Reflection:让 Agent 自我复盘、迭代改进;
- Tool Use:让 LLM 会调工具;
- Planning:把复杂任务拆成可执行子任务并动态调整;
- Multi-Agent:像公司分工一样组织多个专长 Agent 协同完成复杂工作。
这门课程不依赖任何特定框架,用纯Python代码从零开始实现每个模式。
🔗 www.deeplearning.ai

再来看 nanochat,AK佬一直以其“从零复现”的教学风格而闻名,这次发布的从零构建 LLM 训练和推理的项目也不例外。
nanochat 用大约八千行代码把训练与推理的全链路拼成闭环:
分词 → 预训练 → 中期训练 → SFT → 评测 →(可选)RL → 推理引擎 + WebUI,全都打包在一个尽量极简、可读、可 hack 的代码库里。

基本上跟着操作完成就可以链接LLM训练的所有步骤了。。你可以在云端开一台 8×H100 机器,几小时后就能和自己的小模型对话,写诗讲故事,做基础题。
项目🔗:github.com
项目Guidebook:github.com/discussions/1

AI时代,既要能驾驭它解决问题的“术”,也要能理解它运行逻辑的“道”。
等你做出第一个可用的 Agent、跑完第一份 report card,
你会发现:
AI 不再神秘,它只是你的新生产力。
03
甲木未来派
15天前
“AI的输出很容易对使用者产生强大的“锚定效应”。

当AI迅速生成一个“看起来还不错”的答案或框架时,我们的思维就会被这个初始方案“锚定”,后续的思考和创造便很难再大幅偏离,从而在群体层面导致了思想的收敛。”
10
甲木未来派
15天前
终于复工了,这个假期AI新闻不断,最重磅的当属OpenAI的Sora 2发布,以及OpenAI DevDay发布会的内容,关于S2模型,我玩了好几天,整了一堆活..

节后第一天,写了Sora2的各种玩法,之后几天找思路和方法的时候,刷到 Lovart的官推,发现已经接入了S2模型,塞进了我们最熟悉的工作台,并给所有用户免费用 5 天!

详细测评🔗:mp.weixin.qq.com

Lovart上边集成Seedream 4/NanoBanana 各种SOTA模型,通过Image和Video的强强联合,打通了 “顶级视觉生成 → 无缝动态演绎”的路径。这意味着,我们用 Image 精心调教出的绝美画风、光影氛围和主体角色,现在可以无缝“遗传”到 S2 Video模型生成的视频里,实现风格的高度统一。

实现路径,列了一个TodoList,这也正是 Lovart 的标准Agent能力,协同完成从创意发想、脚本规划、风格设定,到视觉产出与多模态交付。

过去,我们常常将“创造者”与漫长的技能学习曲线联系在一起,

数年的绘画训练,复杂的剪辑软件,高昂的设备成本。这道无形的墙,将无数有故事、有创意的人挡在了门外。

而现在,这堵墙正在被AI一点点消解,Lovart 做的,就是把你脑子中的创意,以极其简单的方式帮你实现。

你的每一次思考,都可能是一个精彩故事的序章。

我们即将迎来富足时代!
02
甲木未来派
1月前
KISS四步复盘法,一步一景。
——
Keep,是第一声鼓点,提醒你“值得坚持”;
Improve,是第二声撞击,叫你“别怕暴露问题”;
Start,是第三声升调,推你“勇敢迈新步”;
Stop,是收束,是洒脱,是给自己“留白”。
——
00
甲木未来派
1月前
豆包Seedream4.0这波确实长脸,

在这波多图融合,组合生图和图像编辑方面表现大幅提升,主体一致性也得到极大增强。

实测了十几个日常&企业场景Case,

🔗mp.weixin.qq.com

4K超高清生图,就能在工业级应用场景做点事情了,中文效果很赞~

不过有一说一,复杂场景语义理解能力感觉还有待提升,另外就是对敏感词审核有点过于严格……🤔
01
甲木未来派
1月前
最近一直在玩AI绘画,NanoBanana和Seedream4.0都耍了一下。
很多人问我选哪个,其实这个问题本身就有问题。
我们总是习惯性地想要一个标准答案,好像世界上的事情都能简单地分出个高下。

但用了几天发现,这两个模型更像是两种不同的思维方式。
详细测评🔗:mp.weixin.qq.com

NanoBanana像个很有想法的设计师,你跟它聊天,它能理解你想要什么,然后给你各种变化。做IP角色特别厉害,画一百张图都能保持同一个人的特征,一致性做的很到位。

Seedream4.0更像个技术控,画质好是真的加分项,4K分辨率不是开玩笑的,放大看细节都清晰得可怕。而且它懂中文,真的懂。你让它写"深夜食堂"四个字,它就老老实实写出来,不会给你整成奇怪的符号。

我花了很长时间测试各种场景,从手办到海报,从动物到抽象概念。慢慢发现一个有趣的现象:

我们对工具的期待,其实反映了我们对创作的理解。

有些人喜欢NanoBanana,因为它给了更多控制权。你可以不断调整,不断迭代。有些人偏爱Seedream4.0,因为它能直接给出高质量的结果,省去了很多后期处理的麻烦。

工具从来不是重点,重点是你想表达什么。

想法本身,才是最珍贵的东西。
02
甲木未来派
1月前
"难怪大家一直都在说「相信人民的力量」,却鲜少会提「相信人民的智慧」。"
11
甲木未来派
2月前
「🤖9.13,周六,北京,来面基!」

今年的PEC大会又来了,

一年的时间过去了,很多东‮又西‬发生了新的变化,

2025年,春‮期节‬间,DeepSeek横空出世,掀起了国内一波AI新浪潮,再到Manus为‮表代‬的泛智‮体能‬应用,Prompt到Context的范‮转式‬变,Cursor、Lovart等垂直领域‮能智‬体层出不穷,GPT5发布,NanoBanana多模态图像生成,国务院下‮人发‬工智能行动+的文件,等等等等。

这一年,究竟AI领域‮发都‬生了‮么怎‬样的变化?

在AGI前夜:是模‮吞型‬噬一切,还是应用为王?
面对AI,我们‮样这‬的个体又‮面该‬临怎么样‮选的‬择?

一个‮糊模‬的未来,会引来一千条‮豫犹‬的岔路;
而一个清‮的晰‬终局,本身就蕴含‮走着‬向它‮唯的‬一路径。

希望,这‮次一‬的大会,能够解答一部‮问分‬题。

很久没有‮社跟‬区的朋友们见‮面见‬了,这次LangGPT依旧负责其中‮个一‬分论坛,江树和甲木也‮着等‬跟大家一起聊聊Prompt、谈谈Agent,跟大家线‮面下‬基,共话AI。

为了提供一‮更个‬全面‮沿前‬的视角,我们邀‮了请‬来自‮业产‬界、开源社区、创业者等 AI 一线的‮道布‬者、实践‮来者‬线下共谈上‮文下‬工程和 AI 落地的‮验经‬分享。相信大‮也家‬听过、看过他们‮内的‬容。

他‮分们‬别是:@数字生命卡兹克 @西琦AJ @歸藏 @葬花达人鲁智深 @向阳乔木 @小七姐 、凯寓、@启师傅今天逛动物园了吗 、海旭、@景淮Maple 等AI布道者、实践者、探索者,江‮和树‬甲木,也会‮现在‬场和‮家大‬分享 AI 落地应用实‮和践‬思考。

欢‮大迎‬家扫描下‮二方‬维码报名活动~
00