即刻App年轻人的同好社区
下载
App内打开
甲木未来派
112关注719被关注0夸夸
👀 ENFJ | LangGPT | Prompt
🤖《智能体设计指南》作者
在AI世界中,虚心求教,交个朋友
👉公众号:甲木未来派
甲木未来派
2天前
Grok参加“英雄联盟2026赛事”?

这个话题度确实拉满了,建议每个AI模型走一个分路。
00
甲木未来派
2天前
迟到的Nano Banana Pro的评测,不得不说,审美能力、模型理解又上了一个台阶,再搭配上Agent规划,批量直出,效果效率拉满了🤔🤔

更多Case场景mp.weixin.qq.com
11
甲木未来派
10天前
上周末白宫蛐蛐阿里,今天千问App正式公测,实测了10+个场景,用户体验上好上很多,界面变得简洁了不少,这波,很不阿里..

作为企业本地化首选模型,qwen系列模型在开源路上开枝散叶,

惟愿国产AI越走越远~

让白宫“破防”的阿里千问,我替你们测了...

00
甲木未来派
10天前
(挠头)
10
甲木未来派
14天前
字节也下场卷AI编程模型了,AI Coding是不是「兵家必争之地」?
推出的CodingPlan计划还是性价比蛮高的🤔🤔

字节终于下场卷AI编程了!一手实测豆包Code模型,9.9包月?

00
甲木未来派
21天前
我用两个小时复刻了王老吉风格的「青岛白啤」广告片…

这两天拆解了一下汤臣倍健那个“南极”AI广告,发现他们是用 TapNow 来实现的,还有实现路径和思路,体验了几个小时,搓出来了个小片子,说下感受:

1、一款 AI 产品,最重要的是尽可能降低用户的使用门槛,包括界面的引导,是否能够快速给用户反馈,以及提供一些实用的思路和角度。目前他们把所有的工作流进行了开源,打造了一个开源的创作者生态,能够很好地复刻其他成熟的 AI 视频,我觉得这个思路比较好。

2、我认为TapNow有几个比较有趣的功能,比如一键拉片、分镜镜头管理节点等,这些功能模块对于没有设计&导演基础的人非常友好…

3、开源生态,TapNow 把“南极”大片这个项目的「全部创作画布」都开源了,而且在他们官网的 TapTV 上(app.tapnow.ai),把每个片子导演的每一个分镜、每一条 Prompt、每一次修改尝试,都摊开来给到用户去学习,视频创作者开源生态很不错。

4、在使用过程中,如果没有思路,也可以上传一个已经验证过的成熟电影片段,或者是当下的一些 TVC 影片,直接上传后,平台会针对你上传的镜头逐帧分析,生成多个镜头语言和镜头脚本。通过 AI 的方式帮助你生成每一个片段,提供 TVC 样式或宣传片等各种思路和想法,供你复刻参考。
你需要做的是,把你自己的产品和相关内容上传到平台,供平台进行参考和选择。
在选择模型时,可以根据需求使用SOTA模型、NanoBanana、Veo3.1、可灵、即梦等不同模型。

5、没搞过TVC的人也能这种方式复刻出一个青岛白啤的广告宣传片。比如我,详细的步骤都放在mp.weixin.qq.com

我用两个小时复刻了王老吉风格的「青岛白啤」广告片,分享给大家。

工作流也开源了:app.tapnow.ai

「开盒即用」是AI产品面向C端用户的第一要义…
00:59
22
甲木未来派
27天前
分享一个用 AI 来梳理自己的思路、方法论,并且提炼重构成一个关键词的场景。

🔗 mp.weixin.qq.com

这个需求点来源于自身,我在一些公开场合进行分享或者是企业做AI内训的时候,有时候会觉得自己讲的东西干货满满(emm自吹一下),但听众听完后,好像总缺少一个能“拎得走”的记忆点,或者一个有足够说服力的“框架”。

比如你分享了一个“内容创作SOP”,逻辑严密,但在团队里推行时,大家经常记不住流程。

缺少一个锚点,

我们过往所有的认知、经验和思路,就像是“原矿”,它有价值,但太零散、太原始,我们不会轻易表达出来。

这时候,该怎么办?直到前阵子,我想起之前老秦的一篇文章里面,课程设计方法论和他写的一篇推文,给了我一个极大的启发:模型框架很重要。

IDEART框架,每一个字母对应一个词汇,每一个词汇对应他们的方法论,串联起来,既能代表他们公司的形象,又能形成记忆锚点。
我们熟知的SMART原则、GROW模型;AIDA模型等等都是如此。

可问题是,提炼框架太难了。

它需要深厚的功力、敏锐的洞察和高度的凝练。“提炼”、“凝练”?这不正是AI最擅长的工作吗?

所以写了个prompt,专门处理这个事,就叫「概念铸造师 & 传播抓手」吧..
04
甲木未来派
1月前
为什么在上海打车很少有体验好的时候……

而且还有一种“老克勒”式的“傲娇”?
佛了
00
甲木未来派
1月前
10 个让 Multi-Agent 系统更稳健的实操建议

看完一泽关于“有效的 Context 工程”的分享后,里面提到了关于Multi-Agent,然后跟朋友Ivan聊了一些关于Agent实践的讨论,几点建议分享给大家,欢迎大家指点、补充。

1、简化为王,先稳再多
很多场景下,一个“单Agent + 工具链 (RAG/Tools)”的架构,已经能高效地解决绝大多数问题。先从最简单的架构开始,验证其核心价值。确认可靠并且业务实在需要后再拆分为多智能体协作。

2、Prompt 优先
系统的效果差,根源往往不在于架构,而在于每个 Agent Prompt 本身设计不足。先把每个 Agent Prompt 优化到最小可行高效,再考虑扩展。

3、契约式交互,控制输出,不控过程
为每个 Agent 规定固定的输入/输出结构(schema),关注最终产物一致性,而非中间推理细节。在 Agent 间使用统一的格式(如 JSON、YAML 或模板化文本)传递信息,防止语义漂移。

4、引入Router Agent,实现路由与规划
Router Agent引入,进行统一调度:规划、拆解,重构等等,智能模型路由再选择轻量级或者重量级模型。

5、逐个升级,不全量替换;灰度测试 + 输出漂移监控
- 一次只更新一个 Agent;使用 shadow 模式对比新旧版本输出差异,避免系统级崩溃。
- 小流量灰度验证新模型;对比输出语义相似度,防止迭代后质量下降。
(通过 embedding 语义相似度 + 结构一致性校验实现自动监控,再结合人工抽样与 LLM 评估闭环)

6、建立“观察者” Observer Agent
设置监控 Agent 评估系统整体输出质量、异常率、任务成功率,触发告警或回滚。

7、共享记忆中心,打破信息孤岛
让所有 Agent 共用同一Memory Store(如向量数据库),避免信息割裂或记忆污染。

8、日志与回放机制
保存每个节点输入输出,支持 replay diff 检查,快速定位问题节点。

9、冻结核心节点,松绑边缘节点
关键逻辑节点保持稳定版本;辅助 Agent 可灵活替换或动态加载。核心节点要包括“对抗性测试”和“边界情况”

10、Human-in-the-Loop
人类的纠偏、确认和监督是系统安全的最后一道防线。

多智能体复杂度高,调试成本高,维护成本指数增加,非必要真是无需搞…

欢迎大家补充更多心得!
04
甲木未来派
1月前
这两天一直在看吴恩达和Andrej Karpathy两位大佬新出的教程,很有收获,推荐给大家。

- 吴恩达推出了全新的《Agentic AI》课程,教我们如何构建能够思考、规划并行动的智能体;
- AK在前天开源了“nanochat”项目,让我们能以极低的成本,从零开始复现一个微缩版的ChatGPT。

这两者结合来看,非常有意思,恰好是AI学习的两个核心方向:
一是向上走,聚焦应用,将AI作为强大工具,构建解决实际问题的复杂系统;
二是向下探,深入原理,亲手搭建大模型,彻底理解其背后的魔法。

先说 Agentic AI,它代表了一种构建软件的全新方式,利用 LLM 完成复杂任务中的部分或全部步骤。核心是 四大“Agentic”设计模式:
- Reflection:让 Agent 自我复盘、迭代改进;
- Tool Use:让 LLM 会调工具;
- Planning:把复杂任务拆成可执行子任务并动态调整;
- Multi-Agent:像公司分工一样组织多个专长 Agent 协同完成复杂工作。
这门课程不依赖任何特定框架,用纯Python代码从零开始实现每个模式。
🔗 www.deeplearning.ai

再来看 nanochat,AK佬一直以其“从零复现”的教学风格而闻名,这次发布的从零构建 LLM 训练和推理的项目也不例外。
nanochat 用大约八千行代码把训练与推理的全链路拼成闭环:
分词 → 预训练 → 中期训练 → SFT → 评测 →(可选)RL → 推理引擎 + WebUI,全都打包在一个尽量极简、可读、可 hack 的代码库里。

基本上跟着操作完成就可以链接LLM训练的所有步骤了。。你可以在云端开一台 8×H100 机器,几小时后就能和自己的小模型对话,写诗讲故事,做基础题。
项目🔗:github.com
项目Guidebook:github.com/discussions/1

AI时代,既要能驾驭它解决问题的“术”,也要能理解它运行逻辑的“道”。
等你做出第一个可用的 Agent、跑完第一份 report card,
你会发现:
AI 不再神秘,它只是你的新生产力。
03