即刻App年轻人的同好社区
下载
App内打开
甲木未来派
104关注682被关注0夸夸
👀 ENFJ | LangGPT | Prompt
🤖《智能体设计指南》作者
在AI世界中,虚心求教,交个朋友
👉公众号:甲木未来派
甲木未来派
1天前
在生成AI视频的时候,往往我们会遇到有一小段瑕疵,就要把整个片段重新roll的痛苦,
本来就是简单编辑一下的事儿,还得去其它视频剪辑软件上把这些东西关联起来,我们能不能直接P AI视频呢?纳米推出了个智能体「纳米P视频智能体」,专门解决这类问题。
测试🔗mp.weixin.qq.com

它在AI生成器里内置了一个便捷的剪辑功能,能够一键P视频,主打一个“生成就可以剪辑”!很实用。

在电商场景,动漫人物转绘,打造数字人,多角色短剧等等,当然,目前还有一些值得优化的地方,比如使用体验的流畅度等等,希望能做的更好一点。

我们还可以用兵马俑来搞个超级MV,贼有传播效果。。

确实是降低了AI工具的使用门槛,关键是「一键操作」是确实省心…
(ps.结果当然也得roll,只不过可以微调整一下了)
01:00
02
甲木未来派
3天前
woc,元宝还真开放视频号和公众号评论了,
这下彻底好玩了,终于在微信生态里面进行场景落地了。
1、测试了几个场景,完整🔗:mp.weixin.qq.com

2、「用户可以在任何视频的评论区,通过@元宝并提出自己的问题,元宝便会“观看”并理解整个视频的内容,然后生成精准的摘要或针对性回答,直接回复在评论区」

3、复杂知识视频解读汇总、网上冲浪一秒get槽点、治疗信息焦虑、各种生活小帮手、感你所感,爱你所爱,各种场景。
不管你何时叫它,它永远都在那里等你。

4、操作路径,只需要把元宝添加为好友,然后在视频号的评论框里输入“@”,在列表中找到并选择“元宝”,输入问题即可~

5、不仅视频号,公众号同样也支持了✊

这个看似简单的“@”功能,背后其实在悄悄改变我们和信息打交道的方式。

在过去,我们是信息的“听众”。
面对一个视频,我们只能按照创作者设定的节奏,从第一秒到最后一秒,被动、线性地接收所有信息,无论其中有多少是我们不需要的。

而现在,我们成了“提问者”,可以带着问题,直奔主题,按需索取我们最关心的那部分知识。

不仅如此,当我们看到感动的,喜人的,伤感的视频,
总有一个ta在那里,等待着你的召唤。
元宝与视频号的这次结合,正是AI技术“飞入寻常百姓家”的又一个绝佳范例。
毕竟,技术的意义,

终究是为人服务。
01
甲木未来派
5天前
Lovart的🍌🍌免费活动还在继续,爽玩了两天之后,感觉强强联合之后效果很棒~
————
1、NanoBanana将图像生成、理解与编辑纳入同一多模态上下文里执行,每一步都“看得到”之前生成的图像与文本,从而可以在风格、构图和语义上保持连续一致。
2、Lovart的智能画布加上Agent设计结合,能实现更强的上下文理解与任务执行。
————
分享几种玩法抛砖引玉~

这根“香蕉”还是得在Lovart吃,Nanobanana的N种神仙玩法!

00
甲木未来派
6天前
「由此开启」的图书设计真的是爱了,鬼知道我每次拆书外边透明膜的时候有多费劲…
00
甲木未来派
10天前
不儿??PixVerse也太卷了,这个光影质感、镜头运动和人物一致性,属实有点东西,
这个短片儿就是由「拍我AI」V5 全新模型生成的~ 不得不说,狠狠期待住了。

现在PixVerse的全球用户已经正式突破1亿大关!从一个想法到服务一亿人,在多模态产品领域极其能打。

我觉得PixVerse总是能找准用户的痛点,提供海量模板,减少用户提示词焦虑,直接拿到结果~
AI创作的时代,每个人都能成为自己生活的导演。
大家可以去「拍我AI」试试,创造独属于你的专属大片!

#AIGC创作大赛·夏日
01:27
00
甲木未来派
15天前
这种风格确实比较舒服,到时候再加上一些Icon库,效果应该会更好🤔
00
甲木未来派
16天前
「用AI三步搞定专业排版」
排版类的Prompt真的是刚需🤔,昨天发的Deepseek文章很多小伙伴们被里面的AI杂志排版设计吸引了,
今天直接把Prompt分享出来,帮助大家进行文字排版,有好看的极简杂志风,搭配刚哥的Unix哲学效果很赞~

用 AI 三步搞定专业排版:从Prompt到代码,一键生成惊艳杂志风

02
甲木未来派
22天前
OpenAI发布适配GPT-5的Prompt自动优化工具

自从GPT-5发布以来,其实Prompt的编写和构建也有一些微调整,

官网之前也出过一份cookbook:cookbook.openai.com

但是这里面的最佳实践有些更偏向于工程化,所以他们官方有人做了prompt自动化工具,我们就不用死记硬背一些「最佳实践」了。

Optimize for GPT-5🔗:platform.openai.com

关于Optimize的报告说明🔗:cookbook.openai.com

它会把你的prompt根据GPT-5的特性进行调整,评论区置顶我放了我的“私董会专家”的适配于GPT-5,它给出的建议和最终效果。

Edwin用一个编程case优化之后,运行时间缩短,稳健性提高,
而在金融问题解答层面,基准线评分也提升了很多,大家可以拿自己过往的prompt去试试~

另外,也总结Pietro Schirano关于GPT-5 Prompt使用指南:
一、核心理念转变
GPT-5对指令的结构、风格和语气更为敏感。这意味着我们需要改变与AI对话的方式,从“随意聊天”转向更加结构化的交流。

二、基础原则
1. 明确你的沟通风格
GPT-5会强烈适应你建立的沟通风格,关键是「保持一致性」
2. 让AI先思考再行动
不要直接抛出问题,而是要求GPT-5先制定计划。比如:
```
在回答之前,请:
1. 将我的请求分解为核心组成部分
2. 识别需要澄清的模糊之处
3. 创建结构化的解决方案
4. 在继续之前验证你的理解
```
3. 使用结构化提示技巧
- 使用"规格说明"格式
- 包含推理和验证步骤(执行前推理、规划、验证和事后审查)

4. 其它平时我们在用的结构化prompt技巧同样适配于GPT-5~

完整版在这里:designs.magicpath.ai

Happy Prompting!
04
甲木未来派
28天前
本来针对GPT-5觉得没啥特别想写的,但毕竟“狼来了”的故事两年多了,现在真来了,还是简单说几句吧。

体验了一上午,先来一句话总结,纯个人观点「场景推理/上下文能力增强,编程能力有效提升,但文本方面感觉反而不如4.5,总体不及预期」

1、GPT-5,大一统模型,把之前的4o,o3,o3-mini等等非推理和推理模型打包在一起,由实时路由器决定用哪个,对于大部分普通用户来说,不用纠结于选择哪个模型了..

2、已经向所有用户开放,打开首页就能看到,GPT-5已是ChatGPT默认;Free能用、Plus更高额度、Pro不限量且能上Pro版思考。

3、一个不错的提升,GPT-5把“幻觉率”压下去了,开放域事实类问题的幻觉显著下降,且更愿意承认“不知道”。同时在回答风格也收敛了:少奉承、少emoji、少空话,多直接、多解释清楚做不到的原因。

4、跑分和各种榜单就不多聊了,结果就是全面屠榜,分数都是第一。但具体效果,还需要使用使用亲身感受一下才知道。

5、当下一些场景的指令遵循度一般,可能我还没太玩转这种「大一统」模型,在Prompt层面需要加点料,要不总会router到小模型,效果不佳。

6、编程是最大赢家,前端生成效果更美、更一致,长仓库定位与修复更准,主流基准SOTAs基本到位,而在服务端应用上,定位问题,上下文精准把控层面做的很到位,还在慢慢测,另外API价格也降下来了,更佳亲民一点。

7、文章写作,文本层面自己测试感觉不及预期,文字优美度不如4.1和4.5,还在慢慢摸索它的方式…

8、多模态能力的提升体感也不太明显

9、人设回复逻辑上,OpenAI还推出了四种新的人格预设,你可以在“愤世嫉俗者”、“机器人”、“倾听者”和“书呆子”之间切换,省得自己费劲写提示词了。

10、这次GPT5发布,在X上热度并不高,但是反观国内,某些媒体的爆炸标题党,什么「王者降临」「登月时刻」,还有早期的「xx被吓得眩晕瘫坐」,真是离谱到家了,好歹那么大体量的媒体,真就瞎XX吹。

GPT-5把“模型选择”这道用户题收走了,同时也把我们对于AI能力代际提升的期望收走了。
但当下AI其实已经足够解决现实问题了,拼落地,拼应用场景。
技术,最终还是要落到为「人」服务上。

—— 8.8号 12:00
10
甲木未来派
1月前
昨天晚上去360做客老周的直播间,聊了聊纳米多智能体蜂群升级,很有趣,简单记录一下。
(跟Koji@杨远骋Koji 和狗哥@一起围观纳米发布hh)

这次是Agent的一个迭代,在过往的多智能体协同的时候,经常会遇到信息传递与参数共享、上下文管理这几个问题,包括随着调用工具越多成功率就越低的这种现象。

纳米搞了个「蜂群协作框架」来解决这个问题,由中央指挥智能体或调度模块来负责拆解任务并安排给最适合的专家智能体,信息共享上通过“拉群”的形式来共享Context,还引入了多层嵌套和同步机制,解决这类问题;

最典型的一个案例case就是「一句话生成大片」,一次性生成3-10分钟的视频最大的难度在于一致性的保持和上下文的管理,涉及到任务规划-拆解-Agent之间的协同,再加上落地结果整合输出。

而从实测结果来说,一次性生成几分钟视频的成功率和稳定性还是提升了很多,不过也有待提升的地方,比如一致性的保持以及画质相关问题。

期间有一个观点是老周和大家都比较赞同的,就是「通用智能体」这个概念其实不太存在,或者说从大家已知的“什么都能做”,这是一种直观的通用性,很难实现;

而另外一个维度上来说,这里也引入腾讯研究院朋友的观点,所谓「通用」其实是面向人群的广泛普适性,
它的适用场景虽然不复杂,但受众面很广,比如找材料写研报、问答等日常需求,大多数上网用户都能使用,这种就是“通用”的。

大多数人其实很难像汗青老师那样拥有极强的美感和设计能力,再加上AI的赋能,对剧本、生图、图转视频等各个流程的熟稔于心,要求的门槛很高,这也是专业设计师的独特性

纳米的多智能体协作,把制作视频的成本无限拉低,通过意图理解、剧本创作大师、分镜脚本、剪辑、配音等等单个智能体协同搞起来,再加上一些循环模组,就能完成一个对普通人相对复杂的任务实现,在日常生活中来使用。

「降低使用门槛」是AI技术在推广全民过程中的必经之路。
12