即刻App年轻人的同好社区
下载
App内打开
歸藏
557关注21k被关注44夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
12:55
Dia 浏览器开启 History 总结之后

你可以定期让他总结你过去一周的浏览数据然后进行分析

这个很好玩,当然你看片的数据也会在里面
106
歸藏
12:32
这个好,这老哥把所有 FLUX 和 Wan 模型的文章内容都放在 NotebookML

这样你就能随时向 AI 询问这两个模型的信息

感觉其他领域也能效仿,甚至你可以把你整理的数据进行销售

链接:notebooklm.google.com

notebooklm.google.com
22
歸藏
12:23
Veo 3 结束了测试阶段,面向全球所有谷歌用户发布了

如果你之前因为账号原因不能使用的话,现在可以试试
22
歸藏
1天前
Lovart 的国内版本星流 Agent 今天上线了!

除了一堆能力升级之外,中文支持也更加友好,还上线了一致性无敌的 FLUX Kontext 模型

价格也是相当划算,首月五折,无需邀请:xingliu.art/

分享一下我专门为设计 Agents 探索的提示词和使用介绍🧵

专门为这种批量设计 Agent 写的一些提示词:

国风 Q 版恐怖塔罗牌海报生成
国风戏曲 MBTI 海报生成
如何用星流 Agent 生成一整套品牌 VI 设计
如何使用星流 Agent FLUX Kontext 模型
批量生产耄耋表情包
批量根据产品介绍生成 UI 设计图标
一键生产爆款伪记录类型的视频

先来广受好评的 Q 版国风戏曲塔罗牌设计。

这个提示词除了考察模型对于画风一致性的表现,也可能考量模型对于世界知识的理解,他需要了解每张塔罗牌的意义,然后找到对应的戏曲场景,再将场景还原出来。

我还把他从塔罗牌变成了MBTI 卡片。

风格也变成了非常具有设计感的极简插画版本,整体色调更加明亮,而且排版更加一致。
每张海报下面还有对应的塔罗牌的一句话介绍。

我这里虚构了一个叫“酥月记”的月饼品牌,准备看看能不能通过跟星流 Agent 的沟通产出一套可用的 VI 物料和 logo 设计。

我先是给他简单的设计需求和品牌理念,要求他生产多个 logo 的设计稿,我进行挑选。

之后他给了一个半月的版本,这个寓意不太好,我就让调整成满月,然后搞定了,非常完美了合适的一个 logo。
现在我们需要一些 VI 物料的设计,所以我就跟他说设计一些物料延展。
他完全根据品牌的主营业务判断了需要的物料类型,还有月饼包装和包装纸的设计,这太强了,以前真得会渲染才能搞。

然后这次星流 Agent 也支持了FLUX Kontext 这个一致性最强的模型。
比如我前几天买了一个小米 AI 眼镜,给他拍了张展示图,但是由于我桌子太小以及打光的原因,我对他不太满意。
这时候我就直接把原图拖到星流的无限画布,然后输入提示词。
只能说不愧是一致性保持最好的模型,眼睛后面的字和细节都还在,甚至原来都看不太清的指示灯也在,但是整个画面结构和光线明显变好了。

然后是传统艺能表情包生成怎么能少的了呢,最近最火的表情包系列就是那个圆头猫咪耄耋了。
我就找了一些比较火的耄耋表情包上传之后看看能不能给他们高清化并且换一种表现形式,还得保留那个贱贱的感觉。
先上传几张耄耋(猫爹)表情包截图,然后输入提示词。
可以说非常传神了,尤其是那个“呆住”的表情,太像了 哈哈哈哈。

在生成 UI 设计需要的素材比如图标插画上也非常好用,这里分享一下我探索的提示词,把这个提示词和你产品的描述一起给到 星流 Agent 他就会帮你生成非常契合主题的类 Airbnb 3D 写实图标。
这里我把提示词和我写的星流 Agent 介绍给他,可以看到生成的图标常符合星流 Agent 的定位。

最后就是 Lovart 时期已经很强但现在更强的视频制作能力了。
现在的星流 Agent 支持直接生成视频的音效以及语音,并且自带唇形同步,原有的配乐能力还在。
这里我为了考察他的智能程度,直接把我总结的最近很火的第一人称伪纪实爆款视频的万能公式发给了他。
然后让他根据这个公式帮我生成一个这样的视频,里面没说提示词也没说主题。
然后他就开始规划每个分镜的内容,他自己发散了一个法老监工自己金字塔的脚本,而且加上了很多现在工作环境中存在的术语,最后生成了视频和语音的提示词。
09
歸藏
2天前
Claude Code 更新这么频繁,昨天更新了 Hooks 功能

Hooks 是用户自定义的 shell 命令,可以在 Claude Code 的代理循环(agent loop)中的不同阶段自动执行。

这样,用户可以更精确地控制 Claude Code 的行为,确保某些操作在特定时刻必定发生。

Hooks 的用途:

在提示(prompt)完成时通过 Slack 等方式发送通知
日志记录和可观测性
自定义权限和审批流程
每次写入后自动运行代码检查(lint)

如何使用 Hooks:

Claude Code 内运行 `/hooks` 命令
选择你希望触发操作的事件类型(比如任务完成、写入后等)。
定义要执行的 shell 命令
00:12
01
歸藏
2天前
bilibili 开源的动漫视频生成模型 AniSora 更新到了 V3

支持一键生成多种风格的动漫视频镜头,包括番剧片段、国创动画、漫画视频改编、VTuber内容、动画PV、鬼畜(MAD)等

项目地址:github.com
01:17
017
歸藏
2天前
Freepik 平台上现在会员可以无限生成图像!

包括Premium+ Pro 订阅用户,这下得充一波了

支持的模型有:Mystic、Google Imagen、Flux、Seedream、Ideogram、Runway References、GPT
00:09
111
歸藏
2天前
Shortcut:一个 Excel Agent

能自动完成大多数 Excel 知识型任务,速度远超人类

感觉财务之类的经常使用表格的人会很需要

在 Excel 世界锦标赛案例中,10 分钟内得分超过 80%,比人类快 10 倍。

Shortcut 拥有接近 Excel 的全部功能,包括直接编辑、导入和导出文件。

这里尝试,需要邀请码:www.tryshortcut.ai
416
歸藏
2天前
Dia 浏览器的侧边栏终于来了

这周向早起体验用户推出,下周全量
105
歸藏
3天前
这周藏师傅呕心沥血的大活来了!

Gemini CLI 不写代码帮普通人提效的的一万种用法!

从这个文章的用法可以一撇未来的 AI 操作系统。

太长了,即刻没办法施工了,直接公众号看吧:mp.weixin.qq.com

来看一下我会教你用 Gemini CLI 实现哪些能力:

- 如何低门槛两步用上 Gemini CLI
- 查找和批量编辑本地文档
- 分析你的 Obsidian 笔记库,将相关的笔记链接起来
- 分析本地图片内容批量修改文件名,给图片打标
- 批量修改系统设置,创建你的工作模式一键开关
- 为本地文档生成效果丰富美观的 PPT
- 帮你剪辑和处理本地视频,加水印、转 gif、加音乐。。。
- 帮你快速批量下载 youtube 等网站视频和封面
- 帮你处理图片,加滤镜、加水印、改大小。。。
- 帮你实现不同文档格式的互转,Markdown 转 Word。。。

主要思路是用 Gemini CLI 控制这些已经非常成熟的命令行项目,基本上你所有的需求都能找到对应的项目。

不是只有 MCP 才能做 Agent,这些传统工具在有了 LLM 加持之后会更加强大。

看到这里,你可能会突然意识到:原来那些让我们望而却步的专业工具,其实一直都在那里等着我们。

史蒂夫·乔布斯说过的一句话:"技术应该是隐形的。" 今天的 Gemini CLI,正是让那些强大的命令行工具变得"隐形"——你不需要理解它们的工作原理,只需要说出你的需求。
48