即刻App年轻人的同好社区
下载
App内打开
歸藏
560关注23k被关注48夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
1天前
用 Lovart&Seedream 4.0 搞了一套超级牛皮的提示词!

可以将任何文案转换为成套的小红书图文,而且可控性极强,你可以调整任何一页的文案

基本上可以说是自媒体图文生成的终极方案了

长文版本在这里:mp.weixin.qq.com

Lovart前天开启了超级优惠活动:

9.10-9.20 Nano Banana 和 Seedream 4.0 模型免费用不扣积分
9.20 前开通基础(Basic)会员的,全年不限量免费用 Seedream4.0 & NanoBanana 两个模型
同时 Veo3 模型全系打三折,Pro+ 会员可灵和 hailuo 模型 20 号以前免费用

最近大家估计都发现了给用户让利才是最好的宣传,哈哈。

我先是找了一个论文大致写了一个提示词,没想到第一个版本的提示词效果就已经非常好了。

提示词:
帮我基于下面论文的介绍调用 seedream4.0 生成多张简洁、现代、扁平化的信息图 3:4卡片,第一张卡片需要有一个醒目的标题和文章主题简短介绍,其他卡片分别介绍论文的每个部分。具体的论文内容为:

来看一下这套图片生成的优势:

每张图片的风格都非常一致,有统一的插画和点缀元素。
第一张图片有非常大的标题和副标题用来吸引点击。
每一部分都有小标题和相对详细的文字解释这一部分的内容。
英文小字生成的非常清晰。

然后就开始调整提示词让他默认生成中文并且表现需要更好。

提示词:帮我基于下面论文的介绍调用 seedream4.0 生成多张简洁、现代、扁平化的中文信息图 3:4卡片,第一张卡片需要有一个醒目的标题和文章主题简短介绍,其他卡片分别介绍论文的每个部分。具体的论文内容为:

可以看到改为中文提示词以后,效果看起来更好了。

依旧有非常丰富且一致的点缀元素和配色,而且配图跟每一页描述内容都相当匹配。

生成有问题如何修改

第一张封面的问题就很大,页面下方全是空白,而且小字部分太小导致很糊看不清怎么办。

这时候我们就可以用 Lovart 的 Magic Canvas 点击页面下方那个评论图标在你想要修改的图片上写上修改需求,然后 Run 就行,可以看到第二张图片明显好了很多,他加了一个图标填充了空白区域。

然后就想能不能用 Lovart 生成对应的古文图片啊

先找了一个中学生课本的常见文言文,周敦颐的爱莲说,没想到改完提示词一次就搞定了。

再说到菊花、牡丹和莲花的对比的时候他甚至自己将画面做了三等分,配合上水墨风格的图像,我要是说这是课文配图估计很多人也信的。

提示词:帮我基于下面中国古文的介绍调用 seedream4.0 生成多张生成中国风传统主题中文 3:4卡片,第一张卡片需要有一个醒目的文章标题和文章主题简短介绍,其他卡片分别介绍文章的每个部分,并且用竖排宋体写上对应的文章内容。具体的论文内容为:

搞定了自己提供内容的图片之后,我就在想 Lovart 本身是有联网搜索和信息整理能力的,那要不要直接给他选题让他自己检索和整理信息之后生成组图,试了一下还真没问题。

我这里让他搜索苏轼的所有信息然后根据不同的人生阶段做成图文卡片介绍他的一生和主要贡献,来看看结果吧朋友们,太顶了。

提示词:帮我调用 seedream4.0,基于‘苏轼生平’生成一套12张的中国风人物传记卡片。第一张是标题和简介。后续卡片请按时间顺序展现他的关键人生节点。风格要求为文人水墨画,并配上相应的简介文字。

最近还有一类内容很火,就是将各种科学家事迹变成仙侠小说的风格视频讲给大家听,热度都很高。

整个图文第一张会定义科学家名字和他的仙侠代称,而且还会有一首押韵的定场诗,后面都是这个科学家生平的各个阶段介绍文案还是以仙侠小说风格的文风。

你还可以让 Lovart 帮你写口播稿,然后加上 TTS 组成一个完整的视频,如果 Lovart 可以单独选择对应的 TTS 就好了,这样可以不用视频模型生成视频,成本非常低。

提示词:
为科学家[奥本海默]调用调用 seedream4.0 生成一套五张的中国风仙侠主题3:4竖版系列图文卡片,用仙侠风格的内容讲述其科学证道之路。”
第一张内容展示的内容为
他/她赋予一个与其最伟大成就相关的仙侠‘仙号’,如‘XX天尊’或‘XX道祖’加上他的名字,比如时空道祖-爱因斯坦。
同时写两句定场诗,需要押韵,比如“力引星河循天律,光分七彩显真形”。
画风使用仙侠游戏风格。,背景融入其科学领域的象征元素,文字使用书法字体。
剩余页面需要加上不同时期的标题以及对应时期的简介,用仙侠小说语气简要介绍当前时期的主要内容,不要过于简练。
画面风格为他进行科学研究时的仙侠化场景,画风使用仙侠游戏风格。

好了今天的教程大概就是这样。

我们可以将内容、风格、文案、主题进行不同程度的混搭整出无限多的玩法,接下来就看你的脑洞了朋友,如果用藏师傅的提示词生成的内容成爆款了,记得回评论区炫耀一下。
314
歸藏
2天前
MiniMax 居然发了一个音乐模型 Music 1.5

试了一下真不错,解决了没有好用的音乐生成 API 的问题

最长生成时间超过了四分钟;
相较于之前的版本在人声、器乐、演奏和歌曲结构上都有优化;
感觉跟 Suno 已经差不多了,而且价格比 Suno 便宜的多,C 端单价一首歌只需要一毛钱;
支持简洁模式,也支持自定义歌词和歌曲结构生成;
支持一些非常小众的民族乐器的生成;
你可以选择 16种风格 × 11种情绪 × 10个场景 这种丰富的组合来生成音乐;

每个生成的音乐放 30 秒,几个测试音乐的提示词分别为:

首先是主流金曲风格,主要考验音乐性与人声质感
夏日都市流行, 活力女声, 轻快鼓点, 浪漫氛围, 关于一场偶遇;
City Pop, 80年代复古合成器, 甜美女声, 律动感, 都市夜晚;

电子与氛围场景,主要考验编曲层次与动态
赛博朋克电子, 机械节奏, 冰冷女声, 霓虹灯下的追逐, 强烈的节奏感;
史诗感, 宏大教堂氛围, 福音合唱, 多声部和声, 管弦乐团。

创意融合与高阶挑战,主要考验语义理解与控制力
国风电子, 古筝与合成器结合, 尺八, 未来都市中的侠客, trap鼓点;
巴洛克风格, Trap音乐, 羽管键琴主奏, 808鼓点, 低沉的男声说唱。
03:00
010
歸藏
2天前
谷歌把他们的端侧模型体验 APP 上架 Google Play

你现在可以直接搜索 Google AI Edge Gallery 安装

里面集成了谷歌所有的 Gemma 端侧模型,支持图像识别、音频对话和正常的文字对话
52
歸藏
2天前
推荐看看,Anthropic 新文章《如何为 Agent 构建工具》

Agent 与传统确定性软件不同,工具的设计要兼顾非确定性行为,不能简单照搬API或函数式开发思路。

建议先快速原型开发并本地测试工具,随后通过与Agent协作生成大量贴近真实场景的评测任务,结合自动化评测和Agent的推理反馈,持续迭代优化。

原则层面:

提出应优先实现高影响力、能覆盖关键工作流的工具,避免无效的“包API”式工具;

通过命名空间(如前缀/后缀)清晰划分工具边界,减少代理混淆;工具返回内容要聚焦高信号上下文,优先自然语言和可读标识符,必要时支持详细/简洁等多种响应格式以兼顾上下游需求;

对于可能产生大量输出的工具,建议分页、过滤、截断并优化默认参数,避免token浪费;错误提示要具体明确,帮助代理自我修正。

工具描述和参数设计要像给新同事写文档一样详尽,消除歧义,输入输出严格定义,持续通过评测微调描述以提升代理调用效果。

详情anthropic.com/engineering/writing-tools-for-agents
017
歸藏
2天前
千问又发模型 Qwen3-Next-80B-A3B

总参数高激活参数低,训练成本低,推理速度快

80B 总参数激活参数 3B,混合架构 Gated DeltaNet + Gated Attention,

稀疏MoE:512 个专家,10 个路由专家 + 1 个共享专家

详情:qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list
00
歸藏
3天前
刚才看到一句古诗,然后就想 Seedream 4.0 这么好的提示词理解和世界知识,这次终于能把古诗词的意境表现出来了吧。

于是就试了一下,一顿探索过后发现,真的可以了!

你只需要更改后面的诗词内容不需要描述画面信息,Seedream 4.0 就会帮你生成符合诗词意境的图片,而且图片上还有诗词原文。

提示词:根据这句诗词内容生成中国风传统主题插画,并且用竖排宋体写上对应的诗句,诗句为:“火冷灯稀霜露下,昏昏雪意云垂野”
1715
歸藏
3天前
即梦刚才宣布从今天(0911) 下午 3 点开始,即梦AI 所有生图模型7天免费畅玩,不限积分随便用。

可以冲了朋友们,这波大家都太卷了,顺便看藏师傅的教程

歸藏: 来了!藏师傅豆包 Seedream 4.0 图像创作模型教程 写了一万字,光里面图像文件就有 300M! 有普通用户能玩起来的玩法,也有完整的产品方案,提前感谢各位的转发 另外火山引擎现在就已经上线了 API,也是所有渠道唯一可以直出 4K 图片的 Seedream 4.0 模型 由于内容实在太多,即刻实在放不下,这里介绍一下案例内容,提示词和教程还是去看长文➡️:https://mp.weixin.qq.com/s/9GzE_n8EvJyYPIp4_3vAmQ 案例一:真正的AI修图 首先是一个体现Seedream 4.0 修改精细度的案例,也是现在独家的能力,他能对我们日常修图美颜涉及到的所有关键词做出响应。 不管是光影、滤镜、装造还是发型,基本上你能想到的名词他都知道,而且这些元素还可以在提示词中随意组合。 案例二:一键为你喜欢的角色生成小剧场视频 Seedream 4.0 在连续生成分镜上的可用程度相当高,生成的图片因为非常清晰对于人脸的表现也很清晰,在连续生成 6 张图之后人脸 ID 还能保持的很好。 我这里让模型虚构了一个凡人修仙传的韩立和紫灵穿越到巴黎谈恋爱的小剧场。 案例三:转换任何大纲变为精致PPT页面 我搞了一套流程可以直接提取你的PPT要点变成非常有质感的思维模型演示PPT页面。 而且生成的图像非常实用,图片左边或者右边会留下为你写字排版的空间,生成的图片符合你的思维模型,比如并列的就会展示玻璃卡片,递进的就会是金字塔,完美兼顾了美观、可控和表意。 案例四:将你的照片变成玻璃质感的头像&图标 这个是想起来苹果要开发布会了 iOS 26 的液态玻璃效果做的,可以将你拍摄的任何照片变成玻璃图标,完全不需要修改提示词,而且模型会自己在下方加上合适的文字,你可以直接发社交媒体炫耀。 案例五:将你的宠物变成你的护身符 现在你可以上传你的宠物头像,然后让模型帮你生成长得很像你的宠物的山海经神兽许愿符了,而且我还让模型将你的宠物照片放在了生成结果上,这样就不用你自己拼图了。 案例六:定制你自己的玄学鼠标垫 搞完上面的宠物许愿符以后我突然看到了自己的桌面,这不是完美的玄学商品载体吗? 于是就搞了提示词讲鼠标垫换成许愿鼠标垫,发出去之后很多朋友希望做成实体,做电商的朋友们靠你们了。 案例七:为自己和偶像制作创意头像 这是我发的第二个 Seedream 4.0 的案例,没想到发出去直接就爆了,小红书一堆参考提示词的人 @ 我,这还没包括没提我名字的。 案例八:无痛 Cos 你喜欢的动漫或游戏角色 Nano Banana 做手办火了一波,一玩图片人人都是二次元, Seedream 4.0 图片可以玩更猛的。 你只需要上传你的照片和想要 Cos 的角色图片就可以无痛 Cos 你喜欢的角色了。 案例九:上传图片自动生成手帐风格日记 由于 Seedream 4.0图像创作模型有一定的世界知识和视觉推理能力,我就在想那是不是我们就可以直接把今天拍的照片给他,让他帮我们记日记呢?探索了一下提示词发现真的可以! 案例十:修改任意UI设计稿或者海报 在图像理解和视觉推理上 Seedream 4.0 模型真的很厉害,基本需要很简单的提示词就可以对复杂的图片做出合适的修改,简单提示词就可以拼好图。 案例十一:最猛的自媒体神器-多风格知识卡片 提示词模板: 生成一张 [格式/载体] 风格的图像,向 [目标受众] 解释/展示 “[可替换的核心概念]”。图像需具备 [风格特征A]、[风格特征B] 和 [排版要求C],整体感觉类似于 [某个熟悉的参照物]。

111
歸藏
3天前
大概解释一下这种现象的原因

CR2、ARW、RW2 这种格式都是相机拍摄的 RAW 格式分支,其中 CR2 是佳能特有的 RAW 格式,还有 CR3。

这些文件名称经常被图片上传到网站时候的各种描述、alt 文本、贴子正文里,然后在被爬取训练数据的时候写到图像对应的标签里面去。

文本编码器在预训练时就学到了“CR2/ARW/RW2=相机RAW=高画质/高动态范围/真实光学特征”的强关联;把这样的标记塞进提示词,会把生成分布推向摄影真实感这一簇,从而提升微细节和光影质感。

“.CR2” 这类在词表中较稀有但语义非常“聚焦”的 token,会成为嵌入空间里的强方向向量,能明显改变注意力分配与条件分布,比如把模型从“插画/绘画”拉向“数码相机 RAW 照片”。

所以理论上我们可以看到,其他类似

IMG_####.CR2 / DSC0####.ARW / P1######.RW2 / _DSF####.RAF / DNG ####,这种格式应该都会起作用。

而且打标细致的话,你可以更换后面的后缀来使得生成的图片具有各种品牌相机的成像效果。

歸藏: fofr 说给 Seedream 4.0 提示词加上 “IMG_2094.CR2”,就会提高图像生成的质量 我做了几次测试,发现在使用 API 的时候,加上这个提示词生成图片的细节丰富度、质感以及美学确实会变好 但注意别在即梦里用这个技巧,因为即梦有自动的提示词优化

02
歸藏
3天前
fofr 说给 Seedream 4.0 提示词加上 “IMG_2094.CR2”,就会提高图像生成的质量

我做了几次测试,发现在使用 API 的时候,加上这个提示词生成图片的细节丰富度、质感以及美学确实会变好

但注意别在即梦里用这个技巧,因为即梦有自动的提示词优化
76
歸藏
3天前
a16z 新文章 AI 改变了消费级软件的营收留存模式

旧模式:为用户流失而设计

AI 时代之前,消费级软件主要有两种盈利模式广告收入和单层级订阅。

这两种模式的共同点是净收入留存率几乎总是低于 100%。因为每年总有一部分用户流失,而留存用户支付的金额不变。

新模式:大扩张时代

用户支出增加:基于使用量的付费模式取代了固定的订阅费。

消费到企业(C2E)的桥梁:用户以前所未有的速度将个人工具带入工作场所,这些工具可以通过公司报销,从而利用企业更大的预算。

实现“大扩张”的三大关键策略

策略一:复杂的定价架构

摒弃单一订阅费,采用混合定价模式,结合价格分层 按使用量计费

核心思想:借鉴游戏行业“鲸鱼用户”的模式,通过多层级订阅和额外的按需购买选项,让收入与用户的参与度同步增长。

具体做法:
设置多个订阅等级(如 Pro, Ultra),根据功能、速度、模型访问权限等进行区分。
在每个等级中包含一定的使用额度(如生成次数、计算单元),超出部分需要用户购买额外的“点数包”(credit packages)。

策略二:搭建消费到企业的桥梁

为产品增加基础的团队协作功能,从而打开企业市场,实现 ARPU 的巨大提升。

核心思想:如今,员工被鼓励在工作中使用 AI 工具。任何有潜在工作用途的产品,都应假设用户会将其引入团队。从对价格敏感的个人用户转向对价格不敏感的企业买家,是巨大的扩张机会。

具体做法:
开发基础的协作功能,如:团队文件夹、共享库、协作画布、身份验证(SSO/SAML)和安全设置。
为个人和团队设定显著的价格差异。甚至可以像 Notion 当年那样,为个人用户提供非常慷慨的免费计划(甚至亏本),以加速用户基数增长,然后通过对协作功能收费来盈利。

策略三:从第一天起就进行企业级投资

消费级公司应尽早(在成立后一到两年内)建立销售能力并开发企业级功能。

核心思想:在 2025 年,等待是致命的。与 Canva(成立近7年后才推出团队版)不同,现在的市场节奏要求快速行动。如果一家公司推迟开发企业功能,竞争对手会迅速抢占市场。

具体做法:
招聘销售负责人:自下而上的用户增长只能走这么远,最终需要专业的销售团队来处理企业采购流程和签订高价值合同。
构建关键企业功能:除了协作功能外,还需要:
安全/隐私:SOC-2 合规、SSO/SAML 支持。
运营/计费:基于角色的访问控制(RBAC)、集中计费。
产品:团队模板、共享主题等。

详情:a16z.com/the-great-expansion-a-new-era-of-consumer-software/
17