即刻App年轻人的同好社区
下载
App内打开
歸藏
561关注24k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
23:51
终于有一个真正意义上的视频 Agent 了!

不再是那种一次生成完全不能修改的,也不是只能做有限品类和风格的

提前试了 Medeo 的新版,支持非常复杂的提示词,可以通过自然语言随意修改

不管是增加内容、删减内容、甚至直接改掉整个脚本,都没问题

这里就用我昨天的 Nano Banana Pro 提示词风格做了讲解《基地》小说世界观的视频
01:47
01
歸藏
16:15
欧洲AI独角兽Mistral最近也是疯狂发力,开源了专门用于编码的 AI 模型 Devstral 2

另外,他们还发布了一个叫 Mistral Vibe 的本地CLI编程工具,支持端到端自动化。

Devstral 2 包含两个模型:Devstral 2(123B)和 Devstral Small 2(24B)。

目前以通过他们的 API 免费使用 Devstral 2,这个好。

Devstral 2 SWE-bench Verified 上的分接近 Deepseek v 3.2 72.2 分。

Mistral Vibe CLI 是由 Devstral 提供支持的开源命令行编码助手。

主要功能有:

自动扫描你的文件结构和 Git 状态以提供相关上下文。

通过 @ 自动补全引用文件,使用 ! 执行 shell 命令,并使用斜杠命令进行配置更改。

理解整个代码库——不仅限于你正在编辑的文件。

持久历史、自动补全和可自定义主题。
02
歸藏
14:19
阿里千问公测才23天,月活用户就突破3000万。

更猛的是,刚宣布完这个数字,就把AI PPT、AI写作、AI文库、AI讲题四项核心功能全部免费开放。试了一次都挺好用的。

AI PPT是真的一站式。一句话、一张图、一份文档都能生成PPT,生成后还能对话修改。传统流程是先用AI生成内容,再复制到PPT软件里排版,来回折腾。千问直接在对话里搞定一切,最后导出成品,这里我搞了一个南极旅行计划 PPT。

AI讲题不只给答案。拍照上传题目,我随便找了个数学题试了一下,会像真人老师一样拆解知识点和考点,一步步讲解题过程。批改整页作业后,还能生成薄弱点诊断和错题深度讲解,形成完整的学习闭环。

AI文库他们说有 5亿级资料免费下载。教育、职场、创作、生活全领域覆盖,学习资料、试卷模板、行业报告、企划方案都有。会自动判断资料类型,试卷课件直接挂载卡片方便下载,知识经验类内容先回答再挂载参考资料。

AI写作是对话即成稿。不用打开Office软件,直接跟千问说需求,自动生成智能排版的Word文档。论文和合同这种对格式有要求的还有几十万份模板可以适配,还有智能编辑器支持局部润色、全文优化、风格调整。

一些看法:

阿里的策略很明确:用最先进的模型,打造会聊天能办事的AI助手。3000万用户只是开始,真正的目标是把千问变成AI时代的超级入口。

千问这波操作,本质上是在抢占AI应用从"能聊"到"能办事"的关键窗口期。

23天3000万用户证明市场需求是真实的。大家已经不满足于AI只会讲冷笑话、生成娱乐视频,而是期待它成为真正的生产力工具。

办公和学习是最高频最刚需的场景,千问选择从这里切入很聪明。免费策略配合强大的模型能力,可以快速建立用户心智和使用习惯。

AI工具的竞争,最终还是会回归到模型能力和场景覆盖上。千问现在同时具备这两个优势,值得持续关注。
53
歸藏
14:10
Nano Banana Pro 这么火 Open AI 坐不住了

消息说他们即将推出 4o 图像模型的升级版代号是栗子和榛子(Chestnut and Hazelnut)

目前正在 Design Arena LM Arena 上进行测试,不过发布时间上有的人说是这周,有的人说需要圣诞节之后。

具体能力有:与 Nano Banana Pro 类似的全球知识,能名人自拍照,文本渲染不错。

但是版权图片这块 Open AI 有前科的,刚开始开放后面就收紧,一点没有谷歌大方。

图片来源 X:marmaduke091
33
歸藏
10:42
很多人说,在Gemini里生成图片文字很模糊

教一下大家怎么解决这个问题,其实很简单

你下载图片的时候,需要点图片右上角的那个下载按钮,而不是直接复制图片。

下面这里就是复制和下载两张图片的分辨率的真实区别。

一个是1K,一个是2K,差别非常大。所以记得在Gemini里生成的图片要点下载按钮下载。
52
歸藏
01:03
当然也可以搞抽象,比如著名的沈阳大街事件

可惜的是 Gemini 不知道虎哥和刀哥长啥样

歸藏: 还能用这种方式制作真实历史事件的海报 可以将你偶像的高光时刻或者人类的高光时刻画出来,对于我们很多人都非常有意义! 改了一下提示词,依然很顶!Nano Banana Pro 确实猛。 比如 2022 梅西夺冠、乔布斯发布 iPhone、ChatGPT 发布 提示词: 请为【SpaceX重型猎鹰双助推器同步着陆】制作一张博物馆级别的3D轴侧微缩海报,先检索相关信息获取知识。 第一步,智能识别与场景构建: 请先调用你的知识库,判断我输入的主题属于哪种类别(是虚构文学、真实历史事件、体育竞技还是科学发现)。 然后,精准检索该主题发生时的具体环境、核心人物动作、服饰细节以及当时的气候氛围。 在画面中央,建立一个精致的3D微缩场景模型。风格上,保持梦工厂动画那种高精度的材质感和柔和的光影渲染。 如果是体育,要强调动作的爆发力和凝固的瞬间感;如果是历史,要还原年代感和严肃性;如果是文学,则强调意境。 第二步,氛围与背景: 背景请摒弃纯白,使用带有极淡水墨纹理和流动光雾的虚空环境,色调根据主题自动调整,营造出一种“历史切片”或“珍贵藏品”的高级感。 第三步,排版与文字: 在底部居中位置生成中文排版。 主标题写上事件或作品的名称,字体设计要契合主题风格。 在标题下方,请自动检索该事件最著名的金句、解说词、日期或历史评价,字体使用优雅的衬线体。整体布局要像一个高级的博物馆藏品铭牌那样精致平衡。

10
歸藏
00:51
还能用这种方式制作真实历史事件的海报

可以将你偶像的高光时刻或者人类的高光时刻画出来,对于我们很多人都非常有意义!

改了一下提示词,依然很顶!Nano Banana Pro 确实猛。

比如 2022 梅西夺冠、乔布斯发布 iPhone、ChatGPT 发布

提示词:

请为【SpaceX重型猎鹰双助推器同步着陆】制作一张博物馆级别的3D轴侧微缩海报,先检索相关信息获取知识。

第一步,智能识别与场景构建: 请先调用你的知识库,判断我输入的主题属于哪种类别(是虚构文学、真实历史事件、体育竞技还是科学发现)。 然后,精准检索该主题发生时的具体环境、核心人物动作、服饰细节以及当时的气候氛围。 在画面中央,建立一个精致的3D微缩场景模型。风格上,保持梦工厂动画那种高精度的材质感和柔和的光影渲染。 如果是体育,要强调动作的爆发力和凝固的瞬间感;如果是历史,要还原年代感和严肃性;如果是文学,则强调意境。

第二步,氛围与背景: 背景请摒弃纯白,使用带有极淡水墨纹理和流动光雾的虚空环境,色调根据主题自动调整,营造出一种“历史切片”或“珍贵藏品”的高级感。

第三步,排版与文字: 在底部居中位置生成中文排版。 主标题写上事件或作品的名称,字体设计要契合主题风格。 在标题下方,请自动检索该事件最著名的金句、解说词、日期或历史评价,字体使用优雅的衬线体。整体布局要像一个高级的博物馆藏品铭牌那样精致平衡。
311
歸藏
2天前
Nano Banana Pro 的美学表现震撼!太顶了

一键生成任何影视剧或者小说的场景海报提示词

优化了一下我的微缩场景模型提示词,增加文案部分的效果以及模型周围的特效

没想到适配性这么好,每个场景、文字效果、模型周遭的特效都非常适配小说或者影视剧

比如剑来小说的经典场景,他自动选的陈平安走出骊珠洞天的片段,周围环绕的雾气以及模型周围的球形遮罩真的很像小世界或者洞天

提示词:

请为影视剧/小说《需要添加的名称》设计一张高品质的3D海报,需要先检索影视剧/小说信息和著名的片段场景。

首先,请利用你的知识库检索这个影视剧/小说的内容,找出一个最具代表性的名场面或核心地点。在画面中央,将这个场景构建为一个精致的轴侧视角3D微缩模型。风格要采用梦工厂动画那种细腻、柔和的渲染风格。你需要还原当时的建筑细节、人物动态以及环境氛围,无论是暴风雨还是宁静的午后,都要自然地融合在模型的光影里。

关于背景,不要使用简单的纯白底。请在模型周围营造一种带有淡淡水墨晕染和流动光雾的虚空环境,色调雅致,让画面看起来有呼吸感和纵深感,衬托出中央模型的珍贵。

最后是底部的排版,请生成中文文字。居中写上小说名称,字体要有与原著风格匹配的设计感。在书名下方,自动检索并排版一句原著中关于该场景的经典描写或台词,字体使用优雅的衬线体。整体布局要像一个高级的博物馆藏品铭牌那样精致平衡。
4261
歸藏
2天前
群里朋友的想法,Nano Banana Pro生成虚拟的影视剧聊天记录批注

搞了一个武林外传的群截图,哈哈

非常应景和搞笑,改了一下我原来的提示词:

生成图片,一个虚拟的《武林外传》各个角色都在的微信群的聊天记录图片,他们的真实角色头像照片。

用符合他们人物性格和背景的对话内容填充,。用红墨水疯狂地在聊天记录加上手写中文批注、涂鸦、乱画,如果你想的话,还可以加点小剪贴画。

涂鸦内容主要是分析每个角色的潜在意图和他们真实的想法,需要语言犀利
11