即刻App年轻人的同好社区
下载
App内打开
黄健楸
43关注778被关注1夸夸
全干工程师,计算机心理学家
立足现在,追逐未来
置顶
黄健楸
3月前
大模型原生画图能力,突破纯文字输出,谷歌发布Gemini 2.0 Flash Experimental,亮点如下:
1️⃣不刚需英文提示词
2️⃣能画出文本,包括中文❗️
3️⃣可以对话修改,同样,可以用中文
4️⃣能拷贝风格(图四)
5️⃣能描述图片,给自己生成提示词
6️⃣能生成故事集+插图(图五、要指定张数,时灵时不灵,还有图六这种限制)……

首发于微博。体验链接: aistudio.google.com ,模型选择Gemini 2.0 Flash Experimental (见图二)

案例集
1️⃣喵娘。让Gemini生成一只喵娘,并让它扮演,再画一幅自画像,然后戴上“生气”发夹 web.okjike.com (图六,原贴不确定是不是没过审)
2️⃣故事集、连环画
3️⃣改字(一些简单中文) web.okjike.com

局限
1️⃣有些字不行,还会出现缺笔画(图七)
2️⃣改图有时不好用怎么办?(图八)
3️⃣美感不如专业文生图模型,比如 image-fx
10
黄健楸
9天前
吹风机选购

图片创作方式:Gemini Deep Research后,在Create处选择Infographic
00
黄健楸
9天前
Google搜索大力推荐AI MODE的情况下,中小网站该如何运营、优化SEO?

图片创作方式:Gemini Deep Research后,在Create处选择Infographic
00
黄健楸
2月前
曲奇Logo
00
黄健楸
2月前
轻松将LOGO转成抱枕。工具用GPT4o

如果是知名产品,可以直接一句话描述:Design a Pillow with wechat logo, background is white and transparent

如果想有特定形状,比如蓝鸟:Design a Shaped Pillow with wechat logo, background is white and transparent

如果是不知名图标或特殊设计的图标,上传自己的图片
01
黄健楸
2月前
即刻抱枕,你喜欢哪个?
10
黄健楸
2月前
Google AI Studio分享对话
刚发现Google AI Studio可以分享已保存的对话了(图二)
可以限制访问、也可以让所有人访问,有图片还会单独设置权限(图三)
虽然有多种角色,但目前看不出几种角色有什么区别(图四) ​​
00
黄健楸
2月前
让GPT4o其他AI图的手部问题
Midjourney v7手部有时会出问题,比如图一,让GPT修复成图二,虽然手修复好了,但感觉美观有些欠缺
00
黄健楸
2月前
问:用GPT4o重绘图片,说违反政策,怎么办?照片是自己的

答:提示词多半提到了某些名人。 比如宫崎骏、新海诚。这时候说用“吉卜力”风格重绘(图一),或者干脆用作品名《你的名字》(图二)、《鬼灭之刃》(图三)、《咒术回战》(图四)

(还有JOJO的,比较奇怪,放评论了)
11
黄健楸
2月前
GPT4o生成带文字图片实测。有很大进步,但中文没有英文好,文本密度越高越容易出错。不过,这只是开始

另外,可能有一批AI绘画工作流失去价值了
31
黄健楸
2月前
用GPT4o画图:炉石卡牌“山姆·奥特曼“,得到图一、图二
效果:**可交易**(居中)
**嘲讽**。每当对手召唤一个新模型,他在下回合开始也会召唤一个。

很强,比Gemini 2 Flash强一些,但还不是“神”,需要另外流程弥补。

图片素材:图三、图四
00