即刻App年轻人的同好社区
下载
App内打开
黄健楸
43关注776被关注1夸夸
全干工程师,计算机心理学家
立足现在,追逐未来
置顶
黄健楸
1月前
大模型原生画图能力,突破纯文字输出,谷歌发布Gemini 2.0 Flash Experimental,亮点如下:
1️⃣不刚需英文提示词
2️⃣能画出文本,包括中文❗️
3️⃣可以对话修改,同样,可以用中文
4️⃣能拷贝风格(图四)
5️⃣能描述图片,给自己生成提示词
6️⃣能生成故事集+插图(图五、要指定张数,时灵时不灵,还有图六这种限制)……

首发于微博。体验链接: aistudio.google.com ,模型选择Gemini 2.0 Flash Experimental (见图二)

案例集
1️⃣喵娘。让Gemini生成一只喵娘,并让它扮演,再画一幅自画像,然后戴上“生气”发夹 web.okjike.com (图六,原贴不确定是不是没过审)
2️⃣故事集、连环画
3️⃣改字(一些简单中文) web.okjike.com

局限
1️⃣有些字不行,还会出现缺笔画(图七)
2️⃣改图有时不好用怎么办?(图八)
3️⃣美感不如专业文生图模型,比如 image-fx
10
黄健楸
3天前
Google AI Studio分享对话
刚发现Google AI Studio可以分享已保存的对话了(图二)
可以限制访问、也可以让所有人访问,有图片还会单独设置权限(图三)
虽然有多种角色,但目前看不出几种角色有什么区别(图四) ​​
00
黄健楸
5天前
让GPT4o其他AI图的手部问题
Midjourney v7手部有时会出问题,比如图一,让GPT修复成图二,虽然手修复好了,但感觉美观有些欠缺
00
黄健楸
21天前
问:用GPT4o重绘图片,说违反政策,怎么办?照片是自己的

答:提示词多半提到了某些名人。 比如宫崎骏、新海诚。这时候说用“吉卜力”风格重绘(图一),或者干脆用作品名《你的名字》(图二)、《鬼灭之刃》(图三)、《咒术回战》(图四)

(还有JOJO的,比较奇怪,放评论了)
11
黄健楸
21天前
GPT4o生成带文字图片实测。有很大进步,但中文没有英文好,文本密度越高越容易出错。不过,这只是开始

另外,可能有一批AI绘画工作流失去价值了
31
黄健楸
21天前
用GPT4o画图:炉石卡牌“山姆·奥特曼“,得到图一、图二
效果:**可交易**(居中)
**嘲讽**。每当对手召唤一个新模型,他在下回合开始也会召唤一个。

很强,比Gemini 2 Flash强一些,但还不是“神”,需要另外流程弥补。

图片素材:图三、图四
00
黄健楸
22天前
你掉的DeepSeek是金色的,还是紫色的🐶
10
黄健楸
22天前
谷歌新模型nebula真名公布:Gemini 2.5 Pro,能读取图片视频的推理模型。基础性能相当优异(图二)
浅浅试一道题,得到图三,发现不仅快速算对,而且还有解释,列条件概率公式用的也是中文。结合昨天nebula的使用情况,第一印象很不错

网址 ai.dev (AIStudio)上免费少量可用,个人使用完全够,大不了你开两个号。当然,再多一些就不是“个人使用”了,它有风控

0️⃣gemini-2.5-pro-exp-03-25 模型信息(图四)0️⃣
1️⃣知识截止到2025年1月
2️⃣具体限额:免费账户每分钟两次请求,每天50次请求;其他每分钟五次请求
3️⃣擅长:编程、推理、读取图片视频
4️⃣上下文长度:一百万词元
5️⃣用例:帮你思考复杂问题;解决编程、数学难题;用超长上下文分析文档、代码仓库等
00
黄健楸
1月前
Maple Mono,最近流行的新“文具”,这等宽字体怎么带连体字效果……
🔗github.com/subframe7536/maple-font
在线体验:font.subf.dev

图二是部分连体效果文本:
alter
class DummyClass
electron.js
tldr
ultra
xls
这是一个箭头 ==>
[INFO] todo)) fixme))
!== \\ <= #{ -> ~@ |> ​​​
23
黄健楸
1月前
开源一个调用Gemini生图的Next.js仓库。主题是“这衣服像窗帘吗?”在线体验:curtain.aicando.xyz

相比在AIStudio使用,调用API生图没有明水印。自部署到自己服务器完全可以自用。国内开发注意网络问题,详见GitHub仓库Readme:github.com

流程上实现只有两步,足够简单:
1️⃣调用图像生成接口,基于生图模型
2️⃣调用“像窗帘程度”接口,基于文本模型

话说生图模型名字真长:gemini-2.0-flash-exp-image-generation
02
黄健楸
1月前
氛围感编程(Vibe coding)是指,全靠AI编程,甚至只要动动嘴,代码就实现完了,但由于不熟悉代码,遇到错误也只能交由AI更改,随机抽取正确答案——听起来很像组长分派任务给手下几个程序员

名称由计算机科学家 Andrej Karpathy 首次提出(图一)
01