即刻App年轻人的同好社区
下载
App内打开
歸藏
563关注24k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
12:35
Lovable 的圣诞福利,两个月的免费试用!

输入“NEXTPLAY-LOV-25”即可领取,我自己是会员没办法尝试,各位可以试试
821
歸藏
12:13
“我们总是通过后视镜驶向未来”

推荐读一下 Notion CEO 这篇内容,AI 一定会跨过这个阶段,就是不知道会有多快

知识工作的两个瓶颈:上下文分散和可验证性,这点分析得很准。

这也是为什么程序员最先受益,因为他们的工作环境天然解决了这两个问题。

其他知识工作者要等到什么时候?可能取决于谁先把散落在几十个工具里的上下文整合起来。

从佛罗伦萨到东京的隐喻有点残酷但真实:规模跃迁必然带来失控感。那些习惯"人类节奏"的组织会觉得很不适应,但这就是代价。新世界不是旧世界的放大版,它有自己的运作逻辑。

------------------------

每个时代都有它的奇迹材料。钢铁塑造了镀金时代,半导体点亮了数字时代,现在AI以"无限心智"的形式到来了。

Notion创始人Ivan Zhao用历史隐喻说清楚了一件事:掌握这种材料的人定义时代。

为什么AI是"奇迹材料"?

因为它解决的是规模问题。19世纪前建筑只能盖六七层,铁太重太脆,楼层一多就塌。钢铁改变了一切,骨架更轻、墙体更薄,摩天大楼拔地而起。

AI对知识工作的意义和钢铁对建筑一样。人类沟通一直是组织的"承重墙",每周两小时对齐会、三级审批流程,都是在用人类尺度的工具解决工业规模的问题。

个人层面:什么时候能开上"汽车"?

Ivan的联合创始人Simon原本是10×程序员,现在同时指挥三四个AI编码agents,变成了30-40×工程师。他午饭前排好任务,agents在他离开时继续工作。

这就像从踩自行车进化到开汽车。但为什么只有程序员能开上车?

两个问题必须解决。第一是上下文分散,编程工具集中在IDE和代码库,但一般知识工作散落在几十个工具里。AI要写产品简报得拉取Slack、战略文档、仪表盘数据,还有只存在脑子里的institutional memory。人类现在是粘合剂。

第二是可验证性。代码能用测试验证对错,AI能用强化学习改进。但怎么验证项目管理得好不好、策略memo写得行不行?没法验证就没法训练模型改进,人类只能继续监督。

一旦这两个问题解决,几十亿知识工作者会从自行车进化到汽车,再从汽车进化到自动驾驶。

组织层面:我们还在"替换水车"吗?

工业革命初期,蒸汽机刚出现时,工厂主只是把水车换成蒸汽机,其他都不变。生产力提升很有限。

真正的突破是工厂主意识到可以完全摆脱河流了。他们把工厂建在更靠近工人、港口和原材料的地方,围绕蒸汽机重新设计整个厂房。生产力才爆发。

现在的AI聊天机器人就像"替换水车"阶段,只是附加在现有工具上。我们还没重新想象:当组织可以依靠永不疲倦的无限头脑时,应该长什么样?

Notion在做什么实验?

Notion现在有1000名员工,但同时有超过700个agents在处理重复性工作。

它们记会议纪要、回答问题综合tribal knowledge、处理IT请求、记录客户反馈、帮新员工办入职、写周报省去复制粘贴。

Ivan说这只是起步,真正的收益只受想象力和惰性限制。

从佛罗伦萨到东京意味着什么?

钢铁和蒸汽不只改变建筑和工厂,它们改变了城市。

几百年前的城市是人类尺度的,你能在40分钟内走完佛罗伦萨。然后钢架结构让摩天大楼成为可能,蒸汽铁路连接市中心和内陆,城市在规模和密度上爆炸。东京、重庆、达拉斯都不是更大的佛罗伦萨,它们是完全不同的生活方式。

知识经济现在占美国GDP近一半,但大多数还在人类尺度运作:几十人的团队,会议和邮件控制节奏,组织超过几百人就开始变形。我们用石头和木头建了佛罗伦萨。

当大量AI agents上线,我们会建造东京。数千个agents和人类组成的组织,工作流程跨时区持续运行,不用等人醒来,决策在适量人类介入下合成。

会更快、杠杆更高,但起初也更迷失方向。周会、季度规划、年度评估的节奏可能不再有意义。新节奏会出现。我们失去一些可读性,但获得规模和速度。

来源:x.com/ivanhzhao/status/2003192654545539400
128
歸藏
11:33
Fofr最近在研究 JSON 格式的提示词,我在他的游戏截图生成提示词里加了圣诞彩蛋

我以前对这个东西觉得是故弄玄虚,但现在看来,至少有一点好

它的迭代非常稳定,尤其是在跟模型共创的时候。当你写提示词与 Gemini 共创时,不需要反复去提示一些基本的格式,它不会给你改乱。

针对 JSON 格式,它通常能保证格式的稳定:
1. 内部参数:它一般默认不会变动里边的参数
2. 后续内容:它只会修改后续的具体内容

这样能确保它不会在修改过程中把你的风格改没了或者改错。这确实非常好,而且很容易进行发散和拓展。比如:

- 批量处理:你可以让它批量修改成不同的主题,但保持风格和构图的一致性
- 协同修改:可以拆分地去修改,与模型共同创作

这样操作起来其实是比较方便的,计划将我所有的提示词转成 json 格式存起来并且展示

原始提示词:gist.github.com/fofr/eec0dae326243321c645aceba28c6119
04
歸藏
00:44
同样的提示词和内容 GLM-4.7 的也不错

就是 CSS Grid 部分有些小问题,卡片没有完美填充
00:13
00
歸藏
2天前
看到知乎上线了他们的年度AI产品榜,刚好我也还没写总结,就借着这个榜单来聊一下这些产品。

首先国内通用聊天产品,豆包排第一,第二是Deepseek,后面有千问和知乎直答。

今年国内所有的厂商基本上都吃的是Deepseek在年初爆发的红利。我们用整整一年的时间,把这部分用户从完全不了解AI拉到了每天使用AI。

在做产品上字节是厉害的。不管是能力还是产品策略、运营策略、推广方法,都展现了自己在做产品上应有的战斗力。由于语音模式的低门槛,让很多小朋友和老人都能够非常顺畅地使用豆包。非圈内的用户一说就是豆包和 Deepseek,这就是他们理解的 AI。

千问的增长也很迅猛,阿里在年底终于搭建了他们的模型体系和新的团队,开始疯狂发力。最近有不少人一提起AI,就会提到千问了

然后是海外的ChatBot产品,Claude、ChatGPT和Gemini

Gemini排得相当靠前。谷歌在年底的这一波发布还是太猛了,又有钱,又有卡,又有人,模型还强。低成本提供最优质的模型,是这个行业现在最强的推广手段,也是最稳定的

Anthropic 在今年也确定了自己的发展方向,在产品的人力和资源投入上,维持较低的水平。但是通过Claude Code这种对开发的依赖比较低,又能发挥模型能力的产品,快速地抢占用户心智和市场。尤其在编程领域,非常难以撼动,2B的收入很高

Sam 最近确实不是很好过。自从GPT-5发布以来,大家对于OpenAI的模型就一直没有什么好的评价,尤其是在模型的语言风格和回复策略上。但是在产品层面,ChatGPT确实是最好的。这也是为什么它的用户忠诚度比较高的原因

然后就是即梦和可灵两个内容创作工具,国内今年在图像和视频领域基本上是相较于海外一骑绝尘的。但是年底Nano Banana Pro发布、Sora2发布以后,直接将图像和视频模型带到了一个新的领域。针对于视觉推理以及编辑能力,我们需要尽快赶上

最后是Cursor,基本上开启了今年的Agent大幕。在Agent这一块的创新,包括上下文工程、底层多个模型的混合调用,以及关于Agent的操作的基本交互逻辑,都为很多AI产品指明了方向。卡帕西的年终总结也非常着重地提到了Cursor以及 vibe Coding

25年,我们AI领域是非常幸运的。模型和产品都有非常大的突破,期待26年的 AI 圈还有什么狠活
92
歸藏
2天前
MiniMax M2.1 这个前端美学表现确实可以啊!

让他帮 karpathy 的年终总结做了一个网页,他甚至改了鼠标样式

估计集中找了一批设计比较好的网页数据做 RL
00:19
11
歸藏
2天前
Open AI 这个年终总结不行,藏师傅给他补一下

🍌 Nano Banana Pro 提示词:

为你的 ChatGPT 年终总结做一张分享图

Open AI 这个年终总结还是没国内大厂专业,分享图该有的信息都没有,我自己用大香蕉搞了一套提示词

把你的总结截图和提示词扔给 Nano Banana 就行

-------提示词------

任务目标:
基于用户同时上传的年终总结截图中的数据和信息,设计一张风格鲜明、极具视觉冲击力的 3D 年终总结海报,用户名 [guizang]

整体风格与情绪(固定风格):
核心风格: 融合 3D 趋势、游戏化元素和高饱和度色彩。
材质感: 画面主体呈现精致的黏土(Clay)或软塑胶材质渲染,边缘圆润,光影柔和,给人一种“盲盒玩具”的亲切感。

排版感: 整体布局要像一份精致的高级杂志,疏密有致,信息架构清晰。文字排版简洁明了,不要添加任何卡片、胶囊或底框类的装饰背景。

画面主体(核心视觉):
视觉中心是一颗巨大的、紧密堆叠的 Q 3D 黏土球体。球体的组成元素需要根据用户上传截图中的具体内容来动态生成:

数据气泡: 将截图中提取的关键数字和对应的标签(例如:消息总数、聊天次数、生成图片数、活跃度排名等)制作成圆润的黏土数据气泡嵌入球体。

主题图标: 根据截图体现的用户兴趣点,添加相应的通用黏土图标(例如:游戏手柄、大脑、图表、对话气泡等)。

类别建筑(核心要求): 分析截图中的内容侧重点,在球体中融入几座代表不同聊天品类的精致微缩黏土建筑。例如:
如果包含 AI/技术内容,加入一座带有科技感的未来数据中心建筑。
如果包含游戏内容,加入一座像素风格的游戏城堡。
如果包含创意/艺术内容,加入一个微型艺术工作室。
组合方式: 所有这些元素(气泡、图标、建筑)必须非常紧密、融洽地挤在一起,无缝组成一个完美的球形,不露出内部结构。

背景设计(固定框架):
底色: 采用高饱和度的暖橙色到柔和紫色的渐变背景(参考之前的风格)。

背景文字: 在星球背后,放置六个巨大的、带有喷溅纹理和反向蚀刻效果的汉字,主题可以是“冒险 创新 探索”(上排)和“创造 硬核 冲击”(下排),部分被球体遮挡,增加街头硬核感。

信息架构与排版(内容从截图中提取):
顶部 (Header): 放置白色的 ChatGPT Logo,并根据截图信息生成标题,格式为:“[从截图中提取的用户名] [年份] 年终总结”。

底部数据区 (Data Grid): 在球体下方,创建一个极简的 2x2 纯文字数据网格。从截图中选取 4 个最核心的数据,使用超粗无衬线字体展示大数字,并配上相应的文字标签和有趣的社交属性短语(例如:“社交牛逼症”、“话痨”、“六边形战士”等,依据数据特性生成)。
页脚总结 (Footer): 在最底部用小字排版两段文字,内容直接从用户截图中的总结段落(如“你的聊天风格”和“年度亮点”)提取。
615
歸藏
2天前
Open AI 也开始搞年终总结页面这一套了

美国、英国、加拿大、新西兰和澳大利亚用户只要开启了记忆功能的都有

APP 会多出来一个“你和 ChatGPT”一年的聊天记录

我今年用 GPT 确实不多,虽然买了两个月冤种 Pro 会员
20
歸藏
2天前
一会八点跟 Medeo 产品负责人晨然一起聊一下 Medeo

感兴趣可以来看看
01
歸藏
3天前
最几天听的最牛批的播客,终于知道 AI 在医疗上怎么应用了,重轻真的厉害
76