即刻App年轻人的同好社区
下载
App内打开
傅丰元
684关注4k被关注14夸夸
编辑,Studio Q24丨离线丨利器丨灵感买家俱乐部

https://ling.school/play/
傅丰元
4天前
感觉自动化和封装只有相对而言,而任何被封装的魔法背后都有认真玩的人。哪怕4o生图也有高级魔法师。

兵书Pro: ✍️记录下参加 ComfyCon 大会的一点点感悟: GPT-4o 的图像工作流创作能力已经达到了用嘴就能 P 图的效果,社交平台上有些自媒体甚至说 comfyui 迎来了它的葬礼。 但我在 comfycon 大会的现场看到的 comfyui 的创作者和开发者,他们的实践证明了以上这一大放厥词的观点是有多么浅薄。 第 1 位做分享的是 blender 教学区博主并且也是 comfyui 早期的中文版建设者,只剩一瓶辣椒酱老师,他是最早将 comfyui 翻译成中文并发布了大量工作流和节点的创作者。 他给我们现场介绍了 comfyui 中关于 3d 模型节点的优化和进步,如何从我们在自然的物理世界对物品的摆弄的习惯,过渡到像在自然物理自然环境中去摆动这些东西一样自然,这是人机交互的一大步。他引用了英伟达的黄仁勋的一句话:“我们想要通过自然语言描述来完成一切的交互将是非常困难的”。 的确,有很多我们人对物体的设计和的操控作,都是没有办法用语言完全照顾到细节的,例如,可能我们需要可视化的图表,我们需要一些模型,我们需要去向对面的人展示一些无法用语言来描述的物品和概念,以及更深层次的世界。这样人和人的交流才能达成,但这不是关于大语言模型或者关于自然语言的问题,而是我们如何概念和想象这个世界的问题。 人类社会创新和发展最大的杠杆也是在于人的想象力。我们可以将更多的工作以上手的状态来完成,用手工的方式去打磨,等这些完成的经验跟步骤已经练习到非常纯熟的时候,我们才有可能把它自动化,处理并封装成一些可以用技术来实现的解决方案和固定的流程。 但这些都以人的手工调试为前提。就像我们能从流传下来的手工制品(craft)中看到凝聚的人类主动性和心血、人的专注力和精力的投入,在过程中的苦思冥想和摸索,都造就了独一无二的文化传承和带给我们人文精神的内核。 令我印象深刻的另一位开发者,是来自于机器学习领域的内容创作者,他的背景使他能够更深入模型的原理,做了非常多的lora和模型的后训练,并形成了独特的风格。他通过 lora 和模型的后训练,以及保持图像的一致性的微调,使模型的创作能力能在人类的掌控下,可以满足我们的预期去生成,甚至超出我们的预期,去组合和混合并形成新的美学风格。 他创作的一部分作品甚至被用于好莱坞大片中作为动画开场,其中一个片段是他通过不断的画面缩小,但在同时又保证这种风格一致性,让我们在一个极小的图像创作中去推出一个无限递归的更大的更复杂的世界。而这些步骤,也是他使用 comfyui 通过一次次的 lora 训练来完成的。 这个对于许多传统的影视制作行业背景的从业者来说很有意义,我觉得他们可以凭借丰富的行业经验背景,如果能和 comfyui 的这种控制界面来结合,则可以更加深化并放大他们的优势。 这位老师的创作风格形成也主要是通过对各种美学的整合,这是令人惊叹的一点。他喜欢的某种美学风格是随机的噪点,另外再结合他喜欢的特定动漫的主题插画,就可以得到一种新的东西,我们可以看到的既是一种漫画形式,同时图像中又有正在消散的像素点,形成了一种独特的风格。这些对细节的控制超出了我们人类能够经验到和能够想到的范围,实现了非常不同的重要的打破和组合。 又比如,他把关于人物的年龄的渐变层次,结合到人物的皮肤和颜色的渐变层次,然后就可以生成这个人物在时空中变化的更多可能性,这是我们的想象不到的东西就。因为日常经验中的一些可能性和可能性之间是不连接的,但是在生成扩散模型的创作中,它能够以非常不同的角度去串联这些点,可以让我们突破我们能够所想象的经验之门。 当我和朋友在聊起这件事情的时候,我又想到,前人创作的方式是基于我们感受和经历的一些复述,比如艺术家透纳是颜色和光影的爱好者,他走访了非常多的的山水景点,山脉,在行走中形成了一种对自然的观感和感受,并且在后续的油画创作中调用他的这一部分的经验知识。 这个是前照相机时代的画家创作的方式,那么后照相机时代,那么创作者他只需要按下快门并且去捕捉和还原它在当时当下的一种特定的角度,保留这个瞬间中构成整体印象和氛围所需要的光影特点和这种线条的特征。这个是摄影术的一种创作的意义。 那么最近的话,则是通过这种智能手机傻瓜式的按一下快门就可以拍照并且自动的去调整光线和整体的布局,然后通过这样的一个飞速发展的网络和智能终端,我们的信息可以扁平化的在屏幕中双向的流动,从发送者到接收者,都能够很快得到一些新的东西。 基于这样一个背景,模型作为一种创作的工具或者是我们使用的媒介本身,它就是互联网信息的压缩,我们又可以在互联网的这个浏览中去快速找到以前有创作的经验,然后去生成我们自己想要的一些特定的主题和思考下的内容。我们自己主动去勾连起不同的东西,然后去形成一种新的关于策划形成和设计东西的捷径,这就是借助模型本身我们能够达到的新的能力水平。 这也正是第 2 位分享者在问答环节回应“如何使用 LLM 来开发新的 comfyui 工作流节点”这一问题时所呈现的观点。 那么时间当来到第 3 位分享者时,他其实做的一些工作流在我看来已经是对于已有的过去的关于 photoshop 的专业软件的使用如何被吸纳到 comfyui 的一个可视化视窗下的结果。 他的搬运和迁移工作,其实都是用节点化的视窗和形式,去重新解构掉之前的软件中点击交互的操作界面。不过,非专业人员来修改和制作这样的工作流费时费力,既然我们在原有的这个软件上面已经实现了这些功能,为什么我们还要去原封不动的搬到 comfyui 上面来呢?这个问题我觉得也是他需要去回应的。 可能的效果来自于实现了对这个工作流更加精细的控制,但是他的演讲中没有很强调这一点。 那么时间来到最后的一位分享嘉宾也是 vrch 未亓的创始人,他所讲的就是将 comfyui 封装成一个可以去控制它、调节超参数的一个直接的视觉图像创作机器,这也是互动艺术的一个创作工具。 而且这个机器也是在晚上的 afterparty 上得到了展示,也是令在场的所有人都感到非常惊艳的效果。凭借这样一种数字交互艺术的创作方式,我们人类已经不需要再去写提示词了,就完全由像 deepseek 这样的大模型来创作图像的提示词,且能够和音乐和现场的氛围结合到一起。 它自动生成了这些东西,经过我们人类的熟悉的工作流应用和,和这个现场的主动创作和调参,就能够涌现出大量的、接连不断生成的一些令我们感到惊喜的视觉作品。 我觉得这是大模型本身在人类的介入下,通过我们对工作流的再封装和工程化能够达到的创作新高度。 #技术媒介 #模型即信息 #人工智能创作 #涌现 #comfyui

00
傅丰元
9天前
6、7年不上班的我,这个月上班满一年了。大家有什么好奇想交流的吗?

另外接机招一个实习生,如果你对AI 开发者社区的事情感兴趣,可以联系我(微信bob_fu)。具体JD:www.zhipin.com

很感谢在即刻找工作时提供帮助的朋友们!m.okjike.com
34
傅丰元
15天前
本周六上午的活动!

你上次在城市里抱有游乐心态的时刻是什么时候?

四组城市边缘的游乐者给出了他们的答案。

游乐土壤,可以是在家的天台和朋友一起种植(三十);也可以是在街头的任意空间游玩(「修四边形」游戏小组),还有在散步中重复观察后的像素记录(Joe)。当然!如果你还在游动,也可以是拽着一个关键线索,让变化自然发生(熘肝尖)。

城市边缘的游乐,看似保持距离,有时反而会离自己更近。

本周六上午解散派对:城市边缘的游乐者

00
傅丰元
15天前
@Woolsey 招人,很有意思的产品。

招募用户运营与增长/CMO – AI陪伴

10
傅丰元
24天前
Gemini 新的文生图很有意思呀,一致性和风格迁移都很好。

邀请大家观看一个城市报刊亭的一天🌞🌛

生成完觉得就很合适@海玮 他们的魂旅,只是这次固定一个景点。
05
傅丰元
24天前
组织了一场 MCP 和智能体通信协议的直播分享!欢迎加入。

时间今晚 8pm,在 RTE 开发者社区的视频号直播。

嘉宾包括 Agent Network Protocol 的@常高伟_长山 ,CamelAI 的李国豪,开源社联创林旅强。也拉来@白宦成 来主持。

agent 生态真的越来越丰富了,期待交流。

直播预告:慢热的 MCP 终于火了;什么是 MCP,以及智能体通信协议的未来丨RTE Dev Talk

02
傅丰元
24天前
「MCP 协议」严格说是语义重复,P 就是协议(Protocol)的意思。类似的还有「ATM 机」、「PDF 格式」。

但是这些不重要,好懂容易交流就行。
01