即刻App年轻人的同好社区
下载
App内打开
歸藏
567关注27k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
1天前
测了一下,没想到 Seed 2.1 Pro 还不错啊

补上了 Agent Coding 短板的豆包应该会成为我日后关于内容创作的主要模型。

以前对它的印象可能还停留在基础问答,速度快、多模态好,但不会是 Agent 场景的第一选择。

这次提前测了一圈,感觉变了。

======

三个明显的长处

复杂任务稳。跑我自己的 Skills,规则多、上下文长,它没瞎写也没绕开约束,基本能交付。

视觉规划强。PPT、页面、卡片这些,信息密度和视觉层级它会自己安排,产出接近直接可用。

多模态加分。图片、文档、视频理解都能上,和其他纯 coding 模型配合时补位很明显。

======

三个前端任务实测

第一个,百叶窗式图片动效。横向展开交互,Hover 展开当前列、收缩其他列,带遮罩和局部放大。一步到位,效果很高级。

第二个,WebGL 贝塞尔曲线。纯文字描述的抽象效果:三格贝塞尔曲线各带色散,一直在运动,Hover 后色散增强但运动不断。做出来很舒服,没有僵硬抖动,玻璃折射自然。

第三个,跨整页视差滚动。九张图贯穿长页面,滚动时不断堆叠、散开、九宫格、横向流动,每段组织形式不同但动画连续。用了 GSAP + ScrollTrigger,结果完整。

======

内容生产方向,多模态 + 视觉规划 + Agent 可用,这个组合现在很少有模型能同时给到。日常用它跑内容任务,性价比相当好。
00:39
23
歸藏
4天前
这天气太爽了,差了两天又好了。
21
歸藏
4天前
Nano Banana 去超分放大 GPT-Image-2.0 图片

GPT 生成的图片很多时候会有这种毛躁的感觉,特别是一些非写实的图片,会有这种破碎的纹路和纹理,非常影响观感,而且一眼就能看出来是 GPT 生成的。

其实可以用 Nano Banana 去放大 GPT 生成的图像,去掉那种破碎感和无意义的细节,增加更多有意义的细节,同时让文字和细节更锐利、更清晰。

下面左边的是 GPT 生成的,右边的是 Nano Banana 放大的。

提示词:帮我将这张图片重绘和清晰化,让他细节更丰富,同时去掉原图中杂乱不必要的细节
2111
歸藏
4天前
看起来谷歌 DeepMind 最近出了点问题。

今天 AlphaFold 的作者,诺贝尔奖获得者 John Jumper 也宣布离开 DeepMind,加入了 Anthropic。

就在前几天 Transformer 作者、MoE 提出者 Noam Shazeer 加入 OpenAI 以后。
39
歸藏
6天前
codex双重重置,除了他们给你进行了一次重置以外,还帮你存了一次重置
94
歸藏
6天前
G7 AI 领域午餐会,头部的几家 AI公司负责人都在了。

当然焦点还是 Anthropic Dario,哥们看着老尴尬了

座位安排很有意思,Sam 阿萨比斯 坐在了特朗普两边,然后 Dario 坐在了特朗普对面,跟马克龙挨着
00:32
03
歸藏
6天前
啊?没人能想到 Midjourney 发布的硬件是这个东西。

他们成立了一个新的部门叫 Midjourney 医疗,发布的第一款硬件设备是一款人体扫描设备。
02:22
55
歸藏
7天前
Character AI 的前 CEO,transformer 论文的作者之一,MoE 架构的提出者 Noam Shazeer,加入了 OpenAI,进行模型架构研究。

谷歌之前用 27 亿美元收购了 Character 换他加入谷歌,结果这呆了没多久就跑到Open AI
22
歸藏
7天前
现在发现 OpenAI 在服务上是真的牛逼。

Codex 这么补贴的情况下,用户增长也很快,依然能提供非常稳定而且快速的服务。

最近其他几家都慢得不行了,再不然就是给你降额度。
91
歸藏
7天前
Midjourney 居然要发硬件了
31