即刻App年轻人的同好社区
下载
App内打开
歸藏
565关注25k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
1天前
Typeless 这最近是不是换模型了呀?

语音识别错误率大幅提升
150
歸藏
2天前
不是有病啊?

这Clawdbot怎么又改名了,改成OpenClaw了
258
歸藏
2天前
谷歌的实时生成世界模型genie 3开放测试。

​试了一下,太牛了!

超低延迟,超高分辨率,超强的物理表现。

详细的长文测评在这里:mp.weixin.qq.com

Genie 3 的核心特点

▸ 操控延迟非常低,差不多跟顶着高延迟玩美服游戏差不多
▸ 可以控制角色的方向和镜头的方向
▸ 画面清晰度相当可以用(720P)
▸ 角色跟环境的物理交互相当真实
▸ 可以持续操控角色超一分钟

这些特点听起来可能不起眼,但实际体验下来,你会发现这是一个质的飞跃。

======

测试 1:史前森林世界

我自己创建了一个史前森林世界,角色选了一个恐龙。

它会先生成一张首帧图片,你确定没问题了就可以开始生成世界。

可以看到我在本身连接美国服务延迟很高的情况下,这个视角控制和角色运动控制都非常跟手。而且恐龙运动非常顺滑和符合生物特征,角色一致性保持的很好,几乎没有变化。

我故意进行了一些大幅运动,环境一致性也没问题,没有突然变化和抽搐。

这时候我发现不对了,这东西好像真他妈的很牛批!

------

测试 2:毛毡风格蜗牛世界

然后我从预设的世界选择了一个毛毡风格的蜗牛世界,Remix 了一下,把蜗牛的蓝壳改成了红壳。

我发现提示里面写了可以跳,这次重点试一下这个。

首先可以看到风格化一致性保持的也非常好,一直保持了毛毡的变化。然后就是在我习惯了延迟和操控后,蜗牛变得跟手了很多。

我试了一次果然可以跳,而且蜗牛每次跳的高度都一致,没有发生陷到地里的情况。这时候物理表现已经初见端倪。

之后发现蜗牛走到石头的部分就被挡住了,走不动。后面我就开始频繁的跳跃,你甚至可以跳上台阶再跳下来。

而且在我一直瞎跳和转视角的过程中,之前的世界场景一直保持稳定,太牛了。

------

测试 3:伊斯坦布尔狸花猫

最后我想更加极限地测试一下物理表现。

我创建了一个伊斯坦布尔的优化版本,还有一只狸花猫。这个时候我已经习惯了这个延迟,能够完全可以非常自如地操纵它。

我上来就开始不走寻常路:我根本不走那条路,而是直接往路边的箱子上跳。

结果我发现,它真的能模拟猫的跳跃形态,而不是简单地四肢僵硬、像僵尸一样乱蹦。它是真的像猫在跳跃一样,会先伸腿。

然后它非常简单地跳上了路边的箱子。我甚至能从这个箱子跳到另一个箱子!

这太牛逼了,朋友们!尤其是你玩过 AI 视频的话。

视频模型甚至有时候都不能保证不陷下去,更别说以前的游戏穿模是非常常见的事,在这儿不成问题。

然后我就不断地在跳路边的箱子和拱路边的行人。我发现没有穿模的情况,它都能做出符合猫咪运动的动作,并且跟路边的墙和箱子有碰撞。

======

怎么使用 Genie 3

首先进去以后,你会看到很多个由"泡泡"组成的各种预制世界。

你点进去的话可以 remix 它,也就是把那个世界中的某些元素改掉。你可以改风格,可以改世界的内容,也可以改这个角色的内容。

------

Remix 流程

Remix 的时候,你就直接像用 Lana 改图一样,输入你想改的提示词就可以了。

改完以后:先点击"创建世界"左边那个按钮把图片改掉,然后再点击"创建世界"。

------

从头创建世界

最中间就是一个创建按钮,你可以通过这个按钮完全从头去创建世界。

你需要填写的话,分为以下几个部分:

▸ 左边:填写世界的提示词(描述这个世界是什么样的)
▸ 右边:填写角色的提示词(描述这个角色长什么样)
▸ 左边补充:你还可以写风格提示词(比如各种毛毡风格之类的)
▸ 下方:可以上传你生成的其他图片
▸ 模式选择:可以选择切换第一人称视角还是第三人称视角

这个我试了一下,视角切换有时候并不生效。

------

操作方式

进入游戏后,操作方式如下:

▸ WASD:控制角色的移动方向
▸ 右侧箭头:控制镜头的方向(这与常见的3D游戏操作类似)
▸ 此外,角色还可以进行跳跃操作

我感觉美国的朋友玩这个,如果延迟低的话会更爽。720P 已经完全可玩了,我们真的到了一个新的时代。

======

这意味着什么

想象一下!

可以通过大语言模型去构建世界,构建 NPC,加入各种随机事件,再加上一些音频。你可以想去哪儿就去哪儿,每个人都能构建自己想要的游戏世界和剧情。

像前段时间在 Steam 上爆火的那些 3D 真人影视游戏,现在看来是非常的触手可及,人人都可以做。

这个东西的想象力太大了,希望今年年底成本可以降一降,时间可以再长点。

------

一点遗憾

Genie 3 改变世界(即加入随机事件并影响世界的能力),这次由于算力问题没有加进来。希望谷歌能在后面更新一下。
03:11
29
歸藏
2天前
谷歌牛皮!世界模型 Genie 3 居然开放使用了

目前仅限美国 18 岁以上的 Ultra 用户

推出 Project Genie 平台,由 Genie 3、Nano Banana Pro 和 Gemini 提供支持。

提供三大能力:

「世界草绘」,用文字 + 生成/上传图片来创建角色和世界,并可通过 Nano Banana Pro 预览和微调画面,设定第一人称/第三人称视角等;

「世界探索」,进入后这个世界是可导航的,你移动时系统会实时生成前路,还能调整机位;

「世界重混」,可以在他人世界的提示词基础上二次创作,也可以从推荐/随机世界里找灵感,并把自己探索的视频导出。

单次生成限制在 60 秒。一些 8 月公布的高级功能还未集成。

这里尝试:labs.google
02:03
533
歸藏
3天前
妈的,终于把 Chrome 上的 Gemini 开了

录个视频教大家怎么开启

如果你也跟我一样,所有的方法都用了,还是不行,而且你是 macOS 系统的话。

你直接把系统语言改成英文,它重启后就出来了。

首先就是 Chrome 的设置:
1. Gemini 相关的所有开关都打开
2. 然后再把所有的 Chrome 浏览器地区设置成美国

这个流程可以用命令行去完成,也可以用现成的项目(如下面所发)去完成

然后关于谷歌账号和系统的设置:
1. 把你的 Google 账号地区改成美国
2. Google 账号语言设置成英文
3. 刚才我提到的 Google 浏览器也需要改成英文

macOS 上,如果想把 Google 浏览器改成英文界面,需要把你整个系统语言都设置成英文

提到的项目名称(Enable Chrome AI),命令的话就截图发给AI,让AI提取吧
03:56
1834
歸藏
3天前
终于,Gemini CLI 也支持创建和使用 Skills 了!

而且我发现,它可以检测到 Claude Code 已经安装的 Skills。

这下可以爽玩了,Skills 接力,哈哈
44
歸藏
3天前
谷歌浏览器上的 Gemini 更新了,主要的更新内容有:

- Gemini 打开方式变成了侧边栏
- 支持在后台运行,你看其他 Tab 他也会继续运行
- 支持使用 Nano Banana 编辑图像
- 自动浏览功能,支持多步骤任务

仅限美国,开启过程非常费劲,跟你网络账号、浏览器状态都有关系
00:04
50
歸藏
3天前
介绍一下我昨天开源这个视频包装 Skills 的工作原理:

简单来说这个 Skills 先用字幕智能分析生成特效配置,再由浏览器渲染逐帧生成特效图层。

最后通过视频合成把这些特效包装图层叠加到原始视频上的。

------

输入「视频 + 字幕」,先用 ‎`content_analyzer.py` SRT 里识别人物、章节、金句、术语、数据等,生成各种 Suggestion;

用户确认后写成统一的 ‎`config.json` 配置,再交给渲染和合成管线。

‎`video_processor.py` 是主入口,负责解析命令行和配置、选择渲染后端(Browser PIL)、按时间段分发不同组件的渲染任务。

主要渲染器 Browser 后端用 Playwright 打开 HTML 模板 + CSS 主题 + Anime.js 动画,通过 ‎`initAnimation(config)` 初始化、‎`seek(timeMs)` 驱动逐帧截图输出 PNG

`templates/*.html` 定义 9 类组件,通过约定的 JS API 接收配置和时间;‎

`static/css/theme-*.css` 定义 notion/cyberpunk/apple/aurora 等主题,用 CSS 变量 + ‎`data-theme` 切换风格。

新增组件只需:加一个 HTML 模板、在 ‎`BrowserRenderer` 里加渲染方法,在 ‎`video_processor.py` 注册处理逻辑、在 ‎`content_analyzer.py` 增加对应 Suggestion 和配置校验;

新增主题则是新增一份 theme CSS 并在模板中引用。

歸藏: 藏师傅又做了一个自媒体神器!解决视频包装问题! 视频包装 Video Wrapper Skills,给视频自动添加各种动画特效 - 一键完成任何视频的包装特效添加; - 自动分析内容,给出特效添加建议; - 内置四套样式主题,Notion、Cyberpunk 等; - 提供十多个特效组件,花字、进度条、高亮卡片等; - 完全本地完成,只消耗 CC Token。 这个教程视频也使用的这个 Skills 进行包装,一键搞定 项目地址:github.com/op7418/Video-Wrapper-Skills

01
歸藏
3天前
经常开源 Skills 的朋友,可能需要看一下各个支持 Skills 付费和上架的平台,以及国内的一些其他课程和电商平台。

可能有很多人拿你们的开源成果和劳动成果去收费,最后屎盆子可能还会扣在咱们这些开源创作者和贡献者的头上。

所以大家请谨慎一点:
1. 多核查
2. 发现侵权尽快举报
12