即刻App年轻人的同好社区
下载
App内打开
歸藏
563关注24k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
1天前
高德发布了一个名叫 FantasyWorld 的世界模型,阿里的模型版图再次扩张。

作为头部导航应用这么大的数据量确实可以用来搞个模型。

发布之后在 WorldScore Leaderboard 这个专门用于世界模型的测试集排第一。

随着自动驾驶各家转向 VLA 和纯视觉方案,加上具身智能的火爆,感觉这类追求物理表现和 3D 一直性的世界模型会越来越重要。

FantasyWorld旨在为具身智能与AGI提供高质量3D世界模型。

在冻结的视频骨干上增设可训练的几何分支,联合建模“视频潜变量”和“隐式3D场”于一次前向计算中。

生成视频在保持强视觉真实感的同时,显著提升多视角一致性与几何保真,相比近期几何一致方法在多视角协同与风格一致性上更优。
22
歸藏
1天前
昨天玩 Open Code 的时候有个教训,大家可以参考

oh-my-opencode 这个插件的时候它可以搞 Open AI Antigravity Auth

把你账号的 Codex Gemini 模型额度给 Open Code 用。

不建议开启这个:

一个是本身这是违反两家用户协议的,有封号风险

另一个是这种反向代理,会影响网络,本身我们国内的网络环境就相当复杂。

我搞了这个以后 Antigrvity 直接没有办法选择模型了,最后卸载掉 oh-my-opencode 的配置才变好。

还有一个问题是,它对于我们现在国内常用的这种 Claude 模型的代理 API 处理得不是很好,或者说支持得不是很好。

我不知道是两端哪一端的问题,添加以后过程很复杂,而且效果也不好。
11
歸藏
1天前
可能 AI Studio 又要有大更新了。

模型输入框增加了工具选项,他们员工说是为了即将到来的更新做的准备

目前 Gemini 3 Pro 开放了 5 个工具:结构化输出、代码执行、Google 搜索、 URL 获取上下文、Function Call
31
歸藏
1天前
Anthropic 发布了本地带界面的 Claude Code

内置在 Claude 桌面端里面,在侧边栏点击“Code”切换后选择启动的文件夹就行
14
歸藏
1天前
他妈的一大早罗技的鼠标驱动掉了,搞了好久

结果是他们证书跟英雄联盟一样也过期了

真服了,而且这么长时间都没修复,不能干别干了,罗技

找了半天,终于找到解决方法了:

把日期改成昨天,启动调好之后再把它关了,最后再把日期改回来
34
歸藏
2天前
刚才发现启元发布了一个可定制化能力很强的机器人启元 Q1

既有全尺寸机器人的精准性能还很抗摔

主要是这个机器人从外壳到内在代码逻辑可玩性都非常强,想整一个了
01
歸藏
2天前
只需要装一个 Claude Code for VS Code 的插件,你就可以在 Antigravity 里面双开 Gemini Claude Code

两个套餐的模型混着用,还有 IDE 界面可以快捷方便的对文件和内容进行操作
217
歸藏
2天前
很多朋友问我早上关于昨晚英伟达发布会的 3D 信息图的提示词,这里发一下。

这套提示词主要适合一些有实物而且非抽象内容的展示,中间会有非常精美的 3D 渲染的实物模型。

由于文字比较多,建议在 AI Studio 或者其他生成图片不糊的产品上使用。

-------------

提示词:

基于下面文字主题,创作一张高密度的中文 3D 信息图。
风格要求为:
顶部:主标题区,居中展示该主题的 3D 艺术字标题。
中间部分展示相关物品或者抽象内容的 3D 微缩模型,造型极其复杂华丽、材质高级(如发光、透明、镀金)、体积庞大、带有炫酷的特效光晕。
信息叠加层(Smart UI):
悬浮标签: 在每个模型上方,悬浮一个 3D 气泡,写上该模型或者内容的名称。
底部:数据矩阵区
生成一个整齐的多列数据表,我提供的文本信息。
自动生成参数: 请根据主题自动选择多个最关键参数并以图形化进度条或数字形式展示。
风格与渲染:
视角: 正面平视或 30 度等轴测视角,确保三个物品处于同一水平线。
材质: 类似于“盲盒玩具”与“产品渲染”的结合,既可爱又有极高的物理真实感(C4D / Octane Render)。
背景: 干净的纯色摄影棚背景,带有柔和的投影。

文本信息为:
07
歸藏
2天前
老马从韩国买了 5 380 兆瓦的天然气涡轮发电机

专门用来给他新增的 60 万台 GB 200 NVL72 集群供电

现在为了发电各家各显神通啊,老马都开始自建天然气发电站了
22
歸藏
2天前
谷歌正在准备把 Gemini 放到 Google TV

支持用自然语言找片、回顾剧情、支持模糊描述来找不记得片名的内容

Gemini 回复的时候会动态组合文本、图片、视频,提供丰富的屏幕内容。

帮助学习内容,提供带旁白的交互式概览与“深度解析”

自然语言检索 Google Photos 的照片

支持语音优化电视设置,比如屏幕太暗了,声音有点小之类的

会先在部分 TCL 电视推出,随后扩展到其他 Google TV 设备
54