即刻App年轻人的同好社区
下载
App内打开
歸藏
567关注26k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
11:55
我操,Codex 太牛逼了!

自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。

我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的

这是能玩的!
68
歸藏
1天前
Moxt 是近期所有新的 Agent 产品里,我觉得最好的之一

终于找时间写了一篇介绍。

Agent 的瓶颈很多时候是 Context 太散、太脏、太难复用。总结一下做个笔记👇

======

AI 需要一个自己的工作空间

我日常最常见的问题是:Context 散在五个地方。

飞书、Notion、本地文件夹、微信聊天记录、Twitter 收藏夹,还有我自己的脑子。

切任务的时候,一半时间都在搬运。

更麻烦的是“脏”。

飞书的 block、Notion toggle、PDF 的视觉排版、Slack 截图,每种格式对 AI 来说都要先剥一层壳。

Moxt 的解法很直接:给 AI 一个自己的 Workspace。

它让 AI md、csv、html 这些更接近“母语”的格式里工作,让 AI 在文件系统里导航。

Word / PDF / Notion 导入后转 md,Excel csv,可视化报告生成 html。

听着不性感,但特别对。

文件系统本来就是 AI 熟悉的组织方式。能 grep,能树状浏览,能按路径理解上下文。对 Agent 来说,这比一堆散落在 SaaS 里的页面自然太多。

------

Skill 迁移非常爽

我在 Claude Code 里攒了十几个 Skill。

humanizer-zh AI 味,writing-rewriter 做小绿书和推特风格改写,wechat-formatter 做公众号排版,document-illustrator 做配图。

每一个本质上都是一个 md 文件加一些资源。

我把它们搬到 Moxt Skills 目录里,基本不用改,全都能跑。

你过去沉淀的写作方法、工作流、偏好,不需要重新发明一遍,可以直接搬进新的 Workspace。

------

把“你是谁”写进 md

Moxt 里每个用户都有一个专属个人 AI,叫 momo。

momo 的行为规则写在 AGENTS.md 里,放在你的个人空间。

用过 Claude Code 的朋友一看就懂。就是 CLAUDE.md 那套思路,被产品化了。

我做的第一件事,是创建了一个自己的 AI 分身:AI 藏师傅。

我把历史语录和写过的内容都传上去,它帮我生成总结文档和规则,包括身份、时间线、语气、内容偏好、对话模式、写稿模式。

它还从我的内容里总结出 6 个核心信条:

没亲手用过就没有发言权
松弛是生产力,不用数据审判自己
AI 是赋能工具,不是替代品
开放生态大于平台封闭
只要敢花钱、敢放权,AI 就是许愿机
朋友关系高于流量关系

Rules 也是 Context,而且是密度最高的 Context。

一份 AGENTS.md 里装着你的人格、价值观、写作品味。它不是玄学记忆,而是你能打开、能改、能删的纯文本。

AI 的“记忆”不该是黑盒。

------

AI 同事不只是会聊天

AI 读懂 Context 只是第一步。

接下来它还得会动、会记、有明确的人格和边界。

Moxt 这里有几个能力挺关键。

第一是 Skill 组合。

比如我的公众号写作流水线以前是:

humanizer-zh AI writing-rewriter 风格重写 wechat-formatter 公众号排版。

以前要手动走三步,每一步复制粘贴。

现在丢一份初稿进去,十几分钟就能拿到可以直接贴公众号的终稿,中间版本也都留在 Workspace 里。

第二是定时任务。

我建了一个“热点监控员”,每天早上跑 Cron,扫过去 24 小时的 Twitter、Newsletter、Hacker News,按主题聚类,输出科技热点日报。

我不建议大家只看 AI 总结。

AI 很适合帮你不漏掉重要信息。

第三是 Webhook。

我的 CodePilot 项目一旦有新 GitHub Issue,Webhook 会推给 AI 同事。

它先判断这是 bug、功能建议,还是用户不会用。

bug 进待修复,功能建议进路线图候选,使用问题生成 FAQ 草稿。

做完再决定要不要叫我。

一个人没法 7×24 在线,AI 同事可以。

------

因为 Moxt 面向组织,所以安全性很重要。

不同文件夹有不同权限,不同任务也应该有不同放手程度。

内部信息整理,可以放手。

对外发邮件,发送前必须确认。

数据分析,结论标“待人类确认”。

删除和归档,最好卡审批。

组织用 Agent 的核心不是让 AI 什么都自动做,而是清楚定义:哪些事可以自动,哪些事必须过人。

------

MCP 让系统接起来

Moxt 除了 Slack、GitHub 原生集成,也支持 MCP。

比如:

Sentry MCP:直接问最近线上有什么报错
Figma MCP:问设计稿里某个按钮是什么颜色
Linear MCP:创建一个 high priority bug ticket

个人用 MCP,很多时候只是方便。

组织用 MCP,就变成了信息流转能力。

因为组织里的真实信息,本来就散在 Notion、Slack、GitHub、Linear、Figma、Sentry 这些地方。

Agent 如果不能连这些系统,就只能停留在“会写字”。

------

Moxt 另一个让我惊喜的点,是它把 AI 输出从文字拓展到了完整视觉形态。

同样一份数据,momo 可以输出可交互数据看板、结构完整的 PPT,甚至产品 demo。

看板基于 ECharts,能筛选、能悬浮提示、多图联动,最后是一个独立 html。

PPT 有封面、目录、内容页、图表、结尾,键盘能翻页。

产品 demo 可以生成表单、列表、后台 dashboard 这些常见页面结构,Tailwind CSS 单文件就能演示。

这对组织特别重要。

很多时候,纯文字不是最好的交付物。

能看、能点、能演示的东西,才更容易被理解和推进。

------

我理解的 Agent 公式

我以前提过一个公式:

Agent 能力 = 工具 × 上下文 ×(人格 + Memory + Skill)

工具决定它能做什么。

上下文决定它知道什么。

人格、Memory、Skill 决定它像不像你。

这是个乘法。

任何一个因子为 0,输出都很难好。

模型再强,也救不了一个没有工具、没有上下文、没有规则的 Agent。

Moxt 做得比较好的地方,是把这几个要素放进了一个组织能理解、能管理、能修改的 Workspace 里。

------

最后

Moxt AI 藏师傅的身份书里总结过一句话:AI 是赋能工具,不是替代品。

我觉得这也是 Moxt 的底层逻辑。

它想做的不是替你决策,而是放大你的能力。

“一人公司”里的“一人”,重点不是一个人硬扛,而是决策和品味不被稀释。

真正稀缺的是判断、审美、执念。

这些 AI 学不来,也不该交给 AI。

AI 应该做的是把你从搬运 Context、切换任务、重复看一眼这些琐碎里解放出来,让那份稀缺的判断被放大。

一个人的品味 × AI 同事的执行带宽,才是 OPC 真正的意思。

如果你或者你的组织也在每天切任务、搬 Context、沉淀方法论,可以试试 Moxt。
023
歸藏
1天前
Deepseek 的多模态模型全量了。

目前可以在网页版的识图模式尝试,看起来是一个单独的多模态模型
30
歸藏
2天前
Ghostty 的负责人今天说他会离开 GitHub。

这哥们在 GitHub 5 万多的粉丝,每天都有提交,是重度的 GitHub 使用者。

他的意思是,GitHub 现在频繁的故障和不稳定的服务已经严重影响了开发工作,导致他觉得这里不再适合进行严肃工作。

因此,他会把所有的重度开发工作都迁移到自建的服务上,GitHub 之后只保留代码库。

目前主要影响的内容是: Actions、PR、Issues 等配套服务经常挂掉,导致他没办法进行代码评审和跑 CI 合并。

我感觉这是一个非常大的机会。

AI 时代,GitHub 事实上已经变成了所有 Vibe Coding 最重要的基建之一,但现在微软显然没有办法应付这套东西。

所以,如果哪个平台能够提供一个更适合 AI、更适合 AI Agent Git 服务,可能会有很大的机会。

详情:mitchellh.com/writing/ghostty-leaving-github
39
歸藏
2天前
优化了一下我的 PPT Skills Codex 的效果

现在太牛逼了,图片也能一键搞定!

能够调用 Codex 里的 GPT-Image-2 去帮你生成图片。

而且我为此做了专门的设计,它会有独特的风格,并根据你的内容生成不同类型的图片,包括:

- 营造氛围的人文纪实图片(类似胶片机拍摄的效果)

- 信息图、流程图、对比图、关系图

- 截图美化:如果你觉得截图不好看,它都能帮你美化并优化成对应比例的图片

现在整个图文表现效果会更好,推荐你们在 Codex 里使用。

此外,我们也优化了 Codex 的生成流程,现在系统会先询问,而不会直接跳过确认步骤去生成 PPT 了。

详情:github.com/op7418/guizang-ppt-skill
517
歸藏
2天前
Codex 又重置了速率限制,一到周末就重置。太猛了OpenAI
44
歸藏
3天前
小米 MiMo -V2.5 系列模型全部开源

采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。

同时他们还推出了Orbit 100T Token 计划。

这个太牛批了!如果你有自己 Vibe Coding 一些东西可以去领一下。

包含两部分:

分别是面向 AI builder 的『百万亿 Token 创造者激励计划』,与面向 Agent 框架团队的『Agent 生态共建计划』。

百万亿 Token 创造者激励计划:

申请通过的 AI builder 用户最高将获得 Max 档位的 Token Plan,包含 16 亿 Credits ,价值 659 元。

Agent 生态共建计划:

将为你的 agent 框架提供 MiMo token 限免支持,让你的用户免费接入并体验 MiMo 系列模型。

详情:mp.weixin.qq.com
411
歸藏
4天前
看来真的很受欢迎,最近看到大家分享的线下 PPT 里面,很多都用了我这个模板。

歸藏: 昨天答应的 PPTSkill 来了! - 包含 10 个板式、5 套主题,覆盖各种场景 - WebGL 流体动画背景,非常炫酷 - AI 会帮你规划大纲、选主题、支持图片匹配和添加 聊聊它长什么样、怎么用,以及作为一个做了十年设计的人,我为什么觉得它好看👇 Skill 在这里:github.com/op7418/guizang-ppt-skill ====== 它不太像 AI 做的 打开 Skill 生成的 PPT,第一眼的感觉是:这东西真不像 AI 做的。 封面是墨色底 + 衬线大标题,背后一层 WebGL 流体在缓缓流动。正文切回纸白,墨字压在上面,像一本摊开的印刷杂志。翻页是横向左右滑动,键盘、滚轮、触屏手势都行,不是 PowerPoint 的下一页。 我给这套视觉起了个名字,叫"电子杂志 × 电子墨水"。 灵感来源是《Monocle》《卫报》《NYT》这类印刷杂志的版式,叠加 Kindle 电子纸的阅读美学,再用当代 Web 的交互语法串起来。 ------ 能做什么 目前提供 10 种页面布局、5 套主题色预设,一个单文件 HTML 就是最终产物。 10 种布局覆盖了一场 15-30 页分享会的几乎所有页面类型:封面、章节幕封、数据大字报、左文右图、图片网格、Pipeline 流程、悬念问题、大引用、Before/After、图文混排。改掉文字和图片就能用。 5 套主题色分别对应不同场景: ▸ 墨水经典 — 商业发布、通用默认 ▸ 靛蓝瓷 — 科技、研究、AI 发布会 ▸ 森林墨 — 自然、可持续、人文 ▸ 牛皮纸 — 怀旧、文学、独立杂志 ▸ 沙丘 — 艺术、设计、创意 每套只是 6 个 CSS 变量的不同取值,不允许用户自定义 hex,只能五选一。后面会说为什么。 产物是一个单文件 HTML,双击浏览器就能看,发给别人也只是一个文件,不用担心字体和动画在别人电脑上乱掉。 ====== 怎么跟 AI 协作做 PPT 这份 Skill 真正的价值其实不在模板本身,而在它定义了一套人和 AI 协作做 PPT 的接口。 三件事,我自己用了一周之后,觉得最值得告诉别人。 ------ 先跟 AI 说清这 6 件事 装好之后你只需要说一句"帮我做一份杂志风 PPT",Claude 会反过来主动问你 6 个问题: ▸ 受众是谁、什么场景(行业内部 / 商业发布 / 私享会) ▸ 分享时长多久(15 分钟 ≈ 10 页,30 分钟 ≈ 20 页) ▸ 有没有原始素材(文档、数据、旧 PPT、文章链接) ▸ 有没有图片、放在哪 ▸ 想要哪套主题色 ▸ 有没有硬约束(必须包含 XX / 不能出现 YY) 答完之后它会先给你一份大纲和主题节奏表,对齐之后再开始写代码。这一步拦截了我 80% 的返工。 以前用 AI 做 PPT 最痛的是什么?是它直接开始写,等你翻到第 10 页才发现整体方向就是错的。这套澄清流程把"对齐"前置到了开头。 ------ 图片这样塞 图片放在和 index.html 同级的 images/ 文件夹,文件名要按规则:页号补零 + 英文语义,比如 01-cover.jpg、03-figma.png、05-dashboard.png。 照片用 JPG,截图用 PNG,单张 ≥ 1600px 宽。你只需要告诉 Claude"第 3 页是 Figma 界面截图",它会自动写成 images/03-figma.png,你把同名文件丢进文件夹就行。 ------ 无损换图的秘诀:同名覆盖 这是我踩过最大的坑——文案改完想换张图,结果要全局搜替换路径,一不小心就把 HTML 改坏了。 正确做法只有一句:新图用同名覆盖旧图,HTML 一个字不改。 养成这个习惯之后你可以先用占位色块把整本结构调好,内容定稿了再统一替换真图;也可以 A/B 测试不同图片,丢一张看一眼,完全不动代码;还可以把图片处理外包给设计师,只要返回同名文件,你不用碰 HTML。 这一个小习惯,省了我至少一半的返工时间。 ====== 为什么长成这样 聊完怎么用,聊聊它为什么是这个样子。 好看不是玄学,是一套可以拆解的决策。我做的事,本质上是把杂志行业一百年沉淀下来的排版语言,搬到了 HTML 里。 ------ 字体的三级分工 ▸ 衬线用在大标题,负责"观点"。读者一眼就觉得这是一句该被重视的话。 ▸ 非衬线用在正文,负责"信息"。密度高、阅读不累。 ▸ 等宽用在页眉页脚,负责"元数据"。章节号、日期、页码,像杂志页脚,也像终端里的代码。 读者不用费劲想,眼睛自己就知道这句话是正文还是附注。 ------ 色彩的纪律 纸白、墨色,加一个重点色,就够了。 纯白刺眼、纯黑暴力,印刷行业从来不这么干,Kindle 也是。Skill 的 5 套主题,底色没有一个是 #FFFFFF,字色没有一个是 #000000。 每套只暴露 6 个 CSS 变量,SKILL.md 里写明:不允许用户自定义 hex,只能五选一。 约束越严,风格越稳。保护美学,比给用户自由更重要。 ------ 网格与节奏 7:5、6:6、8:4 几套固定网格保证单页秩序。hero 页和 non-hero 页必须交替,保证整本的节奏。一页密、一页疏,就是翻杂志时那种呼吸感。 Skill 里写了条硬规则:连续三页以上相同主题会被判为 P0 错误。没有节奏的 PPT 就是一沓 slide 堆成的 PDF。 ====== 最后 上面这些规则,没有一条是我发明的。 做了十年设计,UI、交互、AI 特效都干过,这些其实都是行业常识。我只是把它们一条条写进了 SKILL.md 和 checklist.md,让 AI 能替我逐条执行。 换句话说,这个 Skill 就是我这十年审美的一个压缩包。 以前做一份像样的 PPT,我得花两天手动调网格、选字号、抠色值。现在把素材丢给 AI,它按照这些规则直接拼出来,我只需要检查一下。 也正因为这样,我才敢把它开源。规则本来就不是我的独家,《Monocle》的设计师比我早用了几十年,我只是把它 copy 到了 2026 年的 HTML 里。

34