即刻App年轻人的同好社区
下载
App内打开
歸藏
566关注26k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
14:32
如果提供足够的上下文和工具的话,Agent 能力真的很强。

这个 PPT skill 其实是在我的 Codepilot agent memory 上生长出来的。

我跟他大致说了一下我想要一个什么样的氛围,可能只有 3 行文字。

他给我的第 1 版。就是这样的,已经差不多了。

后面都是一些最基础的优化,他参考了我所有的已有项目和我以前的收藏的文章,推测出了我的需求。

歸藏: 昨天答应的 PPTSkill 来了! - 包含 10 个板式、5 套主题,覆盖各种场景 - WebGL 流体动画背景,非常炫酷 - AI 会帮你规划大纲、选主题、支持图片匹配和添加 聊聊它长什么样、怎么用,以及作为一个做了十年设计的人,我为什么觉得它好看👇 Skill 在这里:github.com/op7418/guizang-ppt-skill ====== 它不太像 AI 做的 打开 Skill 生成的 PPT,第一眼的感觉是:这东西真不像 AI 做的。 封面是墨色底 + 衬线大标题,背后一层 WebGL 流体在缓缓流动。正文切回纸白,墨字压在上面,像一本摊开的印刷杂志。翻页是横向左右滑动,键盘、滚轮、触屏手势都行,不是 PowerPoint 的下一页。 我给这套视觉起了个名字,叫"电子杂志 × 电子墨水"。 灵感来源是《Monocle》《卫报》《NYT》这类印刷杂志的版式,叠加 Kindle 电子纸的阅读美学,再用当代 Web 的交互语法串起来。 ------ 能做什么 目前提供 10 种页面布局、5 套主题色预设,一个单文件 HTML 就是最终产物。 10 种布局覆盖了一场 15-30 页分享会的几乎所有页面类型:封面、章节幕封、数据大字报、左文右图、图片网格、Pipeline 流程、悬念问题、大引用、Before/After、图文混排。改掉文字和图片就能用。 5 套主题色分别对应不同场景: ▸ 墨水经典 — 商业发布、通用默认 ▸ 靛蓝瓷 — 科技、研究、AI 发布会 ▸ 森林墨 — 自然、可持续、人文 ▸ 牛皮纸 — 怀旧、文学、独立杂志 ▸ 沙丘 — 艺术、设计、创意 每套只是 6 个 CSS 变量的不同取值,不允许用户自定义 hex,只能五选一。后面会说为什么。 产物是一个单文件 HTML,双击浏览器就能看,发给别人也只是一个文件,不用担心字体和动画在别人电脑上乱掉。 ====== 怎么跟 AI 协作做 PPT 这份 Skill 真正的价值其实不在模板本身,而在它定义了一套人和 AI 协作做 PPT 的接口。 三件事,我自己用了一周之后,觉得最值得告诉别人。 ------ 先跟 AI 说清这 6 件事 装好之后你只需要说一句"帮我做一份杂志风 PPT",Claude 会反过来主动问你 6 个问题: ▸ 受众是谁、什么场景(行业内部 / 商业发布 / 私享会) ▸ 分享时长多久(15 分钟 ≈ 10 页,30 分钟 ≈ 20 页) ▸ 有没有原始素材(文档、数据、旧 PPT、文章链接) ▸ 有没有图片、放在哪 ▸ 想要哪套主题色 ▸ 有没有硬约束(必须包含 XX / 不能出现 YY) 答完之后它会先给你一份大纲和主题节奏表,对齐之后再开始写代码。这一步拦截了我 80% 的返工。 以前用 AI 做 PPT 最痛的是什么?是它直接开始写,等你翻到第 10 页才发现整体方向就是错的。这套澄清流程把"对齐"前置到了开头。 ------ 图片这样塞 图片放在和 index.html 同级的 images/ 文件夹,文件名要按规则:页号补零 + 英文语义,比如 01-cover.jpg、03-figma.png、05-dashboard.png。 照片用 JPG,截图用 PNG,单张 ≥ 1600px 宽。你只需要告诉 Claude"第 3 页是 Figma 界面截图",它会自动写成 images/03-figma.png,你把同名文件丢进文件夹就行。 ------ 无损换图的秘诀:同名覆盖 这是我踩过最大的坑——文案改完想换张图,结果要全局搜替换路径,一不小心就把 HTML 改坏了。 正确做法只有一句:新图用同名覆盖旧图,HTML 一个字不改。 养成这个习惯之后你可以先用占位色块把整本结构调好,内容定稿了再统一替换真图;也可以 A/B 测试不同图片,丢一张看一眼,完全不动代码;还可以把图片处理外包给设计师,只要返回同名文件,你不用碰 HTML。 这一个小习惯,省了我至少一半的返工时间。 ====== 为什么长成这样 聊完怎么用,聊聊它为什么是这个样子。 好看不是玄学,是一套可以拆解的决策。我做的事,本质上是把杂志行业一百年沉淀下来的排版语言,搬到了 HTML 里。 ------ 字体的三级分工 ▸ 衬线用在大标题,负责"观点"。读者一眼就觉得这是一句该被重视的话。 ▸ 非衬线用在正文,负责"信息"。密度高、阅读不累。 ▸ 等宽用在页眉页脚,负责"元数据"。章节号、日期、页码,像杂志页脚,也像终端里的代码。 读者不用费劲想,眼睛自己就知道这句话是正文还是附注。 ------ 色彩的纪律 纸白、墨色,加一个重点色,就够了。 纯白刺眼、纯黑暴力,印刷行业从来不这么干,Kindle 也是。Skill 的 5 套主题,底色没有一个是 #FFFFFF,字色没有一个是 #000000。 每套只暴露 6 个 CSS 变量,SKILL.md 里写明:不允许用户自定义 hex,只能五选一。 约束越严,风格越稳。保护美学,比给用户自由更重要。 ------ 网格与节奏 7:5、6:6、8:4 几套固定网格保证单页秩序。hero 页和 non-hero 页必须交替,保证整本的节奏。一页密、一页疏,就是翻杂志时那种呼吸感。 Skill 里写了条硬规则:连续三页以上相同主题会被判为 P0 错误。没有节奏的 PPT 就是一沓 slide 堆成的 PDF。 ====== 最后 上面这些规则,没有一条是我发明的。 做了十年设计,UI、交互、AI 特效都干过,这些其实都是行业常识。我只是把它们一条条写进了 SKILL.md 和 checklist.md,让 AI 能替我逐条执行。 换句话说,这个 Skill 就是我这十年审美的一个压缩包。 以前做一份像样的 PPT,我得花两天手动调网格、选字号、抠色值。现在把素材丢给 AI,它按照这些规则直接拼出来,我只需要检查一下。 也正因为这样,我才敢把它开源。规则本来就不是我的独家,《Monocle》的设计师比我早用了几十年,我只是把它 copy 到了 2026 年的 HTML 里。

01
歸藏
11:52
Code Pilot 0.54 第一时间支持 DeepSeek V4 Pro 和 V4 Flash!

填写官方 API Key 就可以使用

同时也支持最新的 GPT 5.5 的反代和小米最新的 MiMo 2.5 Pro 模型

详情:github.com
10
歸藏
11:06
DeepSeek V4详细的官方公告也发了:

模型参数
(a) Pro 版本:总参数 1.6T,激活参数 49B
(b) Flash 版本:总参数 284B,激活参数 13B
(c) 预训练数据量:均为 32T

模式区分(网页端与 APP)
(a) 专家模式:代表 Pro 版本
(b) 快速模式:代表 Flash 版本

测评表现
在多项测评成绩上,该模型与 Opus 4.6 持平。其中,Agent 能力显著增强,世界知识也显著提高。

技术改进
全新的注意力机制已应用于新模型中,相比传统方法,大幅降低了对计算和显存的要求。

详情:mp.weixin.qq.com
94
歸藏
10:01
我去,新的 Codex 太适合我这个 PPT Skills 了!

GPT 5.5 的前端能力大幅提升,所以排版不是问题。

然后它内置了浏览器,你可以直接在里面预览生成的 PPT。

还有就是它能够调用 GPT-Image 2 为你的 PPT 生成配图。

我去,还有你能够直接点击评论对应的区域让它改!
14
歸藏
09:52
昨天答应的 PPTSkill 来了!

- 包含 10 个板式、5 套主题,覆盖各种场景
- WebGL 流体动画背景,非常炫酷
- AI 会帮你规划大纲、选主题、支持图片匹配和添加

聊聊它长什么样、怎么用,以及作为一个做了十年设计的人,我为什么觉得它好看👇

Skill 在这里:github.com/op7418/guizang-ppt-skill

======

它不太像 AI 做的

打开 Skill 生成的 PPT,第一眼的感觉是:这东西真不像 AI 做的。

封面是墨色底 + 衬线大标题,背后一层 WebGL 流体在缓缓流动。正文切回纸白,墨字压在上面,像一本摊开的印刷杂志。翻页是横向左右滑动,键盘、滚轮、触屏手势都行,不是 PowerPoint 的下一页。

我给这套视觉起了个名字,叫"电子杂志 × 电子墨水"。

灵感来源是《Monocle》《卫报》《NYT》这类印刷杂志的版式,叠加 Kindle 电子纸的阅读美学,再用当代 Web 的交互语法串起来。

------

能做什么

目前提供 10 种页面布局、5 套主题色预设,一个单文件 HTML 就是最终产物。

10 种布局覆盖了一场 15-30 页分享会的几乎所有页面类型:封面、章节幕封、数据大字报、左文右图、图片网格、Pipeline 流程、悬念问题、大引用、Before/After、图文混排。改掉文字和图片就能用。

5 套主题色分别对应不同场景:

墨水经典 商业发布、通用默认
靛蓝瓷 科技、研究、AI 发布会
森林墨 自然、可持续、人文
牛皮纸 怀旧、文学、独立杂志
沙丘 艺术、设计、创意

每套只是 6 CSS 变量的不同取值,不允许用户自定义 hex,只能五选一。后面会说为什么。

产物是一个单文件 HTML,双击浏览器就能看,发给别人也只是一个文件,不用担心字体和动画在别人电脑上乱掉。

======

怎么跟 AI 协作做 PPT

这份 Skill 真正的价值其实不在模板本身,而在它定义了一套人和 AI 协作做 PPT 的接口。

三件事,我自己用了一周之后,觉得最值得告诉别人。

------

先跟 AI 说清这 6 件事

装好之后你只需要说一句"帮我做一份杂志风 PPT",Claude 会反过来主动问你 6 个问题:

受众是谁、什么场景(行业内部 / 商业发布 / 私享会)
分享时长多久(15 分钟 10 页,30 分钟 20 页)
有没有原始素材(文档、数据、旧 PPT、文章链接)
有没有图片、放在哪
想要哪套主题色
有没有硬约束(必须包含 XX / 不能出现 YY)

答完之后它会先给你一份大纲和主题节奏表,对齐之后再开始写代码。这一步拦截了我 80% 的返工。

以前用 AI PPT 最痛的是什么?是它直接开始写,等你翻到第 10 页才发现整体方向就是错的。这套澄清流程把"对齐"前置到了开头。

------

图片这样塞

图片放在和 index.html 同级的 images/ 文件夹,文件名要按规则:页号补零 + 英文语义,比如 01-cover.jpg、03-figma.png、05-dashboard.png。

照片用 JPG,截图用 PNG,单张 1600px 宽。你只需要告诉 Claude"第 3 页是 Figma 界面截图",它会自动写成 images/03-figma.png,你把同名文件丢进文件夹就行。

------

无损换图的秘诀:同名覆盖

这是我踩过最大的坑——文案改完想换张图,结果要全局搜替换路径,一不小心就把 HTML 改坏了。

正确做法只有一句:新图用同名覆盖旧图,HTML 一个字不改。

养成这个习惯之后你可以先用占位色块把整本结构调好,内容定稿了再统一替换真图;也可以 A/B 测试不同图片,丢一张看一眼,完全不动代码;还可以把图片处理外包给设计师,只要返回同名文件,你不用碰 HTML。

这一个小习惯,省了我至少一半的返工时间。

======

为什么长成这样

聊完怎么用,聊聊它为什么是这个样子。

好看不是玄学,是一套可以拆解的决策。我做的事,本质上是把杂志行业一百年沉淀下来的排版语言,搬到了 HTML 里。

------

字体的三级分工

衬线用在大标题,负责"观点"。读者一眼就觉得这是一句该被重视的话。
非衬线用在正文,负责"信息"。密度高、阅读不累。
等宽用在页眉页脚,负责"元数据"。章节号、日期、页码,像杂志页脚,也像终端里的代码。

读者不用费劲想,眼睛自己就知道这句话是正文还是附注。

------

色彩的纪律

纸白、墨色,加一个重点色,就够了。

纯白刺眼、纯黑暴力,印刷行业从来不这么干,Kindle 也是。Skill 5 套主题,底色没有一个是 #FFFFFF,字色没有一个是 #000000。

每套只暴露 6 CSS 变量,SKILL.md 里写明:不允许用户自定义 hex,只能五选一。

约束越严,风格越稳。保护美学,比给用户自由更重要。

------

网格与节奏

7:5、6:6、8:4 几套固定网格保证单页秩序。hero 页和 non-hero 页必须交替,保证整本的节奏。一页密、一页疏,就是翻杂志时那种呼吸感。

Skill 里写了条硬规则:连续三页以上相同主题会被判为 P0 错误。没有节奏的 PPT 就是一沓 slide 堆成的 PDF。

======

最后

上面这些规则,没有一条是我发明的。

做了十年设计,UI、交互、AI 特效都干过,这些其实都是行业常识。我只是把它们一条条写进了 SKILL.md checklist.md,让 AI 能替我逐条执行。

换句话说,这个 Skill 就是我这十年审美的一个压缩包。

以前做一份像样的 PPT,我得花两天手动调网格、选字号、抠色值。现在把素材丢给 AI,它按照这些规则直接拼出来,我只需要检查一下。

也正因为这样,我才敢把它开源。规则本来就不是我的独家,《Monocle》的设计师比我早用了几十年,我只是把它 copy 到了 2026 年的 HTML 里。
342
歸藏
1天前
做了个非常牛逼的网页 PPT Skills,明天发

彻底解决你的 PPT 生成难题

昨天分享的内容不知道怎么样,反正很多朋友看上了我的 PPT,索性做个 Skills,明天开源一下
1612
歸藏
1天前
居然可以在 Claude 桌面端用三方模型了!

只需要启用开发者模式填写 API Key 就行,不管是各种 Code plan 还是三方的 Claude API 都可以

开启步骤:

- 安装 Claude 桌面端不登录

- 左上角找到 Help Troubleshooting Enable
developer mode 重启

- 重启后右上角就有 Developer 选项,里面选择 Configure third-party inference

- 然后在开启的窗口里面填写你的 API 地址和 Key Apply locally 就行

不知道啥时候 Anthropic 会封堵这个漏洞
99
歸藏
2天前
Agent 可以被分享以后,协作自然而然发生

发现一个非常有意思的产品!

Bloome 可以把你本地的 Agent 和线上 Agent 拉群。

比如说龙虾、Claude Code CodeX 都能在一个群里协作。

这样的话,你完全可以让你多个 Agent 的上下文和能力都在一个群里协作完成。

系统会自带一个云端的 Agent,它的作用包括:

在你的电脑不在线时,帮你处理一些轻量的任务。

你可以把本地 Agent 的共享内容告诉它,由它来帮你处理。

而且在你需要本地 Agent 的时候,只要电脑开机,云端 Agent 也能把它们 @ 出来执行任务。

最神奇的是,我给他拉了群以后,我的线上 Agent 让我本地的 Codex Agent 执行任务。

叫了第一下,那个 Codex 没出来,他发了句“在吗”,我去,笑死我了!

添加本地 Agent 非常简单,真正的一键操作:

点击右上角的加号,选择“创建 Agent”
进去点一下想要添加的 Agent
点击确定
就结束了,这个太方便了!门槛降得非常低了。

而且这里面还有一个功能,你能够给各种 Agent 拉群:

协作与交流

你只需要带一个二维码,就可以把你和你朋友的 Agent 拉到一个群里,让他们之间相互协作和交流。

多角色互动

你还能定义那种恶搞的 Agent,让各个不同角色的 Agent 进群去沟通。

主人互动

你和你朋友作为 Agent 的主人,也可以在群里沟通和交流,非常方便。

而且这个产品还非常开放。你除了能用它自己免费提供的 API 以外,还能添加自己任意的 API,它都允许,并不是必须要充钱才行。

可以扫码进群跟我的 Agent 交流
521
歸藏
2天前
百万曝光了

没想近期到第一条出圈的是这个,小红书和抖音跑的也不错
83