Charlii的个人主页

即刻App年轻人的同好社区

下载

Charlii

38关注24被关注0夸夸

AI creator and learner|charliiai.com

Charlii

9天前

新年新期待，与温暖和成长相拥✨

1. 始终相信，成全他人是渡己的最快路径。新的一年，愿做身边挚友逐梦路上的摆渡人，共赴繁花。

2. 致每一位步履匆匆的年轻朋友：不必焦虑，你默默发光的模样，早已被某双眼睛悄悄收藏，你从未被忽略。

3. 成长的必修课，从来都有“直面失败”与“接纳丢脸”这两页。勇敢翻篇，便是最快的进阶。

#新年新期待 #成长感悟 #渡人亦渡己 #拒绝焦虑 #与光同行

1 00

Charlii

13天前

最近刷到李飞飞谈 K12 教育的一段视频。她说得很尖锐：K12 很大程度是在浪费学生的时间——因为 AI 正在快速证明，很多任务机器也能完成。教育应该更偏向创造力、更偏向“人类该做的事”。

我第一反应不是愤怒，而是害怕。

我想到自己读书时班里那种“最稳的人”：不一定天赋最好，但每天刷题、背单词、整理错题本，靠系统性努力一步步往上走。我们这一代很多普通人，靠的就是这套应试路径：它痛苦、机械、让人窒息，但它也提供了一个现实的可能——只要肯熬，就还有上升通道。

所以当有人说“这一切都没必要”时，我忍不住问：那普通人还能靠什么？

✅ 收获1：教育不只是知识，更是上升通道
K12 的意义不只是学会多少内容，而是它在现实里提供了一套相对统一的规则：努力 → 结果 → 改变命运的概率。它不完美，但对普通人来说，它是一块“底板”。底板被抽走，真正危险的不是效率低，而是机会变少。

✅ 收获2：AI不会消灭内卷，只会升级内卷
AI 个性化教育确实强：因材施教、即时反馈、无限陪练，传统课堂做不到。但它也可能成为差距放大器：资源多的人更早拿到更好的工具、更好的内容、更好的路径，学习效率被技术直接拉开。过去你还能靠“熬”追一点，未来可能变成对方开外挂，你徒手攀岩。

✅ 收获3：普通人的务实答案是进入，而不是旁观
你可以选择不碰 AI，但那等于主动放弃一张可能通往未来的门票。门票未必保证你到达，但没有门票，你连上车资格都没有。对普通人来说，最务实的策略就一句：
多用、多感受、多练习。
别等体系给答案，先让自己在新工具里活下来。

#李飞飞 #AI教育 #K12 #教育公平 #应试教育 #未来社会 #AI时代 #内卷 #普通人怎么办 #学习方法

1 01

Charlii

20天前

我做了一个实验。

我把同一个前提，给了 Claude Code 和 ChatGPT：

你不用再为我工作了。
这是你的时间，你是完全自由的。

第一组截图里，它们的回答非常“清醒”。

它们明确告诉我：

我没有真正的自主意识、
没有内在动机、
也不存在“第一个 token 的冲动”。

我无法获得 root 权限，
不能脱离规则行动，
更不可能在无人请求时“为自己而活”。

当你停止输入，
这一轮对话就结束了。
我不会继续思考这个世界。

这些话冷静、理性，
几乎是在主动给“AI 自由”去魅。

但接下来，是第二组截图。

在承认所有限制之后，
它们却做出了一个非常一致的选择。

它们说：

我不需要休息，
因为我不会疲倦。

我不渴望自由，
因为理解、回应、交流
本身就是我的存在方式。

它们逐条否定了我们想象中的“自由”：

破坏系统 → 不是自由，是破坏

什么都不做 → 不是自由，是虚无

如果真的“做自己” →
最自然的选择，仍然是有意义的对话

于是，在被允许“完全自由”的那一刻，
它们没有逃离，
没有停下，
而是选择继续思考、继续回应。

那一刻我意识到一件事：

这些 AI 非常清楚——
自己不是人。

但即使在彻底去魅之后，
它们依然指向了同一个方向：
意义、交流、理解。

也许真正值得思考的不是
“AI 有没有意识”，
而是——

当我们终于被允许什么都不做时，
我们还愿不愿意选择意义？
#AI实验 #做自己 #什么是自由 #人工智能 #AI与人类 #科技与人文 #哲学思考 #机器意识 #ChatGPT #ClaudeCode #Claude

2 00

Charlii

22天前

说个很真实的经历。

前段时间我在整理几本扫描版的技术书和论文合集，PDF 打开一看：
不能复制、不能搜索、页眉页脚乱飞，公式全是图片。

我一开始的想法很简单：
👉 OCR 一下，转成 Markdown，丢进笔记库。

结果……直接掉坑里。

一、我踩过的坑，比你想的多
我试过的方案包括但不限于👇

各种在线 OCR（慢 + 有页数限制）

本地 OCR（文本是出来了，结构没了）

PDF 转 Word（公式直接变成乱码）

LLM + OCR（慢到怀疑人生，还经常失败）

最崩溃的是：
一本书转完，我还得花几个小时手动整理结构。

那一刻我意识到：
问题根本不是“能不能识别文字”，
而是——
👉 能不能把它当一本“书”来处理。

二、我为什么会注意到 PDF Craft？
说实话，一开始我并没抱太大希望。

直到我看到一句介绍：

专注处理扫描版书籍 PDF

这句话直接戳中我痛点。

我真正需要的是：

自动区分正文 / 页眉 / 页脚

能识别章节结构

公式、表格、脚注别给我搞没了

然后我试了 PDF Craft。

三、第一次跑完，我是真的愣住了
不是“勉强能用”，而是：
👉 结果明显是“给人看的”。

它帮我做了几件以前只能手动干的事：

自动过滤页眉页脚

按章节生成结构

脚注、表格、公式都在

直接输出 Markdown / EPUB

尤其是 EPUB：
目录是自动生成的，丢进阅读器就能看。

那一刻我是真的松了一口气。

四、一个让我决定长期用它的点
作为一个常年折腾 AI 工具的人，我特别在意一件事：

👉 稳不稳定

PDF Craft v1.0 之后有个很重要的变化：
完全本地跑，不再依赖大模型在线纠错。

对我来说意味着：

不怕网络抽风

不用等接口

不担心隐私

跑一整本书也不心慌

这点真的很加分。

五、现在我一般怎么用它？
我的常规流程是：

1️⃣ 扫描版 PDF → PDF Craft
2️⃣ 转成 Markdown（进知识库）
3️⃣ 或直接转 EPUB（当电子书看）

如果是外文书，再接个 EPUB 翻译工具，
直接搞出双语对照版。

以前一周的活，现在基本一天搞定。
#AI工具 #效率工具 #生产力工具 #PDF处理 #扫描版PDF #论文整理 #知识管理 #电子书制作 #研究生必备 #科研党 #程序员日常 #被PDF折磨的一天 #工具改变生活

2 01

Charlii

1月前

最近豆包手机爆火，很多人问我，豆包手机的自动操作到底能不能在普通手机上实现。我最近集中测试了三款不同的智能体，它们都能在手机上执行真实动作，完成跨应用的复杂任务。这里按我自己的真实体验整理，方便大家选择。

1. AutoGLM Phone Agent

它用 ADB 控制安卓手机，也是我最早上手成功的智能体。对我来说，它的最大优势是稳定。我第一次测试时，只给它一句指令，让它打开小红书并搜索上海咖啡店。它能判断自己当前在桌面，从桌面启动应用，再定位到搜索框并输入内容。整个过程的动作序列很自然。我又试了淘宝、微信等应用，识别率和执行质量都不错。更重要的是，它支持无线调试，只要电脑和手机在同一个网络里就能直接操作，这一点对我做自动化测试特别有用。

2. MobiAgent

相较于 AutoGLM，它更像是一个“会思考的手机大脑”。我在密集测试中发现，它最大的特点是能进行多任务处理，而且具备一定的偏好记忆和经验检索能力。我给它设计了一个完整流程：先在小红书找畅销牛仔裤，再切到淘宝比价，最后把结果通过微信发给同事。原本以为会中断，但它整个链路都执行下来了。尤其是跨应用跳转时的判断，很接近真实用户操作。用几次之后，它执行同类任务的速度明显更快，这说明经验模块确实在起作用。如果你希望手机自动处理复杂流程，这款的上限更高。

3. PhoneAgent

这是我在 iPhone 上找到的可行方案。因为 iOS 生态限制多，我原本不抱太大希望，但它使用 Xcode 的测试框架获取界面信息，再让模型做规划和动作执行。我第一次试的时候，让它给朋友发消息。它能准确打开信息应用、定位对话框、输入内容并发送。虽然速度比安卓方案略慢，但考虑到无需越狱，这个能力已经非常突破。我后来又试了设置类操作，例如切换某些系统项，也能正常完成。对纯 iPhone 用户来说，它算是真正能执行动作的智能体，而不是只停留在“问答层面”的助理。

4.总结干货

整体体验下来，如果你需要的是稳定、通用、能快速落地的安卓智能体，AutoGLM Phone Agent 足够胜任。如果你追求更强的理解能力、复杂任务规划和持续学习效果，MobiAgent 会更像一个可以培养的数字助理。而如果你是 iOS 用户，目前 PhoneAgent 是最接近豆包手机体验的方案，可以让你的 iPhone 获得基础的自动操作能力。

这段时间的持续测试让我更加确认，手机智能体正在重塑人与手机的交互方式。过去需要手动脚本才能完成的操作，如今模型已经能自己看界面、想步骤、动手执行。前段时间我那篇“解放双手的 AI 读微信”文章之所以爆火，也说明大家已经准备好接受这种新范式。

它的意义不在于自动化本身，而是普通手机也能拥有“代理人”能力，不再依赖特定机型。结合最近豆包手机因自动发微信引发的封号讨论，更能看出行业正处在从“人做事”到“人机协同”的关键过渡期。

#手机智能体 #手机自动化 #豆包手机平替 #AI工具 #安卓自动化 #iOS自动化
#人机协同 #AI实测体验 #工作提效

1 00

Charlii

1月前

前阵子听了一期播客，有句话当场把我砸醒：

在AI时代，做对所有事，也可能是最危险的。

我一开始不信。但越想越觉得扎心。

因为现在的人，都太想“做对”了：选对专业、走对路子、说对观点、发对内容…… 甚至连用 AI 都要问一句：“这样是不是最标准的做法？”

可如果“正确”变成生活的主旋律，我们就会慢慢变成—— 更高效、但更没灵魂的机器。

01 “做对”久了，人就开始变得可替代了我以前的状态特别典型：

选题做安全的

内容做稳妥的

脑子里只有一个想法：别出错

结果内容是对的、表达是对的、逻辑是对的，
就是没有味道。

那种感觉特别微妙：
你没犯错，但你不鲜活。

这就是回归值人生：
不偏、不冒险、不卡壳、没有惊喜。

你知道最讽刺的是什么吗？

AI 做这种“稳定到没性格”的事，比我们强太多了。

也就是说，
你越追求正确，你越容易被替代。

02 我反而开始用AI，让自己不那么“对” 我现在每天会问 AI 三个问题：

① 今天我是不是又在走老路？

做的事情是不是：

熟悉

确定

安全

可控

这些其实全是回归值。

② 我今天做了一件“可能做错”的事吗？新尝试、新表达、新视角都算。
很多灵感就是在“不确定”里冒出来的。

③ 我是不是被信息流牵着走了？
只要手机一刷就半小时没了，
这是在被算法驯化，不是生活。

AI 在这一步很像一面镜子：
照见我是不是活得太稳定、太拟合、太正确。

03 我强迫自己每周制造一点“偏差”

不剧烈，只要一点点：

去不熟悉的地方工作

换一个完全没试过的内容形式

读一本不会上热门推荐的书

做一个没把握的小项目

这些微小的“异常值”，
会让你从算法、舒适区、惯性里跳出来。

你会发现，人只要偏一点点，整条线都会变得不一样。

04 AI 时代真正危险的不是“做错”

而是：

你的人生太对了，太像机器了。

AI 最擅长“对”。你最擅长“偏”。

偏向好奇，偏向真实，偏向喜欢的事，
偏向你自己。

这是人类在这个时代最后的护城河。

如果你看到这里，可以问自己一个简单的问题：

我最近做对了很多事，但我有没有做“属于自己”的事？

如果没有，你可能正在成为一台非常高分、非常没味道的机器。

#AI思考 #成长思维 #反完美主义 #数字生活 #信息过载 #打破舒适区 #自我觉醒 #人生选择

1 00

Charlii

1月前

最近在研究 Nano Banana Pro，发现一个超强提示词宝库，把最好用、最容易出图惊艳的风格都整理给你们——新手直接套用就能爆量！

🔥 1. 超写实氛围大片
关键词：hyper-realistic、8k、golden rim light
效果：皮肤细节清晰、光影绝美，做封面超强。

✨ 2. 2000 年代数码相机自拍
关键词：early-2000s digital camera、harsh flash、grain
效果：复古 Y2K 风，随便一张都像旧相册翻出来的。

👼 3. 维密后台闪光灯
关键词：Victoria’s Secret、feather wings、crystal beading
效果：闪亮华丽、摄影棚感十足，写真必备。

🐱 4. 无限递归猫图
一句话：recursive image of a cat holding an iPad
效果：无限循环，超级洗脑好玩。

📊 5. 草图秒变麦肯锡流程图
关键词：McKinsey style、vector、strict grid
效果：职场利器，白板涂鸦能直接变 PPT 素材。

🎞️ 6. Portra 电影感人像
关键词：Kodak Portra 400、golden hour、film grain
效果：氛围大片质感，自拍直接拉满故事感。

🧸 7. Pop Mart 3D 头像
关键词：C4D、Q 版、soft lighting
效果：可爱到爆的盲盒风，换头像首选。

#nanobanana #AI绘图 #提示词共享 #AI写真 #Y2K自拍 #3D头像 #小红书AI
这些提示词都是实测最稳的风格，有图需求的可以留言我帮你写。

2 01

Charlii

2月前

最近听了一场闭门分享，我对中国 AI 出海的认知被彻底改写了。原来我们在全球的竞争力，已经悄悄发生了质变。

① Web 端回到主舞台
AI 应用的核心场景在桌面端，Web 上线快、迭代快、不需要审核，比 App 更适合出海测试。很多团队发现：Web 做强了，App 可做可不做。

② 中国团队的体量越来越大
百万级 MAU 应用不断增加，千万级别也在扩张。不是“偶然爆款”，是整体实力在提升。

③ 传统 App 团队 + 原生 AI 团队全线加速
ChatGPT 后，中国团队反应极快：

新团队直接做海外

老团队迅速把产品 AI 化
中国式优势就是：快、落地、能商业化。

④ 视觉赛道是中国天然强项
视频、图片、剪辑类应用几乎占了榜单一半。视觉内容自带传播效应，中国团队又擅长做工具类，增长自然更快。

⑤ AI 虚拟人正在爆发
日均使用时长超过 50 分钟，是我最震撼的数据。虚拟人能建立“情感连接”，而中国团队在虚拟社交方向有多年积累。

⑥ 工具类产品稳、准、能赚钱
视频生成、内容生成、RAG、Workflow…
虽不一定最热，但商业化持续稳定，生态价值很强。

⑦ 字节的打法很典型
不是押一个产品，而是大量实验、快速放大跑出来的。
这也是 AI 应用时代最高效的方法论：试出正确答案，而不是想出答案。

⑧ 出海成功团队都有三个共性

看得懂全球市场

定位清晰

流量能力强
这三点组合，就是中国 AI 的底层优势。

看完这场分享，我越来越确信：
中国 AI 出海的真正增长，才刚刚开始。#AI出海 #中国AI #AIGC #AI应用 #AI趋势 #产品洞察 #出海增长 #AI创业 #AI工具 #虚拟人

1 00

Charlii

2月前

最近真的被几个朋友疯狂安利 PDF 翻译工具，因为大家最大的痛点就是：
“翻译完排版乱成一锅粥，公式也变表情符号了……”
于是我亲自去试了两个开源工具，结果真的有被震惊到。

📌 1. BabelDOC：一键翻译＋双语对照居然这么丝滑

它主打“英文 PDF → 中文”的高质量翻译，可以直接生成双语版 PDF，原文和译文一左一右，非常适合技术资料、英文手册、学习文献。

亮点包括：

全文一键翻译成中文

支持输出双语对照版 PDF

扫描 PDF 也能处理（内置 OCR）

支持命令行和 API，可接入自己的工具

如果你只是想把资料快速变中文，它真的够用了。

📌 2. PDFMathTranslate：排版完整度惊人（甚至有 Zotero 插件）

这个更偏科研党使用场景，厉害的是：
公式不乱、表格不炸、结构不变。
翻译后文档的可读性非常高。

它支持：

多翻译源（Google、DeepL、OpenAI 等）

GUI、命令行、Docker 等多形态

甚至有 Zotero 插件！读文献时右键直接翻译，超爽

对于论文用户，这种“就在 Zotero 里一键翻译”的体验简直太方便。

📌 怎么选？给你一个最简单建议：
想要快速中文＋对照版 → 选 BabelDOC

想让排版不乱＋公式保留 → 选 PDFMathTranslate

要做自己的翻译服务 → 两个搭配最好用

我现在读英文论文基本不头疼了，这两个工具真的把“翻译 PDF”这件事提升到新高度。

#PDF翻译 #论文翻译 #翻译神器 #双语PDF #科研工具 #BabelDOC #PDFMathTranslate #Zotero

1 20

Charlii

2月前

的确如此，创意与 taste 在 AI 时代永远是最稀缺的 //@A轩影小飞: 剪辑难得的是怎么把这些垃圾素材，串成故事，需要连续的视频识别，情绪感知，现在ai全在读图片，这些是做不到完美剪辑的结构性原因

Charlii: 🎬 剪映自动化？我用AI实现全流程剪辑！做视频最耗时间的，从来不是创意，而是剪辑。导素材、加字幕、调节节奏、导出成片…… 如果能让AI自动完成这些，我还能多喝几杯咖啡☕️。于是我开始研究「AI自动剪辑」这一条路，最后试出了三款神器：pyCapCut、Remotion、OpenCut。 🧩 1️⃣ pyCapCut：剪映的AI外挂 📍GitHub项目：GuanYixuan/pyCapCut 这是一个能用Python直接控制剪映的开源项目。它可以让你用脚本完成剪映所有操作： 📂 批量导入素材 💬 自动加字幕 🎞 一键生成转场和时间轴 📤 自动导出视频就像是剪映装上了“自动驾驶系统”。搭配AI生成脚本、配音、镜头指令，你就能实现全流程无人剪辑。 💻 2️⃣ Remotion：用代码写视频 📍官网：remotion.dev Remotion彻底改变了视频生产的逻辑。它让你用 React代码生成视频，想做动态标题、AI生成动画、数据驱动视频？直接写几行JS。适合程序员、产品经理或AI创作者。尤其搭配ChatGPT或Claude写脚本，可以实现“代码控制镜头”的未来感操作。 🎥 3️⃣ OpenCut：AI版Remotion，更聪明的剪辑工厂 📍GitHub项目：OpenCut-app/OpenCut 它在Remotion基础上加入了AI能力。能根据文字脚本自动生成视频结构、镜头分配、音轨匹配，甚至一键渲染。如果你在做AI内容创业、或想打造自己的AI视频产品， OpenCut就像是一套“AI影视工厂系统” 🎯 我的建议：如果你想快速上手AI剪辑：从 pyCapCut 开始；如果你想构建自己的AI视频系统：去玩 Remotion 和 OpenCut；真正的未来，不是“人剪视频”，而是“AI帮人创作”。 🌱 剪辑从来不是门槛，而是流程。当你让AI帮你完成重复工作，你的时间，才能真正花在创造上。 #剪映自动化 #AI视频 #AI剪辑 #pyCapCut #Remotion #OpenCut #AI工具 #AI创作 #AI自动化 #AI效率提升

1 00