即刻App年轻人的同好社区
下载
App内打开
Charlii
36关注21被关注0夸夸
AI creator and learner|charliiai.com
Charlii
1天前
最近真的被几个朋友疯狂安利 PDF 翻译工具,因为大家最大的痛点就是:
“翻译完排版乱成一锅粥,公式也变表情符号了……”
于是我亲自去试了两个开源工具,结果真的有被震惊到。

📌 1. BabelDOC:一键翻译+双语对照居然这么丝滑

它主打“英文 PDF 中文”的高质量翻译,可以直接生成双语版 PDF,原文和译文一左一右,非常适合技术资料、英文手册、学习文献。

亮点包括:

全文一键翻译成中文

支持输出双语对照版 PDF

扫描 PDF 也能处理(内置 OCR)

支持命令行和 API,可接入自己的工具

如果你只是想把资料快速变中文,它真的够用了。

📌 2. PDFMathTranslate:排版完整度惊人(甚至有 Zotero 插件)

这个更偏科研党使用场景,厉害的是:
公式不乱、表格不炸、结构不变。
翻译后文档的可读性非常高。

它支持:

多翻译源(Google、DeepL、OpenAI 等)

GUI、命令行、Docker 等多形态

甚至有 Zotero 插件!读文献时右键直接翻译,超爽

对于论文用户,这种“就在 Zotero 里一键翻译”的体验简直太方便。

📌 怎么选?给你一个最简单建议:
想要快速中文+对照版 BabelDOC

想让排版不乱+公式保留 PDFMathTranslate

要做自己的翻译服务 两个搭配最好用

我现在读英文论文基本不头疼了,这两个工具真的把“翻译 PDF”这件事提升到新高度。

#PDF翻译 #论文翻译 #翻译神器 #双语PDF #科研工具 #BabelDOC #PDFMathTranslate #Zotero
00
Charlii
1天前
的确如此,创意与 taste 在 AI 时代 永远是最稀缺的 //@A轩影小飞: 剪辑难得的是怎么把这些垃圾素材,串成故事,需要连续的视频识别,情绪感知,现在ai全在读图片,这些是做不到完美剪辑的结构性原因

Charlii: 🎬 剪映自动化?我用AI实现全流程剪辑! 做视频最耗时间的,从来不是创意,而是剪辑。 导素材、加字幕、调节节奏、导出成片…… 如果能让AI自动完成这些,我还能多喝几杯咖啡☕️。 于是我开始研究「AI自动剪辑」这一条路, 最后试出了三款神器:pyCapCut、Remotion、OpenCut。 🧩 1️⃣ pyCapCut:剪映的AI外挂 📍GitHub项目:GuanYixuan/pyCapCut 这是一个能用Python直接控制剪映的开源项目。 它可以让你用脚本完成剪映所有操作: 📂 批量导入素材 💬 自动加字幕 🎞 一键生成转场和时间轴 📤 自动导出视频 就像是剪映装上了“自动驾驶系统”。 搭配AI生成脚本、配音、镜头指令,你就能实现全流程无人剪辑。 💻 2️⃣ Remotion:用代码写视频 📍官网:remotion.dev Remotion彻底改变了视频生产的逻辑。 它让你用 React代码生成视频, 想做动态标题、AI生成动画、数据驱动视频?直接写几行JS。 适合程序员、产品经理或AI创作者。 尤其搭配ChatGPT或Claude写脚本, 可以实现“代码控制镜头”的未来感操作。 🎥 3️⃣ OpenCut:AI版Remotion,更聪明的剪辑工厂 📍GitHub项目:OpenCut-app/OpenCut 它在Remotion基础上加入了AI能力。 能根据文字脚本自动生成视频结构、镜头分配、音轨匹配, 甚至一键渲染。 如果你在做AI内容创业、或想打造自己的AI视频产品, OpenCut就像是一套“AI影视工厂系统” 🎯 我的建议: 如果你想快速上手AI剪辑:从 pyCapCut 开始; 如果你想构建自己的AI视频系统:去玩 Remotion 和 OpenCut; 真正的未来,不是“人剪视频”,而是“AI帮人创作”。 🌱 剪辑从来不是门槛,而是流程。 当你让AI帮你完成重复工作, 你的时间,才能真正花在创造上。 #剪映自动化 #AI视频 #AI剪辑 #pyCapCut #Remotion #OpenCut #AI工具 #AI创作 #AI自动化 #AI效率提升

00
Charlii
4天前
互联网的脆弱,远超你想象…

大家好,我是 AI 博主 Charlii。

昨天你是不是也遇到这种情况:
👉 页面卡住
👉 登录失败
👉 网站转圈转到怀疑人生

不是你网坏了。
Cloudflare 故障导致全球大面积宕机。
而最让我震惊的是:
罪魁祸首竟然是一个小小的系统变更。

🫧 互联网的大厦,有时会被“蝴蝶效应”击倒

Cloudflare 是全球最大的网络基础设施服务之一。
它一旦出问题,成千上万个网站瞬间停摆。

但这次事故并不是黑客攻击、不是大规模故障,
而是一次看似普通的权限调整:
工程师给数据库加了个“更细粒度的表权限显示”,
结果一个查询没指定数据库名,
导致本来只返回一份数据 突然变成两份。

这份数据又会被自动打包成“特征文件”,
在反爬虫系统里用来判断“是不是机器人”。

文件变大 超过固定上限 模块直接崩了。
更要命的是:
这个文件每 5 分钟自动下发一次,全网同步。

于是互联网开始“心跳骤停”:
5 分钟好一次,5 分钟坏一次。
像在坐过山车。

工程师一开始甚至以为遭遇了超大规模 DDoS 攻击。

⚠️ 那几个小时,全世界的网络都在发抖

这次故障影响范围极其广:

CDN 服务大量报 500 错误

Turnstile 验证挂了,很多人登录不了

Workers KV 出现大量异常

Access 身份验证失败

邮件安全部分功能下线

甚至旧版本代理系统虽然没直接报错,
但所有流量突然被判定为“机器人”,
直接把无辜用户拦在门外。

短短 3 个小时,互联网的稳定性被撕开了一条口子。

🌪️ 对我触动最大的,是互联网的“脆弱”

我们习惯了:

网页随时能打开

视频随时能播

支付随时能走

登录随时能成功

但背后其实是:

几十万个服务同时协作、链条超长、依赖极多,
其中任何一个环节出现一个 tiny 变更,
都可能触发蝴蝶效应。

我们以为互联网坚不可摧,
但其实它脆弱得像玻璃——
宏大,却依靠无数细小碎片才拼成完整。

💡 这件事让我重新认识了三个事实:
1️⃣ 稳定是最昂贵的奢侈品

我们觉得“正常”是理所当然的,
但那是无数工程师、架构师的努力撑出来的。

2️⃣ 越依赖网络,我们越需要理解它

不是让你学技术,而是理解:
数字世界同样有风险、脆弱性和极限。

3️⃣ 小改动,也能改变世界

一个查询少写了一个字段,
影响的却是全球数十亿用户的互联网体验。

复杂系统里,永远没有“无足轻重”的改动。

🤍 最后,我想问你:

昨天宕机,你的第一反应是什么?
你有没有因此突然意识到:
数字世界看似稳固,其实一直在被人类拿命维护。

如果你想继续看我拆解:
📌 数字时代的危机
📌 AI 世界的 Bug
📌 科技背后的故事

欢迎点个收藏,我会继续和你一起看懂这个世界。

#Cloudflare #网络宕机 #技术热点 #AI博主Charlii #数字时代 #互联网的脆弱 #工程师日常 #科技科普 #复杂系统 #热点解读 #今日份分享 #冷知识 #数字焦虑 #科技思考 #互联网安全
00
Charlii
5天前
我为什么开始研究截图 API?

AI 技术内容久了,会进入一个状态:写教程要截图、做自动化要截图、跑监控要截图。
我最痛苦的一次,是为了示例图连续重截五小时——不是比例怪,就是清晰度糟,还经常加载不全。

那一刻我意识到:
技术内容能不能高效产出,取决于截图工具选得对不对。

于是我开始系统测试三类方案:Cloudflare Screenshot API、Microlink Screenshot、Headless-try(无头浏览器)。
下面是踩坑后的真实总结。

01|追求“稳定可控”:Cloudflare Screenshot API

我做 SSR 性能教程时,各种 API 截出来不是半截样式就是半截空白,但 Cloudflare 始终稳定。
优势在于:

支持全页 & 指定元素截图

可注入 JS/CSS

可调 viewport、deviceScaleFactor

基础设施稳,适合长期跑

如果你需要高清、干净、可控的截图,它是最专业的选择。

02|追求“最快产出”:Microlink Screenshot

赶内容的时候,我只需要一句话:快点给我一张图。
Microlink 就是为这种场景设计的:

URL 即可

几乎零配置

十几秒搞定

适合博客封面、预览图、轻量内容制作。

03|要处理“复杂流程”:Headless-try(无头浏览器)

有些页面必须:

登录

点击

等待渲染

托管服务都搞不定。
无头浏览器的好处是:你可以完全控制页面行为,模拟任意交互,适合自动化测试与复杂任务。

最简单的选型逻辑

别从技术开始想,从需求开始想:

想简单 Microlink

想稳定 Cloudflare

要交互 Headless-try

这套逻辑至今帮我节省了大量时间,也让内容产出效率提升数倍。

希望你能少踩我踩过的坑。

#AI博主charlii #截图API #Cloudflare #Microlink #无头浏览器 #技术工具拆解
00
Charlii
6天前
这两年研究 AI,我发现一件特别有意思的事:

身边那些突然变厉害的人,并不是努力到极致,而是他们的“世界模型”突然升级了。

成长不是慢慢变强,
而是突然跳到一个新版本——
就像 GPT-4 横空出现的那一刻。

💡真正的差距,不是努力,而是“抽象层级”

我把身边人分成三种“版本”:

🧩 1)任务型:只会解决眼前问题
像早期 GPT,你问啥答啥。

🧩 2)系统型:开始构建规模化方案
已经带点 Agent 的影子,
不是“做事”,而是让“事情自己发生”。

🧩 3)高维型:直接重写规则
他们不会问如何赚钱,而是问:

能不能改变一群人的习惯?

能不能重塑一个行业?

能不能让世界按另一种秩序运行?

这就是“抽象层级”的差别。

🔍 那些身边的“突然开悟者”,本质是模型升级

你会发现,他们:

看问题的角度突然高了

情绪稳定得像换了芯片

判断快到让人跟不上

原来纠结的事,现在根本不在他们的认知里

不是变聪明了,
是看见了更高维度的世界。

✨如果你正在迷茫,请记住:

你缺的不是更多努力,
也不是更多资源。
你缺的,是一次——
认知维度的跃迁。

当它发生时,你会像那几个“突然开悟的身边人”一样:
指数级成长。


#AI博主 #认知跃迁 #抽象思维 #成长进阶 #思维升级 #人生进化论 #AI视角 #普通人的爆发点 #成长焦虑 #自我提升日记 #认知觉醒 #高维思考 #小红书成长类
01
Charlii
6天前
谢谢!❤️ //@叔本华分华: 这种排版看起来好干净

Charlii: 以前我练演讲,总是卡: ❌ 不敢开口 ❌ 一紧张就语无伦次 ❌ 不知道怎么组织语言 ❌ 练了很久还是没感觉进步 直到我用“AI 苏格拉底式演讲教练”—— 那一刻我才发现:不是我学不会,是我一直在用“死记硬背式”的错误方法。 🎤 AI 演讲教练最厉害的不是教你,而是“逼你思考” 我让 AI 扮演演讲教练,它不会直接给我一堆讲稿或套路,而是: ① 用苏格拉底式提问逼我想清楚自己在讲什么 比如它会问我: “你这句话的核心观点是什么?” “听众为什么要听你说?” “如果只留一句话,你希望他们记住什么?” “能不能给我一个具体例子?” 这种提问方式非常恐怖(但非常有效)。 它不是灌输,是逼你“真正理解”。 而演讲最怕的就是: 你自己都没讲明白,别人怎么听懂? ⚡ ② 即时反馈:讲不好,它立刻指出问题 我说一句,它就给一句反馈: “这句话太长了” “情绪太平,可以再有点能量” “逻辑跳跃,再加个过渡” “例子太抽象,换个具体点的” 最关键的是: 卡住了,它会换个角度再解释给我,直到我真的懂 不懂 → 换语言 不懂 → 换例子 不懂 → 换场景 不懂 → 直接示范 这才是真正的“私人教练”。 🔧 ③ 每个概念都有“实战练习”,练一次就能明显变好 比如学“开场吸引力”,它会让我: 用一句话介绍主题 给两个版本:普通版 & 吸引版 它立刻批改并告诉我差在哪 学“逻辑结构”,它会让我: 用 30 秒讲一个观点 用“金字塔结构”重讲一次 给我打分、改进建议 这种“讲 → 被纠正 → 再讲 → 提升”的循环 是演讲提升最快的方式。 ⏱️ 最夸张的是:15 分钟就能看到明显进步 是那种你自己都能听出来差别的进步: ✨ 更有逻辑 ✨ 停顿自然 ✨ 不再乱说话 ✨ 思路更清晰 ✨ 能现场组织语言 真的是“当场见效”的那种。 🎯 想要我用的这段“AI 苏格拉底演讲教练提示词”吗? #演讲技巧 #表达能力提升 #AI学习法 #用AI提高效率 #苏格拉底式提问 #如何快速学会一个技能 #高效学习 #自我提升日常 #成长记录

00
Charlii
7天前
以前我练演讲,总是卡:

不敢开口

一紧张就语无伦次

不知道怎么组织语言

练了很久还是没感觉进步

直到我用“AI 苏格拉底式演讲教练”—— 那一刻我才发现:不是我学不会,是我一直在用“死记硬背式”的错误方法。

🎤 AI 演讲教练最厉害的不是教你,而是“逼你思考”

我让 AI 扮演演讲教练,它不会直接给我一堆讲稿或套路,而是:

用苏格拉底式提问逼我想清楚自己在讲什么

比如它会问我:

“你这句话的核心观点是什么?”

“听众为什么要听你说?”

“如果只留一句话,你希望他们记住什么?”

“能不能给我一个具体例子?”

这种提问方式非常恐怖(但非常有效)。

它不是灌输,是逼你“真正理解”。

而演讲最怕的就是:
你自己都没讲明白,别人怎么听懂?

即时反馈:讲不好,它立刻指出问题

我说一句,它就给一句反馈:

“这句话太长了”

“情绪太平,可以再有点能量”

“逻辑跳跃,再加个过渡”

“例子太抽象,换个具体点的”

最关键的是:

卡住了,它会换个角度再解释给我,直到我真的懂

不懂 换语言

不懂 换例子

不懂 换场景

不懂 直接示范

这才是真正的“私人教练”。

🔧 每个概念都有“实战练习”,练一次就能明显变好

比如学“开场吸引力”,它会让我:

用一句话介绍主题

给两个版本:普通版 & 吸引版

它立刻批改并告诉我差在哪

学“逻辑结构”,它会让我:

30 秒讲一个观点

用“金字塔结构”重讲一次

给我打分、改进建议

这种“讲 被纠正 再讲 提升”的循环
是演讲提升最快的方式。

⏱️ 最夸张的是:15 分钟就能看到明显进步

是那种你自己都能听出来差别的进步:

更有逻辑
停顿自然
不再乱说话
思路更清晰
能现场组织语言

真的是“当场见效”的那种。

🎯 想要我用的这段“AI 苏格拉底演讲教练提示词”吗?

#演讲技巧 #表达能力提升 #AI学习法 #用AI提高效率 #苏格拉底式提问 #如何快速学会一个技能 #高效学习 #自我提升日常 #成长记录
22
Charlii
8天前
AI 总忘记我的要求:写分析忘结构、写文案忘风格、审代码忘标准。
我以前以为这是模型的问题,后来发现是我没给它一个“长期记忆的工作方法”。
直到用了 Claude Skills,这个老大难问题彻底解决。

1|Skills 为我解决的核心痛点

AI 每次都要重新解释流程,非常低效。
我把自己最常用的 SOP 写成 Skills,例如:

分析报告的结构

内容写作的风格

代码审查 checklist
之后 Claude 会自动按需调用这些方法,不会忘,也不用我再重复。

2|Skills 和 Prompts 的区别

Prompt:一次性的即时指令

Skills:可重复调用的工作方法
以前我写一次任务就得重新讲一次要求;
现在这些方法被长期存储、自动加载。

3|Skills 和 Subagent 的区别

Skills 是“方法”,定义怎么做

Subagent 是“角色”,负责执行任务
我做了一个只读权限的代码审查 Subagent,它只负责“看代码”;
审查的规则、标准、流程全部由 Skills 提供。
两者结合后效果最明显:
我一提交代码,Claude 自动让审查员执行,按 Skills 标准逐项检查,不需要我说一句话。

4|再说一下 Skills 和 MCP 的不同

MCP:让 AI 连接外部系统,如文件、数据库、工具

Skills:让 AI 知道如何处理任务
一个负责“接入世界”,一个负责“怎么做事”。

5|最终感受

以前我和 AI 是“临时合作”;
有了 Skills(方法)+ Subagent(角色)+ MCP(工具访问),
AI 才真正变成“能接手我工作流程的同事”。

#ClaudeAI #AI工作流 #Skills体验 #Subagent #AI自动化 #效率提升
00
Charlii
11天前
现在网上各种“大模型课程”“AI学习路线”,其实大多都在转述这份最初的学习路径。如果你想真正系统掌握大模型,不如直接看源头。这份路线图清晰划分三大阶段:入门、应用、深入,从基础到实战再到原理,全中文资料可读性极高。

0x10 入门篇:搞懂大模型基础

-从“会用ChatGPT”到“理解它为什么能回答”。
推荐资料:

OpenAI Quickstart【必看】

ChatGPT Prompt Engineering for Developers(中英双语)

Karpathy:《State of GPT》《Deep Dive into LLMs》【必看】
建议注册 openrouter.ai 一站式体验多模型。

0x20 应用篇:让模型真正为你工作

-目标是学会本地搭建模型推理环境、构建 LLM 应用
推荐资料:

LangChain for LLM Application Development(B站中字)

Dify:开源应用编排工具

OpenAI Cookbook & GPT Best Practices

Prompt 工程 / RAG / Agent 全链路开发实践

0x30 深入篇:从“用模型”到“懂模型” -如果你想理解 GPT、Llama、Claude 背后的原理,这一部分最关键。
推荐资料:

李沐《动手学深度学习》+ 李宏毅课程【必看】

清华大模型公开课第二季【必看】

LLaMA-Factory 微调工具【必看】

The Ultra-Scale Playbook:GPU 集群训练经验

ICML 2024 Physics of LMs:大模型原理黑盒解析

总结
想系统掌握大模型,这份 Roadmap 才是全网课程的“母本”。
别再浪费时间在碎片化内容上——
一手信息,胜过一百个二手视频。

收藏这篇,少走弯路两年。

#大模型路线 #AI知识源头 #原创资料 #ninehillsblog #AI学习指南 #AI学习资源 #技术干货 #AI系统学习 #GPT学习
00
Charlii
12天前
最近真的是被这两个开源工具惊到了。 作为一个经常剪视频、做素材收集的人,能一键保存想要的视频,真的太方便了。

一、res-downloader

这个是我最近最常用的工具。
界面很干净,打开就能用,不需要什么复杂设置。启动代理后,去打开你想下载的页面(比如视频号、小红书、抖音等),
再回到软件里,就能直接看到资源列表。

支持的内容非常多:视频、音频、图片、直播流、m3u8 链接都能下。
Windows、mac、Linux 都能用,我自己是在 Mac 上跑的,完全没问题。

开源地址在 GitHub 上,搜:putyy/res-downloader

二、wx_channels_download

这个主要是专门针对视频号的版本。
体积超级小,只有 8MB,安装后打开微信视频号页面,
视频下方就会自动出现“下载视频”按钮。

我自己测试了一下,下载速度很快,而且能下原画质的视频。
对于不太懂命令行的朋友,推荐直接用图形界面版本就好,
点一下按钮就能保存到本地,省心又稳定。

开源地址:ltaoo/wx_channels_download

三、总结

如果你想下各个平台的内容,用 res-downloader;
如果主要是下视频号,用 wx_channels_download。
两个工具我都亲测过,真的是目前最方便、最干净的一套方案,没有广告,也完全免费。

Tips:只建议用于学习和资料整理,别拿去做违规用途。

工具虽好,用的时候还是要守法。
#下载神器 #视频号下载 #小红书下载 #素材保存 #效率工具 #电脑必备软件 #开源推荐 #资源嗅探 #视频剪辑素材 #博主必备工具 #极客生活 #程序员分享 #工具党狂喜 #自媒体必备 #收藏这两个工具
02