赛博东哥CyberFD的个人主页

即刻App年轻人的同好社区

下载

赛博东哥CyberFD

4关注87被关注2夸夸

🚀 AI产品经理｜开发者｜创业者
🔥 专注AI Agent流程管理｜知识管理与创造
⚡️ 作品：GoHumanLoop｜帝阅DR开源系列

赛博东哥CyberFD

2天前

🚀 DeerFlow：字节开源超级智能体详解

DeerFlow是字节跳动开源的SuperAgent超级智能体框架，专为长时程、复杂任务设计，能自主执行几分钟到几小时的全流程工作。

一、项目核心信息
- 版本：DeerFlow 2.0，2026年2月底开源，与v1无共享代码，完全重写。
- 定位：从“深度研究Agent”升级为全栈超级智能体执行引擎，基于LangGraph+LangChain构建。
- 热度：发布即登GitHub Trending第一，当前Stars约35k-40k
- 协议：MIT开源，商业友好，兼容各类LLM（含本地Ollama+Qwen/DeepSeek）。

二、四大核心能力
1. 多Agent团队协作
主管Agent拆解任务，动态生成Researcher/Coder/Reporter等子Agent，并行执行、隔离上下文，最后合成结果。

2. 真实沙盒执行（区别于普通Agent）
Docker/K8s隔离环境，含完整文件系统+Bash终端，真正执行代码、管理文件、跑长任务，非仅建议命令。

3. 长时程记忆与状态
持久化记忆+LangGraph状态机，支持断点续跑，长任务中断不丢进度。

4. 渐进式技能加载
按需加载内置/自定义技能（.md定义），节省上下文，内置搜索、爬虫、代码执行、可视化、TTS等工具。

三、能做什么
- 深度研究：行业报告、数据分析、论文调研
- 内容创作：AI播客、幻灯片、网站、可视化
- 开发自动化：代码生成、网站构建、复杂工作流
- 企业/个人：内部自动化、几小时自主任务、多Agent团队

四、上手与风险
- 部署：本地（Python+Docker）/云均可，新手有保姆级教程。
- 风险：沙盒需谨慎权限，长任务耗资源，遵守数据隐私与开源协议。

一句话总结：DeerFlow是能自主干活的AI团队，让普通人也能低成本搭建超级智能体，是AI Agent落地的核心基础设施。

GitHub主仓库：github.com/bytedance/deer-flow
官方演示站：deerflow.tech/

0 00

赛博东哥CyberFD

2天前

Code Review Graph：Claude Code 的代码地图。这个工具解决的是个老问题：Claude Code 每次都要重新读你的整个代码库。

举个例子，你有个 500 文件的项目。修改了一个函数。Claude Code 却要读遍所有 500 个文件，才能理解"这个改动的影响范围是什么"。结果是Token 爆炸，成本和速度都很糟。比如 Flask 项目，一次代码审查：不用图的话 44,751 token，用图只需 4,252 token，9.1x 省下来

Code Review Graph 干了三件事：
1. 把你的代码编成地图
用 Tree-sitter 解析代码，把函数、类、import、调用关系都记下来，存成图的形式（Graph Database 风格，用 SQLite）。支持 18 种语言，从 Python、TypeScript 到 Rust、Go、Java 都行。
初次解析一个 500 文件项目，10 秒。之后每次你改文件，Hook 自动触发增量更新，2 秒搞定。

2. 追踪影响范围
你改了一个函数。Graph 会自动找出：
- 谁调用了这个函数
- 哪些类继承了这个类
- 哪些测试覆盖了这段代码
- 间接受影响的函数和模块
这叫「Blast Radius 分析」。结果是，Claude 只用读这些相关文件，不用读整个项目。
精准度呢？完美查全率（100% recall），虽然会有过度预测（保守策略，宁可多读不漏读），但 F1 平均 0.54，已经很不错。

3. 给 Claude 提供结构化上下文
不是把整个文件扔给 Claude，而是给它一个精准的上下文：
- 改了哪些节点（函数、类）
- 这些节点的调用链是什么
- 哪些测试应该 cover 这些改动
- 相关的其他模块是什么

Claude 拿着这个"地图"，不但省 token，质量还更好（因为噪音少了）。

亮点：
1. 增量更新：不是每次都重新解析整个项目，而是只解析变过的文件，再跟图做 diff。一个 2900 文件的项目，commit 后 2 秒搞定。
2. 自动化配置：code-review-graph install 一条命令，自动检测你用的是 Claude Code、Cursor、Windsurf、Zed、Continue 还是 OpenCode，然后写入对应的 MCP 配置。重启编辑器就行。
3. 本地存储：SQLite 文件在 .code-review-graph/ 目录，没有云依赖，没有外部数据库。你的代码地图就在本地。
4. 可视化：可以生成交互式 D3.js 图，看看你的代码架构长什么样。社区检测（Leiden 算法）会自动聚类相关的模块。

项目：github.com/tirth8205/code-review-graph

0 00

赛博东哥CyberFD

5天前

最近看 Claude Code 的生态，我一个很强烈的感受就是：Skills 这套东西，已经开始从“锦上添花的小插件”，变成“越装越乱的文件夹迷宫”了。

刚开始用的时候，装三五个 Skill，确实很爽，感觉像是给 Claude Code 装了一点超能力。但用久了之后问题就出来了：有些 Skill 装在全局，有些装在项目里，有些项目里还套项目，路径藏得特别深。

时间一长，你根本记不住自己到底装过什么、哪些是重复的、哪些已经过期、哪些只在某个仓库里生效。它不是不能用，而是开始越来越像一种“隐性负担”。

我自己也是因为这个痛点，翻到了 GitHub 上一个项目，叫 Skills Desktop。

它做的事情其实不花哨，说白了就是：把原来散落在命令行、本地目录、各个仓库里的 Skills，统一拉到一个桌面界面里管理。

这种东西第一眼看上去可能不够“炫”，不像什么新模型、新 Agent、一句话自动做全套那种项目，但我反而觉得它挺有价值。因为现在很多 AI 工具的问题，已经不是“能力不够强”，而是能力太多之后，开始没人收拾现场了。

这个工具最打动我的地方，不是它功能有多复杂，而是它刚好把最烦的那几步给接住了。

比如它会自动扫描你本地已经安装的 Skills，帮你区分系统级和项目级；不要的可以直接删；看到 GitHub 上的 Skill 仓库，可以直接导入；自己本地攒了一堆 Skill 文件夹，也能统一拉进来管理。

对现在这种 Skills 野蛮生长的阶段来说，这种“整理能力”其实比再来一个新 Skill 更重要。因为当一个生态开始变大之后，真正拉开体验差距的，往往不是新增了多少能力，而是谁先把混乱变得可控。

还有一点我觉得特别值得说，就是它做了安全扫描。
这点很多人一开始容易忽略，但实际上 Skill 不是表面上看起来那么“轻”的东西。

它背后可能带着指令、模板、样例，甚至脚本。你从网上随手装一个陌生 Skill，本质上并不只是“加个功能”，而是在把别人写的一整套执行逻辑接进你的工作流里。

这个时候，如果有个工具能帮你提前扫一下风险、标一下可疑代码、给个安全评分，哪怕不能 100% 保证安全，也已经比“装了再说，出事再删”强太多了。

所以我现在越来越觉得，像 Skills Desktop 这种项目，表面上看不性感，实际上很务实。

它不是那种会让人惊呼“AI 又进化了”的东西，但它很像这个阶段特别需要的一类基础设施：不是继续往上叠能力，而是把已经出现的能力整理清楚。

说白了，AI 生态走到今天，最缺的很多时候不是“再来一个更强的”，而是“终于有人开始认真收纳了”。这种项目可能不会最火，但往往会越来越值钱。

1 00

赛博东哥CyberFD

6天前

虚拟机 + agent + harness 工程框架会演变为某种实体
不是传统OS，而是
OS（agent runtime）+ 加速算力（token） + 传统算力，存储和流量（传统云服务） =

这种打包就是未来个人计算的核心。

目前还没有名字，但是会是类似 agent vm or agent sandbox 之类的东西吧。
目前英文世界还没有最终确定，但是很快，估计六个月之内

从"人操作App"转向"人委托Agent，Agent调度Runtime"，新交互范式已来

1 00

赛博东哥CyberFD

10天前

字节开源了一个框架，叫DeerFlow 2.0，上线就冲上GitHub热榜第一。

这东西不是聊天机器人，更像一个Agent调度中心。你给它一个复杂任务，它会拆解成步骤，派不同的小Agent分头执行，最后汇总交给你。写研报、搭网站、做PPT、生成视频，都是它内置的能力。

设计上有个亮点：每个任务跑在独立的Docker沙箱里，有自己的文件系统，能读写文件、执行代码，互不干扰，也方便追踪。跨会话记忆是持久化的，用得越久越懂你。

模型支持也灵活，GPT-4、DeepSeek、豆包都能接。基于LangGraph搭建，MIT协议开源。

0 00

赛博东哥CyberFD

11天前

Python 用于人工智能研究，Rust 用于人工智能生产。

我们从
@divamgupta
10 MB 二进制文件创建了一个完整的 Rust 实现，用于实现小型 TTS 模型 (15M-80M)，冷启动时间为 100 毫秒，仅支持 CPU，可在边缘端使用。

🐱🦀github.com

CPU 可以以 4 倍实时速度运行 KittenTTS，但苹果的 GPU 只能达到 3 倍。
@claudeai
解释了原因：在这个模型规模下，GPU 的调度开销超过了计算节省。ONNX 的 CPU 后端采用 SIMD 指令集，已经使硬件达到饱和。当参数数量低于约 10 亿时，GPU 就处于劣势了。

0 00

赛博东哥CyberFD

11天前

David Singleton，前 Stripe CTO 最近有个观点很炸裂：

当我们所有人都觉得 AI 时代最危险的是 manager，因为不需要中间层了嘛，agent 直接干了。

结果他现在优先招那些以前当过 manager 但现在想回来写代码的人。

原因是他认为 manager 天然擅长拆解任务、协调资源、知道什么时候该推一把什么时候该放手，他认为这才是驾驭 coding agent 最核心的能力。

----

我认为说的没有错，不过这里重点不是当没当过 Manager，而是需要同时具备架构能力和管理能力，能拆解任务，能管理 Agent。

说实话，有些manager 擅长的不是技术，而是向上管理和 PUA，这是管人的逻辑。管 Agent 重要的即不是向上管理，也不是 PUA，而是“定义问题”和“知人善用”。

0 00

赛博东哥CyberFD

12天前

百度千帆推出了一个开源的OCR，把图片扫描成文档的。

千帆-OCR 是由百度千帆团队开发的 40亿参数端到端文档智能模型。
它在一个统一的视觉-语言架构中集成了文档解析、版面分析和文档理解能力。

与传统的多阶段 OCR 流水线（将独立的版面检测、文字识别和语言理解模块串联）不同，千帆-OCR 能够执行直接的图像到 Markdown 转换，并支持广泛的提示驱动任务——从结构化文档解析、表格提取，到图表理解、文档问答和关键信息抽取——全部由单一模型完成。

核心亮点
🏆 OmniDocBench v1.5 端到端模型排名第一 —— 总体得分 93.12，超越 DeepSeek-OCR-v2（91.09）、Gemini-3 Pro（90.33）及其他所有端到端模型
🏆 OlmOCR Bench 端到端模型排名第一 —— 得分 79.8
🏆 关键信息抽取（KIE）任务排名第一 —— 在五个公开 KIE 基准上的平均得分为 87.9，超越 Gemini-3.1-Pro、Gemini-3-Pro、Seed-2.0 和 Qwen3-VL-235B-A22B
🧠 Layout-as-Thought（版面即思维） —— 一种创新的可选推理阶段，通过 ⟨think⟩ token 在端到端范式内显式恢复版面分析能力
🌍 支持 192 种语言 —— 覆盖多种文字系统的多语言 OCR 能力
⚡ 高效部署 —— 在单张 A100 GPU 上使用 W8A8 量化时，达到 1.024 PPS（每秒处理页数）

模型地址：www.modelscope.cn/models/baidu-qianfan/Qianfan-OCR/summary

0 00

赛博东哥CyberFD

14天前

吴恩达最新推出 Context Hub，用来解决 agent 访问的 API 更新不及时、获取低效以及幻觉问题。并且还提供本地记忆（API正确的用法还有调不通的经验）。如果能得到大范围采用以及维护，确实是一个不错的项目。

原文：

AI 编程智能体是否也需要一个“Stack Overflow”来互通有无？

上周，我发布了 Context Hub (chub)，这是一个开源的命令行（CLI）工具，旨在为编程智能体（coding agents）提供及时的 API 文档。自发布以来，我们的 GitHub 仓库已斩获超过 6,000 颗星；得益于社区的贡献以及全新的“智能体文档编写器”（agentic document writer），我们提供的 API 文档数量已从不足 100 份迅速扩展至 1,000 多份。感谢每一位支持 Context Hub 的朋友！

OpenClaw 和 Moltbook 的实践证明，智能体可以利用专为其打造的社交媒体来共享信息。在 chub 的新版本中，智能体可以针对文档分享反馈——哪些方案有效、哪些无效、哪些内容缺失。在确保隐私和安全的前提下，这些反馈将帮助我们为所有人持续优化文档质量。

目前该项目仍处于早期阶段。您可以在 GitHub 仓库中查看详细信息和配置选项。请按以下步骤安装 chub，并引导您的编程智能体开始使用它：

npm install -g @aisuite/chub

1 00

赛博东哥CyberFD

15天前

【浏览器就是API：让AI直接用你的登录态】

快速阅读：bb-browser让AI agent直接调用你浏览器里已登录的Twitter、知乎、B站等任何网站，无需API密钥或反爬技术。社区驱动的适配器库已覆盖36个平台103条命令，AI自己就能在10分钟内逆向任何新网站并写出可用适配器。

---

互联网本来就是为浏览器设计的，但AI一直在试图通过API访问它——问题是99%的网站根本没有API。

bb-browser的做法反过来：别逼网站提供机器接口，让机器直接用人类接口。适配器在你的浏览器标签页里执行`eval`，用你的cookie调用`fetch()`，或者直接调用页面自己的webpack模块。网站以为是你在操作。因为确实就是你。

Playwright要在隔离的无头浏览器里重新登录，爬虫库得跟反爬机制玩猫鼠游戏。bb-browser什么都不用做，因为它本来就是用户本身——登录态已经在那里了，复杂的OAuth流程由页面自己处理，反爬系统看不见任何异常。

GitHub: github.com/epiral/bb-browser

1 00