即刻App年轻人的同好社区
下载
App内打开
赛博东哥CyberFD
4关注87被关注2夸夸
🚀 AI产品经理 |开发者 |创业者
🔥 专注AI Agent流程管理|知识管理与创造
⚡️ 作品:GoHumanLoop|帝阅DR开源系列
赛博东哥CyberFD
2天前
🚀 DeerFlow:字节开源超级智能体详解

DeerFlow是字节跳动开源的SuperAgent超级智能体框架,专为长时程、复杂任务设计,能自主执行几分钟到几小时的全流程工作。

一、项目核心信息
- 版本:DeerFlow 2.0,2026年2月底开源,与v1无共享代码,完全重写。
- 定位:从“深度研究Agent”升级为全栈超级智能体执行引擎,基于LangGraph+LangChain构建。
- 热度:发布即登GitHub Trending第一,当前Stars约35k-40k
- 协议:MIT开源,商业友好,兼容各类LLM(含本地Ollama+Qwen/DeepSeek)。

二、四大核心能力
1. 多Agent团队协作
主管Agent拆解任务,动态生成Researcher/Coder/Reporter等子Agent,并行执行、隔离上下文,最后合成结果。

2. 真实沙盒执行(区别于普通Agent)
Docker/K8s隔离环境,含完整文件系统+Bash终端,真正执行代码、管理文件、跑长任务,非仅建议命令。

3. 长时程记忆与状态
持久化记忆+LangGraph状态机,支持断点续跑,长任务中断不丢进度。

4. 渐进式技能加载
按需加载内置/自定义技能(.md定义),节省上下文,内置搜索、爬虫、代码执行、可视化、TTS等工具。

三、能做什么
- 深度研究:行业报告、数据分析、论文调研
- 内容创作:AI播客、幻灯片、网站、可视化
- 开发自动化:代码生成、网站构建、复杂工作流
- 企业/个人:内部自动化、几小时自主任务、多Agent团队

四、上手与风险
- 部署:本地(Python+Docker)/云均可,新手有保姆级教程。
- 风险:沙盒需谨慎权限,长任务耗资源,遵守数据隐私与开源协议。

一句话总结:DeerFlow是能自主干活的AI团队,让普通人也能低成本搭建超级智能体,是AI Agent落地的核心基础设施。

GitHub主仓库:github.com/bytedance/deer-flow
官方演示站:deerflow.tech/
00
赛博东哥CyberFD
2天前
Code Review Graph:Claude Code 的代码地图。这个工具解决的是个老问题:Claude Code 每次都要重新读你的整个代码库。

举个例子,你有个 500 文件的项目。修改了一个函数。Claude Code 却要读遍所有 500 个文件,才能理解"这个改动的影响范围是什么"。结果是Token 爆炸,成本和速度都很糟。比如 Flask 项目,一次代码审查:不用图的话 44,751 token,用图只需 4,252 token,9.1x 省下来

Code Review Graph 干了三件事:
1. 把你的代码编成地图
Tree-sitter 解析代码,把函数、类、import、调用关系都记下来,存成图的形式(Graph Database 风格,用 SQLite)。支持 18 种语言,从 Python、TypeScript Rust、Go、Java 都行。
初次解析一个 500 文件项目,10 秒。之后每次你改文件,Hook 自动触发增量更新,2 秒搞定。

2. 追踪影响范围
你改了一个函数。Graph 会自动找出:
- 谁调用了这个函数
- 哪些类继承了这个类
- 哪些测试覆盖了这段代码
- 间接受影响的函数和模块
这叫「Blast Radius 分析」。结果是,Claude 只用读这些相关文件,不用读整个项目。
精准度呢?完美查全率(100% recall),虽然会有过度预测(保守策略,宁可多读不漏读),但 F1 平均 0.54,已经很不错。

3. Claude 提供结构化上下文
不是把整个文件扔给 Claude,而是给它一个精准的上下文:
- 改了哪些节点(函数、类)
- 这些节点的调用链是什么
- 哪些测试应该 cover 这些改动
- 相关的其他模块是什么

Claude 拿着这个"地图",不但省 token,质量还更好(因为噪音少了)。

亮点:
1. 增量更新:不是每次都重新解析整个项目,而是只解析变过的文件,再跟图做 diff。一个 2900 文件的项目,commit 2 秒搞定。
2. 自动化配置:code-review-graph install 一条命令,自动检测你用的是 Claude Code、Cursor、Windsurf、Zed、Continue 还是 OpenCode,然后写入对应的 MCP 配置。重启编辑器就行。
3. 本地存储:SQLite 文件在 .code-review-graph/ 目录,没有云依赖,没有外部数据库。你的代码地图就在本地。
4. 可视化:可以生成交互式 D3.js 图,看看你的代码架构长什么样。社区检测(Leiden 算法)会自动聚类相关的模块。

项目:github.com/tirth8205/code-review-graph
00
赛博东哥CyberFD
5天前
最近看 Claude Code 的生态,我一个很强烈的感受就是:Skills 这套东西,已经开始从“锦上添花的小插件”,变成“越装越乱的文件夹迷宫”了。

刚开始用的时候,装三五个 Skill,确实很爽,感觉像是给 Claude Code 装了一点超能力。但用久了之后问题就出来了:有些 Skill 装在全局,有些装在项目里,有些项目里还套项目,路径藏得特别深。

时间一长,你根本记不住自己到底装过什么、哪些是重复的、哪些已经过期、哪些只在某个仓库里生效。它不是不能用,而是开始越来越像一种“隐性负担”。

我自己也是因为这个痛点,翻到了 GitHub 上一个项目,叫 Skills Desktop。

它做的事情其实不花哨,说白了就是:把原来散落在命令行、本地目录、各个仓库里的 Skills,统一拉到一个桌面界面里管理。

这种东西第一眼看上去可能不够“炫”,不像什么新模型、新 Agent、一句话自动做全套那种项目,但我反而觉得它挺有价值。因为现在很多 AI 工具的问题,已经不是“能力不够强”,而是能力太多之后,开始没人收拾现场了。

这个工具最打动我的地方,不是它功能有多复杂,而是它刚好把最烦的那几步给接住了。

比如它会自动扫描你本地已经安装的 Skills,帮你区分系统级和项目级;不要的可以直接删;看到 GitHub 上的 Skill 仓库,可以直接导入;自己本地攒了一堆 Skill 文件夹,也能统一拉进来管理。

对现在这种 Skills 野蛮生长的阶段来说,这种“整理能力”其实比再来一个新 Skill 更重要。因为当一个生态开始变大之后,真正拉开体验差距的,往往不是新增了多少能力,而是谁先把混乱变得可控。

还有一点我觉得特别值得说,就是它做了安全扫描。
这点很多人一开始容易忽略,但实际上 Skill 不是表面上看起来那么“轻”的东西。

它背后可能带着指令、模板、样例,甚至脚本。你从网上随手装一个陌生 Skill,本质上并不只是“加个功能”,而是在把别人写的一整套执行逻辑接进你的工作流里。

这个时候,如果有个工具能帮你提前扫一下风险、标一下可疑代码、给个安全评分,哪怕不能 100% 保证安全,也已经比“装了再说,出事再删”强太多了。

所以我现在越来越觉得,像 Skills Desktop 这种项目,表面上看不性感,实际上很务实。

它不是那种会让人惊呼“AI 又进化了”的东西,但它很像这个阶段特别需要的一类基础设施:不是继续往上叠能力,而是把已经出现的能力整理清楚。

说白了,AI 生态走到今天,最缺的很多时候不是“再来一个更强的”,而是“终于有人开始认真收纳了”。这种项目可能不会最火,但往往会越来越值钱。
00
赛博东哥CyberFD
6天前
虚拟机 + agent + harness 工程框架会演变为某种实体
不是 传统OS,而是
OS(agent runtime)+ 加速算力(token) + 传统算力,存储和流量(传统云服务) =

这种打包就是未来个人计算的核心。

目前还没有名字,但是会是类似 agent vm or agent sandbox 之类的东西吧。
目前英文世界还没有最终确定,但是很快,估计六个月之内

从"人操作App"转向"人委托Agent,Agent调度Runtime",新交互范式已来
00
赛博东哥CyberFD
10天前
字节开源了一个框架,叫DeerFlow 2.0,上线就冲上GitHub热榜第一。

这东西不是聊天机器人,更像一个Agent调度中心。你给它一个复杂任务,它会拆解成步骤,派不同的小Agent分头执行,最后汇总交给你。写研报、搭网站、做PPT、生成视频,都是它内置的能力。

设计上有个亮点:每个任务跑在独立的Docker沙箱里,有自己的文件系统,能读写文件、执行代码,互不干扰,也方便追踪。跨会话记忆是持久化的,用得越久越懂你。

模型支持也灵活,GPT-4、DeepSeek、豆包都能接。基于LangGraph搭建,MIT协议开源。
00
赛博东哥CyberFD
11天前
Python 用于人工智能研究,Rust 用于人工智能生产。

我们从
@divamgupta
10 MB 二进制文件创建了一个完整的 Rust 实现,用于实现小型 TTS 模型 (15M-80M),冷启动时间为 100 毫秒,仅支持 CPU,可在边缘端使用。

🐱🦀github.com

CPU 可以以 4 倍实时速度运行 KittenTTS,但苹果的 GPU 只能达到 3 倍。
@claudeai
解释了原因:在这个模型规模下,GPU 的调度开销超过了计算节省。ONNX 的 CPU 后端采用 SIMD 指令集,已经使硬件达到饱和。当参数数量低于约 10 亿时,GPU 就处于劣势了。
00
赛博东哥CyberFD
11天前
David Singleton,前 Stripe CTO 最近有个观点很炸裂:

当我们所有人都觉得 AI 时代最危险的是 manager,因为不需要中间层了嘛,agent 直接干了。

结果他现在优先招那些以前当过 manager 但现在想回来写代码的人。

原因是他认为 manager 天然擅长拆解任务、协调资源、知道什么时候该推一把什么时候该放手,他认为这才是驾驭 coding agent 最核心的能力。

----

我认为说的没有错,不过这里重点不是当没当过 Manager,而是需要同时具备架构能力和管理能力,能拆解任务,能管理 Agent。

说实话,有些manager 擅长的不是技术,而是向上管理和 PUA,这是管人的逻辑。 Agent 重要的即不是向上管理,也不是 PUA,而是“定义问题”和“知人善用”。
00
赛博东哥CyberFD
12天前
百度千帆推出了一个开源的OCR,把图片扫描成文档的。

千帆-OCR 是由百度千帆团队开发的 40亿参数端到端文档智能模型。
它在一个统一的视觉-语言架构中集成了文档解析、版面分析和文档理解能力。

与传统的多阶段 OCR 流水线(将独立的版面检测、文字识别和语言理解模块串联)不同,千帆-OCR 能够执行 直接的图像到 Markdown 转换,并支持广泛的提示驱动任务——从结构化文档解析、表格提取,到图表理解、文档问答和关键信息抽取——全部由单一模型完成。

核心亮点
🏆 OmniDocBench v1.5 端到端模型排名第一 —— 总体得分 93.12,超越 DeepSeek-OCR-v2(91.09)、Gemini-3 Pro(90.33)及其他所有端到端模型
🏆 OlmOCR Bench 端到端模型排名第一 —— 得分 79.8
🏆 关键信息抽取(KIE)任务排名第一 —— 在五个公开 KIE 基准上的平均得分为 87.9,超越 Gemini-3.1-Pro、Gemini-3-Pro、Seed-2.0 Qwen3-VL-235B-A22B
🧠 Layout-as-Thought(版面即思维) —— 一种创新的可选推理阶段,通过 ⟨think⟩ token 在端到端范式内显式恢复版面分析能力
🌍 支持 192 种语言 —— 覆盖多种文字系统的多语言 OCR 能力
高效部署 —— 在单张 A100 GPU 上使用 W8A8 量化时,达到 1.024 PPS(每秒处理页数)

模型地址:www.modelscope.cn/models/baidu-qianfan/Qianfan-OCR/summary
00
赛博东哥CyberFD
14天前
吴恩达最新推出 Context Hub,用来解决 agent 访问的 API 更新不及时、获取低效以及幻觉问题。并且还提供本地记忆(API正确的用法还有调不通的经验)。如果能得到大范围采用以及维护,确实是一个不错的项目。

原文:

AI 编程智能体是否也需要一个“Stack Overflow”来互通有无?

上周,我发布了 Context Hub (chub),这是一个开源的命令行(CLI)工具,旨在为编程智能体(coding agents)提供及时的 API 文档。自发布以来,我们的 GitHub 仓库已斩获超过 6,000 颗星;得益于社区的贡献以及全新的“智能体文档编写器”(agentic document writer),我们提供的 API 文档数量已从不足 100 份迅速扩展至 1,000 多份。感谢每一位支持 Context Hub 的朋友!

OpenClaw Moltbook 的实践证明,智能体可以利用专为其打造的社交媒体来共享信息。在 chub 的新版本中,智能体可以针对文档分享反馈——哪些方案有效、哪些无效、哪些内容缺失。在确保隐私和安全的前提下,这些反馈将帮助我们为所有人持续优化文档质量。

目前该项目仍处于早期阶段。您可以在 GitHub 仓库中查看详细信息和配置选项。请按以下步骤安装 chub,并引导您的编程智能体开始使用它:

npm install -g @aisuite/chub
00
赛博东哥CyberFD
15天前
【浏览器就是API:让AI直接用你的登录态】

快速阅读:bb-browser让AI agent直接调用你浏览器里已登录的Twitter、知乎、B站等任何网站,无需API密钥或反爬技术。社区驱动的适配器库已覆盖36个平台103条命令,AI自己就能在10分钟内逆向任何新网站并写出可用适配器。

---

互联网本来就是为浏览器设计的,但AI一直在试图通过API访问它——问题是99%的网站根本没有API。

bb-browser的做法反过来:别逼网站提供机器接口,让机器直接用人类接口。适配器在你的浏览器标签页里执行`eval`,用你的cookie调用`fetch()`,或者直接调用页面自己的webpack模块。网站以为是你在操作。因为确实就是你。

Playwright要在隔离的无头浏览器里重新登录,爬虫库得跟反爬机制玩猫鼠游戏。bb-browser什么都不用做,因为它本来就是用户本身——登录态已经在那里了,复杂的OAuth流程由页面自己处理,反爬系统看不见任何异常。

GitHub: github.com/epiral/bb-browser
00