DeerFlow 2.0 上手指南：把 AI 从“会聊”变成“会干活”的开源智能体套件

字节把 DeerFlow 2.0 开源后，GitHub 很快冲到 Trending 第 1，还拿了 35K+ Star。

热闹归热闹，关键问题就一个：它能不能真的帮你把活干了？

答案是：它的设计目标就不是“对话很聪明”，而是把 AI 拉进生产流程里——研究、写作、编程、生成网页、跑自动化工作流，这些都在它的射程内。

下面按“你照着做就能跑起来”的思路讲清楚：它解决什么、核心组件是什么、怎么落地到你的任务上、怎么少踩坑。

DeerFlow 2.0 到底强在哪

很多 Agent 框架的问题不在模型，而在“干活链路”。比如：

只会输出一堆文字，不会真的执行
要写代码就直接在你机器上跑，安全感为 0
做到一半忘了上下文，隔天再跑等于重来
想接入新工具（搜索、抓网页、发邮件、拉数据）要魔改，扩展性差

DeerFlow 2.0 的思路很直接：

让多个 sub-agents 并行协作：任务拆开同时干，速度上来
给它沙箱执行环境：能跑代码、能做工具调用，风险可控
给持久记忆：今天做的事明天还能接着干
skills 系统可扩展：你能把它变成“公司内部工具人”

你可以把它理解成：一套能编排“AI 工人团队”的生产线。🧰

核心组件拆开讲（看懂这段就会用）

1）Sub-agents 并行协作：别让一个 Agent 累死

现实任务都不是单线程。

举个你一定遇到过的场景：

你要写一篇技术文章，还要配示例代码和 demo 页面。

如果只有一个 Agent：查资料 → 归纳 → 写稿 → 写代码 → 调样式 → 修 bug……一步步来，慢，还容易走偏。

DeerFlow 这类并行协作的价值在于：

研究 Agent：负责搜集资料、列要点、找反例
写作 Agent：负责结构、标题、段落节奏
代码 Agent：负责示例代码、可运行脚本
网页 Agent：负责 demo 页面生成与修正

你得到的不是“一个聪明人”，而是“一个小团队”。

2）沙箱执行环境：敢让它跑代码，才叫能干活

不管你用哪家模型，只要它要执行，就有风险：

误删文件
乱装依赖
把密钥打印进日志
跑飞资源，CPU 飙满

沙箱的意义是把这些风险关进笼子里。

你可以更放心地让它：

运行脚本
做网页生成
做自动化步骤验证

一句话：不沙箱，就不敢自动化；不敢自动化，就只剩聊天。

3）持久记忆：别让它每天都“失忆”

你肯定烦过这种体验：

昨天刚对齐的需求，今天再问它，它像第一次见你。

持久记忆的价值在“跨任务复用”：

你的写作偏好（段落短、少废话、要例子）
你的项目约定（目录结构、代码风格、接口格式）
你的业务背景（产品是谁、指标是什么、禁区是什么）

有记忆，才有“越用越顺手”的感觉。

4）Skills 可扩展：把它接进你的工具链

真正好用的 Agent，必须能接入你的现实世界。

Skills 的意义就是：

你可以把内部 API、数据库查询、工单系统、飞书/Slack、CI 流水线都封成技能
Agent 不用“编故事”，可以直接“查数据、跑动作、给结果”

把技能做起来后，DeerFlow 的上限基本看你的业务能开放多少接口。

快速上手清单（照着勾就行）

这里不硬写命令行细节，避免不同环境把你带沟里。思路按这个来，落地细节看仓库 README。

[ ] 打开 DeerFlow 2.0 的 GitHub 仓库，先看 README / Quickstart / Examples
[ ] 准备好你的模型调用方式（API Key 或本地模型服务）
[ ] 按仓库建议方式启动（常见是本地运行或容器方式）
[ ] 跑通一个官方示例任务（别上来就搞你的复杂需求）
[ ] 找到 skills 的目录或配置方式，先学会“加一个简单技能”
[ ] 把你的第一个真实任务拆成 3~5 个子任务，映射到 sub-agents

你会发现：跑通示例那一下，后面就顺了。

从 0 到 1：搭一个“研究 + 写作 + 代码 + 网页”的任务流

给你一个特别实用的模板。你可以用它搞：

产品方案
技术文章
SDK 文档
营销落地页（带 demo）

Step A：把目标写清楚（越具体越省钱）

别写“帮我写一篇文章”。

写这种：

主题：DeerFlow 2.0 实操教程
读者：想落地 AI agent 的工程师/效率党
输出：Markdown 教程 + 可运行示例（伪代码也行）+ 避坑清单
风格：短句、口语化、少形容词、多步骤
限制：不要泄露密钥；所有执行放沙箱

Step B：给 sub-agents 分工（别让大家抢活）

一个常用分工方案：

Research Agent：收集要点、整理框架、找常见误区
Writer Agent：按框架出全文，负责可读性
Coder Agent：产出示例、校验思路可执行
Web Agent：生成 demo 页面结构，检查可用性

Step C：把“交付标准”写成清单（Agent 才知道何时停）

比如：

教程包含：安装/启动、任务流示例、如何写 skills、避坑
每段不超过 5 行
至少 2 个可复制的模板（任务描述模板、技能设计模板）

你会明显感觉到：Agent 乱跑的概率下降了。

Skills 怎么设计才耐用（别做一次性技能）

Skills 最容易写成“只能跑一次的脚本”。想让它越用越爽，用这个设计套路：

✅ 技能输入输出要像 API

输入：字段少而清晰
输出：结构化（JSON 之类）+ 人类可读摘要
错误：明确错误码/错误信息，让 Agent 知道下一步怎么补救

✅ 技能要可观测

你得能回答：

它调用了什么外部服务
用了多久
失败原因是什么

不然排查会把人逼疯。

✅ 技能边界要硬

别做“万能技能”。

把一个技能限定在一件事上，比如：

search_docs(query) 只负责搜
fetch_webpage(url) 只负责抓
run_in_sandbox(command) 只负责执行

技能越小，组合越灵活。

避坑清单（很现实，但能救命）

1）任务描述太虚，Agent 就会开始“自由发挥”

你说“做个网页”，它可能给你 3 套风格、10 个组件、还顺手写了品牌故事。

解决：把输出标准写成验收清单。

2）并行协作没对齐口径，结果会互相打架

研究 Agent 找的资料版本很新，代码 Agent 用的示例很旧。

解决：让一个 Agent 先产出“统一约束”，再开并行。

3）没沙箱就让它执行，本质是在赌

就算它不搞破坏，也可能把环境弄脏：依赖乱装、路径乱改。

解决：执行类动作全部走沙箱，主机只做调度。

4）记忆越记越多，噪音也会变多

持久记忆不是越多越好。

解决：定期做“记忆整理”。只保留偏好、约定、长期背景。临时内容该丢就丢。

5）Skills 没权限隔离，等着出事故

你把“发邮件”“删数据”“发工单”全丢给同一个高权限 Key……这不叫自动化，这叫埋雷。

解决：权限分级。能读就别给写，能写就别给删。

你可以拿 DeerFlow 2.0 做哪些“真有用”的事

给你几个特别落地的选题，照着抄都行：

技术调研自动化：每天抓竞品更新 + 生成简报
文档工厂：需求变更 → 自动更新 README / 接口文档
代码助手升级版：不只写代码，还能跑测试、修报错、提 PR 说明
小型站点生成：产品页 + FAQ + Demo，一条工作流跑完
内部运营工具：对接飞书/Slack，自动汇总数据、生成日报

你要的是“每天早下班一小时”，不是“多一个会聊天的玩具”。😄

一句话建议

别急着把它拿去做复杂系统。

挑一个你每周都要重复 3 次以上的任务，把它做成 DeerFlow 工作流，再用 skills 接上你常用的工具。

跑通一次，你就知道这套东西值不值了。