LangGraph 有状态图工作流引擎
DeerFlow 的执行编排层建立在 LangGraph 之上,用有状态图来表达复杂研究流程。每个 Agent 节点都是独立计算单元,通过结构化消息共享上下文,降低传统回调式编排的耦合。Checkpoint 机制支持任务在任意节点暂停与恢复,是人在环修改计划的底层基础。配合可视化调试能力,开发者能更容易定位多智能体流程中的状态传递问题。DeerFlow(Deep Exploration and Efficient Research Flow)是字节跳动开源的社区驱动型深度研究框架,于2025年以MIT协议发布,并在2026年3月升级为2.0版本,演进为真正意义上的「SuperAgent Harness」。它将大语言模型与网络搜索、爬虫、Python代码执行、RAG知识库检索、MCP工具调用等能力深度整合,通过基于LangGraph的有状态图工作流,将高层次研究任务自动分解为可并行执行的子任务流水线。系统内建协调器、规划器、研究员、编码员、报告员五类专职角色智能体,支持在隔离的Docker沙箱中安全执行代码、构建Web应用,并最终输出结构化研究报告、PowerPoint演示文稿及AI播客音频,实现从单一自然语言指令到完整交付物的全自动生产。
| ✕传统痛点 | ✓创新方案 |
|---|---|
| 传统单智能体框架如早期 AutoGPT 难以稳定拆解长周期复杂任务,容易循环或中途失效 | SuperAgent Harness 架构将框架定位为编排底座,而非单一 Agent,本体扩展性更强 |
| 主流研究产品如 Perplexity、OpenAI Deep Research 多为闭源黑盒,底层 LLM、工具链与知识库策略难以自定义 | Docker 隔离沙箱结合持久化文件系统,支持安全执行代码、写文件与构建完整 Web 应用 |
| 许多开源研究流水线缺少代码沙箱与多模态输出,只能生成纯文本结果 | 通过 litellm 统一接入 GPT-4、Claude、Qwen 等百余模型,模型切换和成本控制更灵活 |
| 部分多智能体框架如 CrewAI 在 RAG 集成与 MCP 协议支持上仍有缺口,企业私有知识接入成本偏高 | Human-in-the-Loop 机制支持用自然语言实时修订执行中的计划,在自动化与人工干预间取得平衡 |
| - | 原生支持报告、PowerPoint 与 TTS 播客三类交付物,超出传统文本型研究工具边界 |
1git clone https://github.com/bytedance/deer-flow.git && cd deer-flow && pip install -r requirements.txt1cp .env.example .env2# 编辑 .env,填入 OPENAI_API_KEY 或 ANTHROPIC_API_KEY,以及 TAVILY_API_KEY1uvicorn src.app:app --host 0.0.0.0 --port 8000 --reload1cd web && npm install && npm run dev1docker compose up -d| 核心场景 | 目标人群 | 解决方案 | 最终收益 |
|---|---|---|---|
| [竞争情报研究] | 市场分析师与商业战略团队 | 输入竞品公司名称,由研究员Agent自动检索财报、新闻与产品动态,编码员Agent完成对比分析,报告员输出图表化报告与PPT | 将原本2到3天的人工研究压缩到30分钟级别,并提升覆盖面与时效性 |
| [学术文献综述生成] | 高校研究人员与论文写作者 | 输入研究方向关键词,系统自动搜索论文与网页资料,结合RAG私有知识库归纳方法、结论与研究空白 | 更快形成结构化综述,降低人工检索遗漏风险 |
| [自动化内容营销流水线] | 内容运营团队与独立创作者 | 输入主题后,DeerFlow自动完成调研、写作、图表生成,并合成播客音频与演示文稿 | 单人也能在短时间内完成原本需要团队协作的多模态内容生产 |