流程图即 DSL 的可执行管线
Spider-Flow 的底层范式是把爬虫抽象成“节点 + 边”的有向图:节点代表能力(请求、提取、转换、落库),边代表数据与控制流。这样设计的关键收益是把隐式的控制结构显式化:分页、分支、循环、异常兜底不再藏在 if/while 里,而是成为可读、可评审、可复用的图结构。执行时,平台把图转成可调度的任务链,节点只关心输入输出契约,从而让复杂流程在规模扩张时仍能维持可维护性。配合节点级日志与可视化调试,你可以把一次失败定位到“哪个节点 + 哪条规则 + 哪个输入”,而不是在海量日志里盲猜。
