Brand LogoBrand Logo (Dark)
首页智能体广场工具包广场GitHub 精选提交智能体博客

分类

  • AI 绘画
  • AI 音频
  • 自动化工具
  • 聊天机器人
  • 编程工具
  • 金融工具

分类

  • 大语言模型
  • 营销工具
  • 零代码/低代码
  • 研究与搜索
  • 视频与动画
  • 视频编辑

GitHub 精选

  • DeerFlow — 字节跳动开源超级智能体框架

最新博客

  • OpenClaw vs Composer 2 Which AI Assistant Delivers More Value
  • Google AI Studio vs Anthropic Console
  • Stitch 2.0 vs Lovable Which AI Design Tool Wins in 2026
  • Monetizing AI for Solopreneurs and Small Teams in 2026
  • OpenClaw vs MiniMax Which AI Assistant Wins in 2026

最新博客

  • OpenClaw vs KiloClaw Is Self-Hosting Still Better
  • OpenClaw vs Kimi Claw
  • GPT-5.4 vs Gemini 3.1 Pro
  • Farewell to Bloomberg Terminal as Perplexity Computer AI Redefines Finance
  • Best Practices for OpenClaw
LinkStartAI© 2026 LinkstartAI. 版权所有。
联系我们关于
  1. 首页
  2. GitHub 精选
  3. Clawfeed
Clawfeed logo

Clawfeed

一个可自托管的 Web-to-RSS 订阅源生成器:把网页更新抽取并规范化为 RSS/Atom,面向团队监控、归档与阅读器接入。
1.3kHTMLMIT license
#rss#atom#web-to-rss#feed-generator#content-monitoring#web-scraping
#self-hosted
#docker
#alternative-to-rsshub
#alternative-to-rss-bridge
#feedly-like
#inoreader-like

项目简介

Clawfeed 的定位很直接:把“没有官方订阅源”的网页变成可持续消费的RSS/Atom输出,让信息摄取从手动巡检升级为自动化管道。它更像一个订阅源构建器而不是阅读器,你可以把生成的feed交给 Feedly 或 Inoreader 统一阅读与同步。对于团队场景,Clawfeed 的价值在于把抓取规则、过滤逻辑与更新节奏工程化:规则可以版本化,输出可以缓存,失败可以降级并告警,从而把不稳定的上游页面改造成可依赖的数据入口。配合 Docker 等容器化方式落地后,它能作为轻量的内容监控与归档底座,适合内网、隐私敏感与需要长期运行的订阅任务。

痛点 vs 创新

✕传统痛点✓创新方案
大量内容源没有RSS,团队只能靠通知、收藏或手动巡检,导致信息延迟、不可追溯、难归档。Clawfeed 把网页内容抽取与订阅源生成工程化:规则化抓取、可控刷新、可缓存输出,让订阅源成为可运维的服务能力。
通用阅读器擅长消费feed但不擅长生产feed,遇到需要鉴权、缓存、过滤与稳定刷新时往往无从下手。它强调自托管与可组合:生成的RSS/Atom可被任何阅读器消费,并能围绕团队需求做隔离、限流与告警。

架构深度解析

规则驱动的抓取到订阅源流水线
Clawfeed 将每个内容源抽象成可配置的规则与执行管道:输入是网页或端点,输出是标准RSS/Atom项。这样设计的原因是把“抓取的不确定性”限制在规则层,业务侧只需要消费稳定的feed接口。管道通常会包含抽取、清洗、去重与排序,以保证同一内容不会在多次刷新中反复产生噪声。对运维而言,规则驱动意味着可版本化与可回滚,更新上游适配不需要大改系统结构。
可运维的刷新策略与稳定性边界
长期运行的订阅源最怕的不是单次失败,而是频率失控与不可观测的沉默。Clawfeed 通过将刷新节奏工程化,把缓存、重试、超时与失败降级纳入统一策略,从而在上游不稳定时仍能产出可消费的结果。为了避免“订阅者数=上游请求数”的放大效应,理想策略是把刷新从请求驱动切成定时驱动,并对热点源做缓存复用。最终你得到的是一个可监控、可限流、可隔离的订阅源生产层,适合团队规模化使用。

部署指南

1. 克隆项目并安装依赖(按仓库说明选择 npm/pnpm)

bash
1git clone https://github.com/kevinho/clawfeed.git && cd clawfeed && npm i

2. 配置运行参数与刷新策略(例如目标URL、刷新间隔、缓存目录)

bash
1cp .env.example .env && sed -i '' 's/REFRESH_INTERVAL=.*/REFRESH_INTERVAL=300/' .env

3. 本地启动服务并验证生成的feed输出

bash
1npm run dev

4. 容器化部署到服务器并开启健康检查与限流

bash
1docker build -t clawfeed:latest . && docker run -d --name clawfeed -p 1200:1200 clawfeed:latest

落地场景

核心场景目标人群解决方案最终收益
舆情与产品动态监控运营与产品经理将竞品更新页与公告页转成RSS并接入告警第一时间捕获变化并可归档复盘
内网知识采集与归档企业IT与安全团队自托管把外部页面更新标准化为RSS并做访问控制降低外部依赖并提升可追溯性
数据管道的更新信号层数据工程师用RSS/Atom作为统一变更信号喂给ETL与工作流降低抓取维护成本并提升稳定性

避坑指南

避坑指南
  • 上游页面结构变化会导致规则失效,建议为关键源准备降级输出与告警,并把规则更新纳入版本发布流程。
  • 高频刷新容易触发反爬与封禁,生产环境应优先使用缓存复用、定时刷新与限流来控制请求扇出。
  • 涉及登录态的源需要Cookie或令牌,务必按源隔离配置并采用最小权限,避免凭据扩散。

常见问题

Clawfeed 与 RSSHub 相比,核心差异是什么?▾
Clawfeed 更强调把单一或少量关键页面的抓取规则做成可长期运行的订阅管道,关注刷新策略、去重与稳定输出,适合团队把“关键源”工程化固化。RSSHub 更偏路由目录与大规模规则库生态,覆盖面广,路由数量与社区扩展更强。选型建议是先看你的目标:如果你需要的是大而全的路由库与现成覆盖,RSSHub更顺手;如果你更在意少量源的高可靠运行与可控策略,Clawfeed更贴近。
Clawfeed 与 RSS-Bridge 的取舍在哪里?▾
RSS-Bridge 更像一组桥接器集合,适合快速补齐缺失的订阅源,部署相对轻量。Clawfeed 的思路更偏“可运维的抓取到feed流水线”,更适合把刷新、缓存、告警与隔离当作一等需求。你如果只想补几个源,RSS-Bridge往往够用;你如果要把订阅源当成长期服务来跑,Clawfeed更有工程感。
怎么避免订阅者增多导致上游请求爆炸?▾
把刷新从请求驱动改成定时驱动:由系统按固定频率刷新一次并写入缓存,订阅者只读缓存结果。对热点源设置更长的缓存TTL并对失败做退避重试,避免短时间反复打爆上游。最后加上限流与隔离,把需要登录态的源单独实例化或单独配置,既保护凭据也保护资源。
在 GitHub 上查看

项目指标

Star 数1.3 k
编程语言HTML
开源协议MIT license
部署难度中等

Table of Contents

  1. 01项目简介
  2. 02痛点 vs 创新
  3. 03架构深度解析
  4. 04部署指南
  5. 05落地场景
  6. 06避坑指南
  7. 07常见问题

相关项目

OpenClaw
OpenClaw
25.1 k·TypeScript
CoPaw
CoPaw
1.1 k·Python
DeerFlow — 字节跳动开源超级智能体框架
DeerFlow — 字节跳动开源超级智能体框架
26.1 k·Python
gstack
gstack
0·TypeScript