Brand LogoBrand Logo (Dark)
InicioAgentes IAKits de HerramientasSelección de GitHubEnviar AgenteBlog

Categorías

  • Generadores de Arte
  • Generadores de Audio
  • Herramientas de Automatización
  • Chatbots y Agentes IA
  • Herramientas de Código
  • Herramientas Financieras

Categorías

  • Modelos de Lenguaje
  • Herramientas de Marketing
  • No-Code y Low-Code
  • Investigación y Búsqueda
  • Video y Animación
  • Edición de Video

GitHub Selecciones

  • DeerFlow — arnés SuperAgent de código abierto de ByteDance

Últimos Blogs

  • OpenClaw frente a Composer 2 diferencias clave en automatización y codificación
  • Google AI Studio vs Anthropic Console diferencias clave para desarrolladores
  • Stitch 2.0 vs Lovable Cuál es la mejor opción en 2026
  • Guía práctica para monetizar la inteligencia artificial en 2026 como solopreneur o freelancer
  • OpenClaw vs MiniMax ¿Privacidad o comodidad en tu asistente?

Últimos Blogs

  • OpenClaw vs KiloClaw comparación de precios y facilidad de uso
  • OpenClaw vs Kimi Claw
  • GPT-5.4 vs Gemini 3.1 Pro
  • Perplexity Computer desafía a los terminales financieros: ¿El fin de una era en 2026?
  • Mejores prácticas de OpenClaw
LinkStartAI© 2026 LinkstartAI. Todos los derechos reservados.
ContáctanosAcerca de
  1. Inicio
  2. Selección de GitHub
  3. Clawfeed
Clawfeed logo

Clawfeed

Generador autoalojable web-to-RSS que extrae cambios de páginas y los normaliza a RSS/Atom para monitorización, archivo e integración con lectores.
1.3kHTMLMIT license
#rss#atom#web-to-rss#feed-generator#content-monitoring#web-scraping
#self-hosted
#docker
#alternative-to-rsshub
#alternative-to-rss-bridge
#feedly-like
#inoreader-like

¿Qué es?

Clawfeed convierte páginas sin feed nativo en salidas RSS/Atom duraderas, pasando de revisión manual a un pipeline automatizado. Funciona más como constructor de feeds que como lector, así que puedes conectar los feeds generados a Feedly o Inoreader para lectura y sincronización. En equipos, lo valioso es volver ingenierizable la captura: reglas versionables, salidas con caché, fallos con degradación y alertas, y amortiguación de la volatilidad del origen. Con despliegue en contenedores como Docker, se vuelve una capa ligera para monitorización y archivo en intranet y entornos sensibles a privacidad.

Problemas vs Innovación

✕Problemas Tradicionales✓Soluciones Innovadoras
Muchas fuentes no publican RSS, y depender de notificaciones o revisiones manuales genera retrasos, poca trazabilidad y archivo deficiente.Clawfeed convierte la extracción web en generación de feeds: scraping por reglas, refresco controlado y salidas cacheables para un servicio operable.
Los lectores consumen feeds, pero producir feeds con autenticación, caché, filtros y refresco estable suele ser complicado.Prioriza autoalojamiento y composabilidad: salidas RSS/Atom compatibles con cualquier lector, con aislamiento, rate limits y alertas para equipos.

Arquitectura en Profundidad

Canalización por reglas de scraping a feeds
Clawfeed modela cada fuente como reglas más un pipeline de ejecución: la entrada son páginas o endpoints y la salida son elementos RSS/Atom estándar. La intención es confinar la incertidumbre del scraping a la capa de reglas para que los consumidores solo vean URLs de feeds estables. El pipeline suele incluir extracción, normalización, deduplicación y ordenación para evitar re-emisiones ruidosas en cada refresco. Desde operaciones, un diseño por reglas facilita versionado y rollback, haciendo más segura la adaptación a cambios del origen.
Refresco operable y límites de fiabilidad
En feeds de larga duración, el problema real no es un fallo puntual, sino el refresco descontrolado y las roturas silenciosas. Clawfeed hace explícita la ingeniería del refresco al tratar caché, reintentos, timeouts y salidas degradadas como una política única, manteniendo feeds consumibles bajo volatilidad del origen. Para evitar el efecto abanico de suscriptores, es más robusto refrescar por temporizador con reutilización de caché en fuentes calientes que hacerlo por demanda. El resultado es una capa de producción de feeds monitorizable, con rate limits y aislamiento, adecuada para equipos.

Guía de Despliegue

1. Clona el repositorio e instala dependencias (npm/pnpm según docs)

bash
1git clone https://github.com/kevinho/clawfeed.git && cd clawfeed && npm i

2. Configura ejecución y política de refresco (targets, intervalos, caché)

bash
1cp .env.example .env && sed -i '' 's/REFRESH_INTERVAL=.*/REFRESH_INTERVAL=300/' .env

3. Arranca localmente y verifica la salida del feed

bash
1npm run dev

4. Containeriza en producción y añade health checks y rate limits

bash
1docker build -t clawfeed:latest . && docker run -d --name clawfeed -p 1200:1200 clawfeed:latest

Casos de Uso

Escenario PrincipalPúblico ObjetivoSoluciónResultado
Monitorización de cambios de productoOperaciones y PMConvertir páginas de cambios/anuncios a RSS con alertasDetectar cambios antes y con trazabilidad
Recolección y archivo en intranetIT y seguridadAutoalojar y estandarizar actualizaciones externas a RSS con control de accesoMenos dependencia externa y más trazabilidad
Capa de señal de actualización para ETLIngenieros de datosUsar RSS/Atom como señal unificada de cambios hacia ETL y flujosMenos mantenimiento y más estabilidad

Limitaciones y Consideraciones

Limitaciones y Consideraciones
  • Cambios en el marcado del origen pueden romper reglas; añade salidas degradadas y alertas y versiona reglas con el proceso de releases.
  • Refrescos frecuentes pueden activar anti-bot; usa reutilización de caché, refresco por temporizador y rate limits para controlar el abanico.
  • Fuentes con login requieren cookies o tokens; aísla credenciales por fuente y aplica mínimo privilegio para evitar filtraciones.

Preguntas Frecuentes

¿En qué se diferencia Clawfeed de RSSHub?▾
Clawfeed se centra en convertir un conjunto pequeño de páginas críticas en pipelines de feeds de larga duración con refresco controlado, deduplicación y salidas estables, ideal para fiabilidad. RSSHub se parece más a un catálogo de rutas con un ecosistema grande y cobertura amplia. Elige por objetivo: si necesitas amplitud y rutas listas, RSSHub suele ser más rápido; si priorizas fiabilidad y políticas controlables para pocas fuentes, Clawfeed encaja mejor.
¿Qué sacrificios hay frente a RSS-Bridge?▾
RSS-Bridge es una colección de bridges, ideal para cubrir huecos de forma ligera. Clawfeed es más un pipeline operable de scraping a feeds donde refresco, caché, alertas y aislamiento son de primera clase. Si solo quieres cubrir unas pocas fuentes, RSS-Bridge puede bastar; si operas feeds como servicio duradero, Clawfeed suele sentirse más ingenierizable.
¿Cómo evitar que el crecimiento de suscriptores dispare llamadas al origen?▾
Cambia de fetching por demanda a refresco por temporizador: refresca una vez por intervalo y sirve a los suscriptores desde caché. Usa TTL más largo en fuentes calientes y backoff en fallos para no golpear el origen. Añade rate limits y aísla fuentes con login en configuraciones o instancias separadas para proteger credenciales y recursos.
Ver en GitHub

Métricas del Proyecto

Estrellas1.3 k
LenguajeHTML
LicenciaMIT license
Dificultad de DespliegueMedio

Table of Contents

  1. 01¿Qué es?
  2. 02Problemas vs Innovación
  3. 03Arquitectura en Profundidad
  4. 04Guía de Despliegue
  5. 05Casos de Uso
  6. 06Limitaciones y Consideraciones
  7. 07Preguntas Frecuentes

Proyectos Relacionados

OpenClaw
OpenClaw
25.1 k·TypeScript
CoPaw
CoPaw
1.1 k·Python
DeerFlow — arnés SuperAgent de código abierto de ByteDance
DeerFlow — arnés SuperAgent de código abierto de ByteDance
26.1 k·Python
gstack
gstack
0·TypeScript