규칙 기반 스크래핑-피드 파이프라인
Clawfeed는 각 소스를 규칙과 실행 파이프라인으로 모델링하며, 입력은 웹페이지/엔드포인트, 출력은 표준 RSS/Atom 항목이다. 스크래핑의 불확실성을 규칙 레이어에 가두고, 다운스트림은 안정적인 피드 URL만 소비하도록 만드는 것이 목적이다. 파이프라인에는 추출, 정규화, 중복 제거, 정렬이 포함돼 갱신마다 같은 콘텐츠가 반복 방출되는 노이즈를 줄인다. 규칙 중심 설계는 버전 관리와 롤백에 유리해 상류 변경 대응을 안전하게 만든다.
