툴킷 광장
선별된 AI 도구와 워크플로우 컬렉션을 탐색하세요
LlamaParse로 PDF를 파싱한 뒤 GPT-4o로 엄격한 청구서 JSON을 생성합니다. 결과를 Google Sheets에 기록하고 원본은 Google Drive에 보관, Telegram으로 검토 알림을 보냅니다.
이 SOP는 XPath/CSS 셀렉터에 의존하지 않고, 스크린샷을 1차 근거로 상품 데이터를 추출합니다. Google Sheets 에 URL을 관리하고, ScrapingBee 로 전체 페이지 스크린샷을 캡처한 뒤, Gemini(Gemini 1.5 Pro) 에게 읽혀 엄격한 JSON으로 받습니다.\n\n페이지가 애매할 때(동적 가격, 작은 글씨, 옵션/변형)에는 HTML 추출로 폴백하고 동일 JSON 스키마로 다시 실행합니다. 토큰 비용을 줄이려면 HTML을 더 압축적인 마크다운으로 변환해 모델에 전달하세요. 이커머스용으로 설계됐지만 디렉터리/마켓플레이스/SaaS 가격 페이지에도 확장 가능합니다. [file:81][web:82]