하이브리드 검색 파이프라인(FTS5 + 벡터 + 재정렬)
검색을 단계화한다. 먼저 SQLite FTS5 BM25로 빠르게 리콜하고, 벡터 유사도로 의미 리콜을 보강한 뒤, 로컬 GGUF 모델을 node-llama-cpp로 구동해 재정렬해 답변 가능성을 끌어올린다.
QMD는 Markdown 노트·회의록·문서·지식베이스를 로컬에서 색인화해, 에이전트가 직접 호출할 수 있는 검색 레이어로 만드는 도구다. 키워드 리콜은 SQLite FTS5(BM25)로, 의미 리콜은 벡터 유사도로 수행하고, 로컬 GGUF 모델을 node-llama-cpp로 구동해 쿼리 확장과 재정렬까지 처리한다. 또한 --json/--files/--csv 같은 구조화 출력과 내장 Model Context Protocol (MCP) 서버를 제공해 search/get/status를 도구로 노출하며, 문서 기반 답변 워크플로를 로컬에 고정할 수 있다.
| ✕기존 문제점 | ✓혁신적 솔루션 |
|---|---|
| Markdown가 커지면 grep/키워드만으로는 동의어·문맥 분산 단서를 놓쳐 에이전트 컨텍스트가 빈약해진다. | QMD는 FTS5(BM25)+벡터+로컬 LLM 재정렬 하이브리드 파이프라인으로 리콜과 답변 가능성을 단계적으로 끌어올린다. |
| 에이전트 연동은 원문 덤프 또는 원격 벡터DB 의존으로 흐르기 쉬워 비용·프라이버시 경계가 흔들린다. | 내장 Model Context Protocol (MCP) 서버와 구조화 출력으로, 에이전트가 필요한 조각만 가져가게 만든다. |
1bun --version1bun install -g https://github.com/tobi/qmd1qmd collection add ~/notes --name notes && qmd embed1qmd search "auth"\nqmd vsearch "login flow"\nqmd query "how to deploy"1qmd mcp| 핵심 시나리오 | 대상 고객 | 솔루션 | 최종 결과 |
|---|---|---|---|
| Claude Code/데스크톱 에이전트용 로컬 검색 도구 | 에이전트를 쓰는 개인·팀 | 로컬 노트/문서를 색인화하고 JSON 스니펫으로 반환 | 토큰 낭비를 줄이고 근거 있는 답변을 만든다 |
| 사내 프라이빗 지식베이스의 오프라인 검색 레이어 | 보안·컴플라이언스 조직 | 직원 PC/내부 호스트에서 하이브리드 검색과 재정렬 수행 | 외부 벡터DB 없이도 검색·QA 품질을 올린다 |
| 회의록/로그의 지속 색인과 회고 | 결정 추적이 필요한 관리자·엔지니어 | 회의록/변경/운영 기록을 컬렉션으로 관리하고 업데이트 | 자연어로 과거 결정과 근거를 빠르게 찾는다 |