Pipeline híbrido (FTS5 + vectores + reranking)
El flujo es por etapas: recall rápido por keywords con SQLite FTS5 BM25, recall semántico con vectores y reranking local con modelos GGUF vía node-llama-cpp para priorizar respuesta útil.
QMD es un motor de búsqueda local para Markdown que indexa notas, transcripciones de reuniones, documentación y bases de conocimiento como una capa de recuperación invocable por agentes. Combina recall por palabras clave con FTS5 (BM25) de SQLite, recall semántico por vectores y, con modelos GGUF locales vía node-llama-cpp, aplica expansión de consulta y reranking para mejorar la calidad sin depender de un índice remoto. La CLI ofrece salidas estructuradas (--json/--files/--csv) y un servidor embebido de Model Context Protocol (MCP) que expone search/get/status como herramientas para flujos agentic.
| ✕Problemas Tradicionales | ✓Soluciones Innovadoras |
|---|---|
| Con muchos Markdown, grep/búsqueda por palabras clave pierde paráfrasis y señales repartidas, degradando el contexto para agentes. | QMD aplica un pipeline híbrido (FTS5/BM25 + vectores + reranking local) para equilibrar recall y respuesta útil. |
| Las integraciones suelen volcar texto completo o depender de bases vectoriales remotas, con variación de costo y privacidad. | Un servidor embebido Model Context Protocol (MCP) y salidas estructuradas permiten traer solo fragmentos necesarios. |
1bun --version1bun install -g https://github.com/tobi/qmd1qmd collection add ~/notes --name notes && qmd embed1qmd search "auth"\nqmd vsearch "login flow"\nqmd query "how to deploy"1qmd mcp| Escenario Principal | Público Objetivo | Solución | Resultado |
|---|---|---|---|
| Herramienta de recuperación local para agentes Claude | personas y equipos con agentes | indexar notas y docs locales y devolver snippets JSON | menos tokens desperdiciados y respuestas más fundamentadas |
| Capa offline para knowledge bases privadas | equipos sensibles a privacidad | ejecutar recuperación híbrida y reranking en máquinas internas | mejor búsqueda/QA sin subir contenido a DBs vectoriales externas |
| Indexación continua de reuniones y logs | líderes e ingenieros | organizar transcripciones y logs por colecciones y actualizar índices | recordar con lenguaje natural decisiones y referencias |