Índice como artefacto
El índice se trata como entregable: build genera archivos persistentes + metadatos, y query solo carga y ejecuta, facilitando regresión reproducible entre entornos.
zvec plantea la recuperación vectorial como sistema de dos fases: offline construye índices ANN persistibles desde embeddings, online ejecuta consultas con presupuesto de recall/latencia, y la optimización de throughput (lotes, paralelismo, SIMD) está en la ruta crítica. Encaja como componente de infraestructura: en vez de adoptar una base vectorial completa, embebes ANN en búsqueda, recall de recomendación o pipelines multimodales y mantienes la iteración trazable con configs e índices versionados.
| ✕Problemas Tradicionales | ✓Soluciones Innovadoras |
|---|---|
| Si la búsqueda vectorial se pega al código de la app, formatos/params/tuning no son reproducibles y las regresiones se vuelven opacas. | zvec convierte el índice en artefacto: separa build y query, persiste/versiona índices y hace que online se enfoque en cargar y ejecutar con regresión controlable. |
| Una base vectorial completa puede ser demasiado pesada operativamente para casos de recall ligeros. | Ejecución ANN-first con optimizaciones de latencia/throughput y tradeoffs configurables de recall–rendimiento para despliegue embebido. |
1git clone https://github.com/alibaba/zvec.git && cd zvec1# Sigue los comandos de build del repo (p. ej., cargo build --release o cmake --build)1# Ejemplo: zvec build-index --input embeddings.bin --output index.zv --config config.yaml1# Ejemplo: zvec query --index index.zv --vector query.bin --topk 101# Fija набор de consultas y topK esperado; guarda métricas/salidas para comparar versiones| Escenario Principal | Público Objetivo | Solución | Resultado |
|---|---|---|---|
| Capa ANN embebible para búsqueda semántica | equipos de búsqueda/KB | embebir recall por vecinos de embeddings en el pipeline existente | más recall con latencia acotada y tuning con regresión |
| Recall vectorial para recomendación con iteración AB | recsys/crecimiento | índices offline y recall online de baja latencia | componentes versionados con AB y rollback más seguros |
| Componente local de recuperación vectorial para multimodal | equipos multimodales | ejecutar búsqueda vectorial on‑prem o edge | límites de datos claros, coste controlado y throughput escalable por hardware |