Notebooks como protocolo de experimento
Cada técnica se trata como experimento ejecutable: entradas, pasos y métricas viven juntos, con parámetros expuestos para reproducibilidad y regresión.
RAG_Techniques convierte RAG de una lista de ideas en un laboratorio reproducible. Cada técnica está separada por directorios con notebooks ejecutables y explicación, para ajustar variables de chunking, transformaciones de consulta, recuperación híbrida, reranking y evaluación, y luego comparar resultados con regresión. Su valor no es otro wrapper de framework, sino exponer los “controles” que mueven la calidad: mismas fuentes y métricas para comparar y estandarizar lo que funciona en equipo. Es un cuaderno de diseño práctico para iterar rápido y con claridad.
| ✕Problemas Tradicionales | ✓Soluciones Innovadoras |
|---|---|
| RAG suele convertirse en apilar herramientas: cambiar vector DB o modelo sin desglose de variables con regresión, y los resultados no se reproducen. | RAG_Techniques separa palancas clave (chunking, transformaciones, mezclas de recuperación, reranking, evaluación) en notebooks ejecutables por carpeta, perfectos para A/B y regresión. |
| El conocimiento del equipo queda en notas y snippets dispersos, sin plantillas de experimento reutilizables. | Ejemplos ejecutables conectan intención → implementación → métricas para estandarizar experimentación y reutilizar plantillas. |
1git clone https://github.com/NirDiamant/RAG_Techniques.git && cd RAG_Techniques1python -m venv .venv && . .venv/bin/activate && pip install -U pip jupyterlab1jupyter lab1pip install -U langchain llama-index1export OPENAI_API_KEY='your_key_here'| Escenario Principal | Público Objetivo | Solución | Resultado |
|---|---|---|---|
| Revisión y selección de RAG en empresa | líderes de producto/arquitectura | comparar chunking/recuperación/reranking en el mismo corpus y métricas | decisiones con evidencia reproducible |
| Biblioteca de baselines y regresión | equipos ML/backend | plantillas de notebooks ejecutables y sets de regresión fijados | iteración más segura y deltas trazables |
| Formación y enablement interno | responsables de formación | usar carpetas por técnica como labs | alinear rápido variables y criterios de evaluación |