ADR-0022: Documentación y pila RAG¶
Estado: Aceptado Última actualización: 2026-03-12
Resumen de la decisión¶
Jorvis utiliza una pila (stack) de documentación estructurada en torno a:
- MkDocs para la renderización de la documentación
- Open WebUI + pgvector para los procesos de RAG y recuperación en el chat
- Pipeline ProcessorFactory para ingerir documentos empresariales dentro del índice RAG
Fuentes de ingesta compatibles¶
- Conectores en la Nube: Google Docs (solo lectura), Google Drive (solo lectura), Google Sheets (solo lectura)
- Documentos ofimáticos: PDF, DOCX, XLSX, PPTX
- Formatos estructurados/web: JSON, HTML, CSV, texto plano, Markdown
- Embedding: los documentos se dividen en fragmentos, se convierten en embeddings mediante el modelo de Gemini y se almacenan en pgvector para la recuperación semántica.
Por qué se eligió¶
- Se adapta a la actual pila auto-alojada (self-hosted).
- Mantiene bajo el consumo de recursos en ejecución (runtime overhead).
- Soporta diagramas Mermaid y publicación estática.
- Evita añadir un segundo entorno de documentación pesado, dado que el sistema actual ya permite búsquedas de información.
- El patrón ProcessorFactory puede ampliarse limpiamente para nuevos formatos de documento sin requerir alteraciones de la arquitectura.
Resultado de la Referencia Pública¶
Las visualizaciones públicas ahora incluyen enlaces a una compilación de mkdocs-public.yml bajo /reference-es/, asegurando que los usuarios en el navegador accedan a páginas HTML renderizadas, en lugar de a Markdown en bruto o rutas de procesos internos.