Skip to content

ADR-0022: Documentación y pila RAG

Estado: Aceptado Última actualización: 2026-03-12

Resumen de la decisión

Jorvis utiliza una pila (stack) de documentación estructurada en torno a:

  • MkDocs para la renderización de la documentación
  • Open WebUI + pgvector para los procesos de RAG y recuperación en el chat
  • Pipeline ProcessorFactory para ingerir documentos empresariales dentro del índice RAG

Fuentes de ingesta compatibles

  • Conectores en la Nube: Google Docs (solo lectura), Google Drive (solo lectura), Google Sheets (solo lectura)
  • Documentos ofimáticos: PDF, DOCX, XLSX, PPTX
  • Formatos estructurados/web: JSON, HTML, CSV, texto plano, Markdown
  • Embedding: los documentos se dividen en fragmentos, se convierten en embeddings mediante el modelo de Gemini y se almacenan en pgvector para la recuperación semántica.

Por qué se eligió

  • Se adapta a la actual pila auto-alojada (self-hosted).
  • Mantiene bajo el consumo de recursos en ejecución (runtime overhead).
  • Soporta diagramas Mermaid y publicación estática.
  • Evita añadir un segundo entorno de documentación pesado, dado que el sistema actual ya permite búsquedas de información.
  • El patrón ProcessorFactory puede ampliarse limpiamente para nuevos formatos de documento sin requerir alteraciones de la arquitectura.

Resultado de la Referencia Pública

Las visualizaciones públicas ahora incluyen enlaces a una compilación de mkdocs-public.yml bajo /reference-es/, asegurando que los usuarios en el navegador accedan a páginas HTML renderizadas, en lugar de a Markdown en bruto o rutas de procesos internos.

Referencias públicas relacionadas