ACUÑAPEDIA

Sistema RAG Inteligente con Sincronización Automática, Búsqueda Híbrida y Análisis de Intención para el Sector Político.

ACUÑAPEDIA RAG System

Sobre el Proyecto

ACUÑAPEDIA es un sistema de Generación Aumentada por Recuperación (RAG) de última generación, diseñado para procesar y responder consultas sobre planes de gobierno de forma inteligente y en tiempo real.

Este proyecto fue una colaboración técnica de alto nivel: Irvin Acuña (YairAcuna3) desarrolló la arquitectura base y containerización, mientras que yo (iPool23) implementé las optimizaciones de producción, features avanzadas y el desarrollo continuo del sistema.

El sistema integra datos de múltiples fuentes (PDFs, artículos de prensa y MySQL), generando una base de conocimientos de 22,500+ embeddings con búsqueda híbrida y un Query Analyzer inteligente que detecta la intención del usuario automáticamente.

Detalles Técnicos

  • Autor PrincipalIrvin Acuña
  • ContribuidorPool Deza
  • Año2025-2026
  • Embeddings22,564 Indexados
  • Latencia1.2s (Streaming)

STACK TECNOLÓGICO —

Python / LangChain
FAISS Vector DB
MySQL Sync
Next.js 15
Grok AI 4.1
Real-time Monitoring
Docker / AWS EC2
Streaming Support

FUNCIONALIDADES —

Hybrid Search (Dense + Sparse)

Optimización de búsquedas combinando embeddings vectoriales con BM25 y reranking dinámico para máxima precisión.

Query Analyzer Inteligente

Detección automática de intención y categoría del usuario para ajustar el contexto y top_k de búsqueda.

MySQL Sync Automático

Pipeline de ingesta que sincroniza registros de Prensa y Obras directamente desde bases de datos relacionales.

Streaming Responses

Implementación de respuestas en tiempo real para mejorar la UX, reduciendo la percepción de latencia de 8s a 1.2s.

Desafíos Técnicos y Soluciones

01. Procesamiento Masivo de PDFs

Implementé chunking adaptativo y batch processing asincrónico para evitar errores de memoria (OOM) en archivos extensos.

02. Mejora de Accuracy (77% → 89%)

Entrenamiento del QueryAnalyzer para detectar contexto automático y ajuste dinámico de pesos BM25 para datos reales.

03. Optimización CPU

Configuración de batch size 128 y optimizaciones de hardware para despliegue productivo en EC2 sin dependencia exclusiva de GPU.

INTELIGENCIA POLÍTICA.