TheVortiq

Etiqueta

RAG

A focused woman works at a desk in a modern office environment, surrounded by plants.
Inteligencia Artificial22 de junio de 2026 · 4 min

EasyOCR vs Docling: OCR para RAG, el contexto importa

EasyOCR y Docling son dos herramientas OCR gratuitas, pero su enfoque es radicalmente distinto. Mientras EasyOCR devuelve una cadena plana de palabras, Docling reconstruye la estructura documental (secciones, figuras, tablas), lo que marca la diferencia en aplicaciones RAG empresariales.

text
Inteligencia Artificial21 de junio de 2026 · 7 min

Búsqueda de imágenes en PDFs para RAG sin coste elevado

Un artículo de Towards Data Science propone un flujo para extraer solo las imágenes relevantes de PDFs en sistemas RAG, evitando el coste de convertir todas las imágenes a texto. La clave está en un paso de filtrado con modelos ligeros que evalúa la importancia de cada imagen antes de enviarla a un OCR de pago.

a paper with a diagram on it
Inteligencia Artificial15 de junio de 2026 · 4 min

Docling: procesa PDFs para RAG localmente, sin nube

Docling permite a empresas y desarrolladores extraer contenido enriquecido de PDFs —incluyendo tablas, fórmulas y OCR— sin enviar datos a la nube. Ideal para RAG y cumplimiento normativo.

black and silver laptop computer
Inteligencia Artificial15 de junio de 2026 · 5 min

RAG no basta: el escaneo completo gana en consultas computacionales

Un análisis de Towards Data Science muestra que los sistemas RAG con ventanas de contexto más grandes no mejoran la precisión en tareas de agregación sobre grandes conjuntos de datos. La solución propuesta combina RAG para búsqueda semántica con un motor de escaneo completo para consultas computacionales, logrando un 100% de precisión en benchmarks.

a close up of a piece of luggage with text on it
15 de junio de 2026 · 4 min

Modelos de visión LLM: los nuevos parsers de PDF para RAG empresarial

Los modelos de lenguaje con capacidad visual están redefiniendo cómo las empresas procesan PDFs complejos, permitiendo extraer no solo texto sino también gráficos, tablas y diagramas para sistemas de Retrieval-Augmented Generation (RAG). Esto supone un avance significativo frente a los parsers tradicionales.