Liquid AI lanza LFM2.5-230M: el modelo que democratiza la extracción de datos en el edge
Con solo 230 millones de parámetros, supera a modelos cuatro veces más grandes en benchmarks de extracción y puede ejecutarse en smartphones, laptops y robots.
26 de junio de 2026 · 3 min de lectura

¿Qué ha ocurrido?
Liquid AI, fundada por exinvestigadores del MIT, ha lanzado LFM2.5-230M, su modelo de lenguaje más pequeño hasta la fecha. Con solo 230 millones de parámetros, está diseñado específicamente para flujos de trabajo agentivos en dispositivos locales, como smartphones, laptops y sistemas robóticos. Según la compañía, el modelo supera en benchmarks de extracción de datos a modelos cuatro veces más grandes, como Qwen3.5-0.8B (800M) de Alibaba y Gemma 3 1B (1.000M) de Google.
El modelo utiliza la arquitectura LFM2, una combinación de convoluciones gated de corto alcance y atención grouped-query que permite manejar un contexto de hasta 32K tokens con un consumo de memoria inferior a 400MB. En pruebas sobre un Samsung Galaxy S25 Ultra, alcanza 213 tokens por segundo en decodificación, y en un Raspberry Pi 5 mantiene 42 tokens por segundo.
¿Por qué es importante?
Este lanzamiento marca un hito en la tendencia de eficiencia arquitectónica frente al escalado paramétrico. Mientras los grandes laboratorios compiten por modelos de cientos de miles de millones de parámetros, Liquid AI demuestra que es posible lograr rendimiento competitivo en tareas específicas con una fracción del costo computacional. Para las empresas, esto significa poder ejecutar extracción de datos localmente, sin depender de conexiones en la nube, reduciendo latencia, costos y riesgos de privacidad.
El modelo opera bajo una licencia comercial dual: gratuita para individuos y empresas con ingresos anuales inferiores a 10 millones de dólares, y requiere acuerdo empresarial para grandes corporaciones. Esto facilita la adopción por parte de startups y pymes, al tiempo que establece una barrera de monetización para uso a escala.
Consecuencias para el mercado y los usuarios
La irrupción de LFM2.5-230M podría acelerar la migración de cargas de trabajo de IA hacia el edge, especialmente en sectores como manufactura, logística, salud y retail, donde la extracción de datos de documentos, sensores o telemetría es crítica. Al ofrecer una alternativa viable a los modelos basados en transformadores puros, Liquid AI presiona a competidores como Google (Gemma), Microsoft (Phi-3) y Meta (Llama 3.2) para optimizar sus modelos pequeños.
Para los desarrolladores, el modelo abre la puerta a aplicaciones agentivas autónomas en dispositivos con recursos limitados, como asistentes offline, robots de servicio o sistemas de análisis en tiempo real. Sin embargo, su rendimiento superior en extracción de datos no garantiza igual desempeño en otras tareas como razonamiento complejo o generación de texto creativo, por lo que su uso debe evaluarse según el caso.
Lo que deben saber los lectores
- Arquitectura eficiente: LFM2.5-230M usa una mezcla de convoluciones y atención que reduce el costo cuadrático de la atención tradicional, permitiendo contexto largo con poca memoria.
- Rendimiento en extracción: Supera a modelos 4x mayores en benchmarks de extracción de datos, pero no está diseñado para tareas de razonamiento general.
- Despliegue ubicuo: Funciona en smartphones, laptops, Raspberry Pi y robots, con velocidades de decodificación de hasta 213 tok/s en hardware moderno.
- Licencia dual: Gratuito para ingresos <10M USD; requiere licencia paga para grandes empresas.
- Entrenamiento masivo: Preentrenado con 19 billones de tokens, lo que explica su capacidad a pesar del tamaño reducido.
Contexto y comparaciones
El movimiento de Liquid AI se inscribe en una tendencia más amplia hacia modelos compactos y especializados. Empresas como Microsoft con Phi-3 (3.8B), Google con Gemma 3 (1B) y Apple con modelos on-device han demostrado que la eficiencia es clave para la adopción masiva. Sin embargo, LFM2.5-230M reduce aún más la barrera de entrada al operar con menos de 400MB de memoria, algo que sus competidores no logran.
La clave está en la arquitectura LFM2, que abandona el transformador puro por un diseño híbrido. Esto permite a Liquid AI ofrecer inferencia rápida sin los costos de memoria de los modelos basados en atención. No obstante, al ser una arquitectura propietaria, los desarrolladores pueden enfrentar desafíos de integración con frameworks estándar como Hugging Face Transformers.
"Liquid AI demuestra que el futuro de la IA no está solo en modelos cada vez más grandes, sino en arquitecturas inteligentes que maximicen el rendimiento por parámetro."
Conclusión
LFM2.5-230M no es un modelo para todos los casos, pero para la extracción de datos en el edge representa un avance significativo. Las empresas que busquen automatizar flujos de trabajo con requisitos estrictos de latencia, privacidad o costo deberían evaluarlo. Liquid AI ha puesto sobre la mesa una alternativa real al escalado paramétrico, y el mercado responderá.
Puntos clave
- LFM2.5-230M tiene 230M parámetros pero supera a modelos de 800M y 1B en extracción de datos.
- Su arquitectura LFM2 híbrida permite contexto de 32K tokens con menos de 400MB de memoria.
- Se ejecuta en dispositivos como Samsung Galaxy S25 Ultra (213 tok/s) y Raspberry Pi 5 (42 tok/s).
- Licencia gratuita para ingresos <10M USD; paga para grandes empresas.
- Refuerza la tendencia de eficiencia arquitectónica frente al escalado paramétrico.
Preguntas frecuentes
¿Qué es LFM2.5-230M?
Es un modelo de lenguaje fundacional de 230 millones de parámetros desarrollado por Liquid AI, optimizado para extracción de datos y despliegue local en dispositivos edge.
¿Cómo se compara con otros modelos pequeños?
Supera a Qwen3.5-0.8B y Gemma 3 1B en benchmarks de extracción de datos, a pesar de ser 4 veces más pequeño.
¿En qué dispositivos puede ejecutarse?
En smartphones (Samsung Galaxy S25 Ultra), laptops, Raspberry Pi 5 y robots, gracias a su bajo consumo de memoria (<400MB).
¿Es gratuito?
Sí, para individuos y empresas con ingresos anuales menores a 10 millones de dólares. Las empresas mayores requieren una licencia comercial.
¿Qué tareas puede realizar?
Está diseñado principalmente para extracción de datos, pero también puede ejecutar flujos de trabajo agentivos en el edge.
Fuentes utilizadas
Sigue leyendo
Comentarios
Sé el primero en comentar.