DeepSeek irrumpe en volumen de tokens; Anthropic domina el gasto
El lanzamiento de DeepSeek V4 dispara su cuota de tokens al 17% en un mes, mientras Anthropic capta el 65% del gasto en IA en producción.
14 de junio de 2026 · 3 min de lectura

¿Qué ha ocurrido? DeepSeek V4 revoluciona el mercado de tokens
Según el AI Gateway Production Index de Vercel (mayo de 2026), el lanzamiento de DeepSeek V4 ha provocado un cambio radical en la distribución del volumen de tokens. En abril, DeepSeek representaba menos del 1% de los tokens y menos del 0,2% del gasto. En mayo, su cuota de volumen saltó al 17%, situándose como el tercer proveedor por volumen, por delante de OpenAI. Casi todo el volumen proviene de dos modelos: deepseek/deepseek-v4-flash y deepseek/deepseek-v4-pro, ambos lanzados en mayo.
El precio de DeepSeek V4 Flash es de 0,14$ input / 0,28$ output por millón de tokens, entre 20 y 50 veces menor que los modelos comparables de Anthropic, y de 8 a 12 veces menor que otros modelos de gama media como Qwen 3.6 Plus o Kimi K2.6. Este diferencial de precio ha impulsado una adopción masiva.
¿Por qué es importante? Calidad a bajo coste para producción
Históricamente, los modelos de bajo coste no lograban capturar cuota de volumen significativa porque no superaban el umbral de calidad necesario para cargas de trabajo en producción. DeepSeek V4 ha sido el primero en lograrlo. Según Vercel, los equipos que probaron V4 contra sus evaluaciones existentes encontraron que la salida era lo suficientemente buena para enviar a producción, no solo lo suficientemente barata para probar.
Este hito abre la puerta a una nueva categoría de modelos 'value-tier' que compiten en calidad, no solo en precio. Sin embargo, el gasto total en IA sigue aumentando. El coste medio por token subió en mayo, a pesar del efecto tractor de DeepSeek, porque el trabajo que demanda modelos frontera creció más rápido que el que no lo requiere.
Consecuencias: segmentación del mercado y presión sobre los líderes
El mercado de IA en producción se está polarizando. Por un lado, los modelos de bajo coste (DeepSeek) absorben grandes volúmenes de tokens a bajo precio; por otro, los modelos frontera (Anthropic) concentran el gasto. Anthropic aumentó su cuota de tokens del 26% al 32% y su cuota de gasto del 61% al 65%. OpenAI mantuvo su cuota de tokens cerca del 13%, pero su cuota de gasto subió del 12% al 13%, indicando que los clientes pagan más por token en OpenAI.
El caso de uso de agentes de codificación IA ilustra esta división: las tareas de alto valor se envían a modelos frontera, mientras que las de bajo riesgo se derivan a modelos económicos. El enrutamiento inteligente se ha convertido en una práctica clave para optimizar presupuestos.
La lenta adopción de Gemini 3.5 Flash de Google, lanzado en mayo a un precio más alto que su predecesor, muestra que los equipos no migran automáticamente a modelos nuevos si el precio no es competitivo o el beneficio en calidad no es claro.
¿Qué deben saber los lectores?
- DeepSeek V4 ha validado el modelo de negocio low-cost de alta calidad. Es probable que veamos más competidores en este segmento.
- El gasto en IA sigue creciendo. Aunque DeepSeek reduce costes, el aumento del uso de modelos frontera impulsa el gasto total al alza.
- El enrutamiento de modelos es esencial. Las empresas deben implementar estrategias de routing para asignar tareas al modelo más rentable sin sacrificar calidad.
- Anthropic mantiene su liderazgo en gasto. Con un 65% del gasto total y entre el 70-80% en casos de uso críticos, sigue siendo el proveedor premium dominante.
- La calidad sigue siendo el factor decisivo. El éxito de DeepSeek no se debe solo al precio, sino a que superó el listón de calidad para producción.
"El ahorro de costes por sí solo no habría movido tanto el volumen de DeepSeek en un mes; los equipos encontraron la salida lo suficientemente buena para enviar a producción." — Vercel AI Gateway Production Index, junio 2026.
Contexto histórico y comparaciones
El fenómeno recuerda a la irrupción de los SSD frente a los HDD: inicialmente más caros por GB, pero con ventajas en velocidad que transformaron el mercado. Aquí, DeepSeek ofrece un precio drásticamente menor con calidad suficiente, lo que podría forzar a los líderes a ajustar sus precios o diferenciarse más claramente en calidad. La reacción de Anthropic y OpenAI será clave en los próximos meses.
Puntos clave
- DeepSeek V4 alcanzó el 17% de los tokens en AI Gateway en mayo, tercer proveedor por volumen.
- El precio de DeepSeek V4 Flash es 20-50x menor que modelos comparables de Anthropic.
- Anthropic mantiene el 65% del gasto total, con 70-80% en casos de uso críticos.
- El coste medio por token aumentó en mayo pese a la entrada de DeepSeek.
- El enrutamiento inteligente de modelos se consolida como práctica clave para optimizar presupuestos.
Preguntas frecuentes
¿Qué es AI Gateway de Vercel?
Es una plataforma que enruta billones de tokens entre aplicaciones en producción y laboratorios de IA, proporcionando datos reales de uso, separados de benchmarks y rankings.
¿Por qué DeepSeek V4 ha tenido tanto éxito?
Porque combina un precio drásticamente más bajo (hasta 50x menos que Anthropic) con una calidad que los equipos consideran suficiente para producción, algo que ningún modelo low-cost había logrado antes.
¿Anthropic está perdiendo cuota de mercado?
No. Aunque su cuota de tokens creció del 26% al 32%, su cuota de gasto aumentó del 61% al 65%, lo que indica que sigue siendo el proveedor premium dominante, especialmente en casos de uso de alto valor.
Fuentes utilizadas
Sigue leyendo
Comentarios
Sé el primero en comentar.