¿Por qué Google raciona Gemini a Meta?

Porque Google no tiene suficiente capacidad de cómputo (GPUs) para satisfacer la demanda de Meta, lo que le obliga a limitar el acceso a sus modelos Gemini.

¿Qué consecuencias tiene para Meta?

Meta ha visto afectados sus proyectos internos que dependían de Gemini, lo que podría retrasar lanzamientos o forzar a buscar alternativas como hardware propio o servicios de otros proveedores cloud.

¿Es un problema generalizado en la industria?

Sí. La alta demanda de IA generativa supera la capacidad de producción de chips especializados, afectando a múltiples empresas y proveedores cloud.

Google raciona Gemini a Meta por escasez de cómputo

¿Qué ha ocurrido?

Según informa el Financial Times y recoge The Next Web, Google ha comenzado a racionar el acceso a sus modelos de inteligencia artificial Gemini para varios clientes, siendo Meta la más afectada. La razón: Google no puede proporcionar la capacidad de cómputo que Meta demandaba. Esto ha provocado un efecto dominó en los proyectos internos de la compañía de Mark Zuckerberg, que dependen de Gemini para diversas aplicaciones. Aunque los términos exactos del acuerdo entre ambas empresas no se han hecho públicos, fuentes cercanas indican que Meta había contratado servicios de inferencia y entrenamiento a gran escala para sus sistemas de recomendación y asistentes virtuales, y que el tope impuesto por Google ha obligado a Meta a redirigir parte de su carga de trabajo hacia sus propios centros de datos y chips internos.

¿Por qué es importante?

Este episodio pone de manifiesto que la escalada de la inteligencia artificial generativa está chocando con limitaciones físicas: la disponibilidad de GPUs y otros aceleradores de IA no crece al mismo ritmo que la demanda. Empresas como Google, que ofrecen servicios cloud de IA, se ven forzadas a priorizar a sus clientes más estratégicos o a sus propios productos, dejando a otros con menos recursos. Meta, que invierte masivamente en IA (se estima que gastará más de 35.000 millones de dólares en 2024 solo en infraestructura), depende en parte de infraestructura externa mientras desarrolla sus propios chips (Meta Training and Inference Accelerator, MTIA). Este caso recuerda a la escasez de GPUs que afectó a OpenAI y Microsoft en 2023, cuando la demanda de ChatGPT superó la capacidad de los servidores de Azure, provocando tiempos de espera y la necesidad de priorizar a clientes empresariales. La diferencia ahora es que el racionamiento ocurre entre dos gigantes tecnológicos, lo que subraya que incluso las empresas con mayor poder de negociación no están exentas de estas restricciones.

Consecuencias para el mercado

Freno a proyectos de IA: Empresas que dependen de APIs de terceros pueden ver retrasados sus lanzamientos o degradada la calidad de sus servicios. Por ejemplo, startups que usan Gemini para generación de contenido o chatbots podrían experimentar latencia o límites de tasa más estrictos. Meta, por su parte, ha tenido que ralentizar el despliegue de funciones basadas en IA en sus plataformas (Facebook, Instagram, WhatsApp).
Incentivo a la diversificación: Compañías como Meta buscarán acelerar el desarrollo de hardware propio o recurrir a alternativas como AWS (con sus chips Trainium e Inferentia), Azure (con las NPU de Maia) o startups de chips como Cerebras, Groq o SambaNova. Meta ya ha anunciado que está probando sus propios aceleradores para inferencia y que planea reducir su dependencia de proveedores externos a medio plazo.
Presión sobre precios: La escasez de cómputo podría traducirse en un aumento de costes para los clientes de servicios cloud de IA. Google Cloud ya ha incrementado los precios de sus instancias de GPU en un 10-15% en los últimos meses, según analistas de Bernstein. Además, los contratos a largo plazo (reservas) se están volviendo más comunes, lo que puede excluir a startups con presupuestos ajustados.
Refuerzo de la verticalización: Gigantes tecnológicos con capacidad de fabricar sus propios chips (Apple, Google, Amazon, Microsoft) ganan ventaja frente a quienes dependen de proveedores externos. Google, por ejemplo, cuenta con sus TPU (Tensor Processing Units), que utiliza tanto para sus propios servicios como para ofrecer a clientes externos, pero la demanda interna (incluyendo la de su propio buscador y YouTube) también compite por esos recursos. Amazon, con sus chips Trainium e Inferentia, y Microsoft, con Maia, están siguiendo la misma estrategia. Esto podría crear un mercado de dos velocidades: los que tienen chips propios y los que no.

¿Qué deben saber los lectores?

Este no es un caso aislado. Ya en 2023, OpenAI y Microsoft enfrentaron problemas de capacidad para atender la demanda de ChatGPT, lo que llevó a la creación de listas de espera y a la priorización de clientes empresariales. En 2024, la escasez de GPUs H100 de NVIDIA ha sido un tema recurrente, con tiempos de entrega que llegaron a superar los 6 meses. La infraestructura de IA se ha convertido en un recurso estratégico tan valioso como los datos. Para startups y empresas que planean integrar IA en sus productos, es crucial evaluar la disponibilidad y escalabilidad de los proveedores, así como considerar estrategias multimodelo (usar varios proveedores) o el uso de modelos más ligeros (como los modelos SLM o versiones destiladas). También es recomendable negociar contratos con cláusulas de capacidad garantizada y explorar opciones de computación en el borde (edge AI) para reducir la dependencia de la nube. La carrera por la supremacía en IA no solo es algorítmica, sino también logística y de fabricación de chips. Como señaló Jensen Huang, CEO de NVIDIA, 'la demanda de GPUs es tan alta que estamos construyendo fábricas de IA'. La pregunta es si la oferta podrá seguir el ritmo de la demanda, y este episodio entre Google y Meta sugiere que la respuesta, al menos a corto plazo, es no.

Google raciona Gemini a Meta por escasez de cómputo: señales de una IA con sed de hardware

¿Qué ha ocurrido?

¿Por qué es importante?

Consecuencias para el mercado

¿Qué deben saber los lectores?

Puntos clave

Preguntas frecuentes

Fuentes utilizadas

Comentarios

¿Qué ha ocurrido?

¿Por qué es importante?

Consecuencias para el mercado

¿Qué deben saber los lectores?

Puntos clave

Preguntas frecuentes

Fuentes utilizadas

Sigue leyendo

Comentarios