TheVortiq
Empresas

AWS lanza instancias EC2 C9g con procesadores Graviton5, un 25% más rápidas

Las nuevas instancias ofrecen memoria DDR5-8800, 5x más caché L3 y hasta 3x más rendimiento en procesamiento de paquetes, ideales para cargas intensivas y agentes de IA.

1 de julio de 2026 · 3 min de lectura

Close-up of a modern server unit in a blue-lit data center environment.
Foto de panumas nikhomkhai en Pexels

¿Qué ha ocurrido?

El 6 de mayo de 2025, AWS lanzó las instancias EC2 C9g y C9gd, las primeras basadas en los procesadores Graviton5 de diseño propio. Estas instancias están optimizadas para cargas de trabajo intensivas en cómputo, como análisis en tiempo real, procesamiento por lotes, codificación de video, modelado científico e inferencia de machine learning basada en CPU. Este lanzamiento marca un hito en la estrategia de AWS de reducir su dependencia de Intel y AMD, continuando la evolución iniciada con Graviton en 2018. Desde entonces, cada generación ha ofrecido mejoras sustanciales: Graviton2 (2020) introdujo un 40% más de rendimiento que las instancias x86 equivalentes, Graviton3 (2022) agregó soporte para bfloat16 y mejoró el rendimiento de ML, y Graviton4 (2023) duplicó el ancho de banda de memoria. Con Graviton5, AWS apunta a consolidar su liderazgo en cómputo eficiente para la era de la IA agéntica.

Especificaciones clave

Las instancias C9g ofrecen hasta un 25% más de rendimiento por vCPU en comparación con las C8g (Graviton4). Incorporan memoria DDR5 a 8800 MT/s, la más rápida de cualquier instancia en la nube, 5 veces más caché L3 y hasta 3 veces más rendimiento en procesamiento de paquetes. Están disponibles en 11 tamaños, desde medium hasta 48xlarge, más una opción bare metal. La variante C9gd agrega almacenamiento local NVMe SSD de alta velocidad. En detalle, el ancho de banda de red alcanza hasta 100 Gbps (frente a 50 Gbps en C8g) y el ancho de banda de EBS llega a 72 Gbps (frente a 40 Gbps). La memoria DDR5 a 8800 MT/s representa un salto respecto a los 4800 MT/s de Graviton4, reduciendo la latencia de acceso a datos en aplicaciones como análisis en memoria y bases de datos en tiempo real. Además, las C9gd incluyen métricas NVMe detalladas con histogramas de latencia por tamaño de E/S y granularidad de 1 segundo, accesibles mediante CloudWatch, lo que permite optimizar cargas de trabajo sensibles a la latencia.

¿Por qué es importante?

Se trata de un salto generacional significativo. La memoria más rápida y las cachés más grandes reducen la latencia de acceso a datos, mejorando el rendimiento en aplicaciones como análisis en memoria y bucles de agentes de IA. El aumento en ancho de banda de red (hasta 100 Gbps) y EBS (hasta 72 Gbps) elimina cuellos de botella en cargas de trabajo distribuidas. Según AWS, las C9g son ideales para cargas de trabajo de IA agéntica, donde la CPU es crítica para razonamiento y orquestación de tareas. A medida que la IA pasa de responder preguntas a ejecutar acciones y coordinar tareas multi-paso, la demanda de cómputo CPU crece, y estas instancias están diseñadas para ese cambio. Además, el soporte de métricas NVMe detalladas permite a los desarrolladores ajustar el rendimiento de E/S para aplicaciones como simulaciones HPC, cachés temporales de inferencia ML o búferes locales en motores de anuncios.

Consecuencias para el mercado

Con Graviton5, AWS refuerza su apuesta por silicio propio, compitiendo directamente con Intel y AMD. Para los clientes, esto se traduce en más opciones de cómputo eficiente y potencialmente menor costo por rendimiento. Históricamente, las instancias Graviton han ofrecido hasta un 40% mejor relación precio-rendimiento que las x86 equivalentes. Con Graviton5, esa brecha podría ampliarse, presionando a los fabricantes de chips tradicionales a innovar más rápido. Además, el enfoque en IA agéntica posiciona a AWS para capturar una parte creciente del gasto en inferencia de ML, que según Gartner representará el 30% del gasto total en nube para 2026. Sin embargo, la dependencia de AWS de su propio silicio también conlleva riesgos de vendor lock-in, aunque la compatibilidad con ARM y el ecosistema de código abierto mitigan parcialmente este problema.

Lo que deben saber los lectores

Las instancias ya están disponibles en las regiones US East (N. Virginia), US West (Oregon) y Europe (Ireland). Se pueden lanzar bajo modelos bajo demanda, reservados o spot. AWS también ha mejorado las métricas de NVMe, ofreciendo estadísticas detalladas de rendimiento a través de CloudWatch. Los precios no se han anunciado oficialmente, pero se espera que sigan la tendencia de generaciones anteriores: un costo por vCPU similar o ligeramente inferior al de C8g, con un rendimiento un 25% mayor. Para cargas de trabajo que requieren almacenamiento local, las C9gd ofrecen NVMe SSD de alta velocidad con métricas detalladas. Se recomienda evaluar las C9g para aplicaciones como procesamiento por lotes, codificación de video, análisis distribuido e inferencia de ML basada en CPU. Para aquellos que migran desde C8g, AWS proporciona guías de migración y herramientas como AWS Graviton Ready para validar compatibilidad.

Puntos clave

  • AWS lanza instancias EC2 C9g y C9gd con procesadores Graviton5, disponibles en 11 tamaños.
  • Ofrecen hasta 25% más rendimiento por vCPU que las C8g, con memoria DDR5-8800 y 5x más caché L3.
  • Hasta 3x más rendimiento en procesamiento de paquetes y 2x más ancho de banda EBS en el tamaño más grande.
  • Ideales para cargas de trabajo intensivas: análisis en tiempo real, batch, video encoding, modelado científico e inferencia de ML.
  • Refuerzan la estrategia de silicio propio de AWS frente a Intel y AMD.

Preguntas frecuentes

¿Qué son las instancias EC2 C9g?

Son instancias de cómputo optimizado de AWS basadas en los procesadores Graviton5, diseñadas para cargas de trabajo intensivas como análisis, batch, video encoding y ML.

¿En qué se diferencian de las C8g?

Ofrecen un 25% más de rendimiento por vCPU, memoria DDR5-8800 más rápida, 5x más caché L3, hasta 3x más rendimiento de paquetes y mayor ancho de banda de red y EBS.

¿Para qué cargas de trabajo son adecuadas?

Son ideales para análisis en tiempo real, procesamiento por lotes, codificación de video, modelado científico, inferencia de ML y cargas de IA agentiva que requieren mucha CPU.

¿Cuándo estarán disponibles?

Ya están disponibles en las regiones US East (N. Virginia), US West (Oregon) y Europe (Ireland).

Fuentes utilizadas

Comentarios

Sé el primero en comentar.

Deja tu comentario