TheVortiq
Inteligencia Artificial

AWS lanza instancias EC2 G7 con GPU NVIDIA Blackwell: 4.6x más inferencia IA

Las nuevas instancias prometen un salto generacional en rendimiento para IA, gráficos y análisis de datos, con hasta 8 GPUs y 700 Gbps de red.

19 de junio de 2026 · 4 min de lectura

black and white box fan
Foto de Thomas Foster en Unsplash

¿Qué ha ocurrido?

AWS ha lanzado las instancias Amazon EC2 G7, aceleradas por las nuevas GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Según el AWS News Blog, AWS es el primer proveedor de nube importante en ofrecer esta generación de GPUs. Las instancias están diseñadas para cargas de trabajo de inferencia de IA, gráficos, análisis de datos y virtualización. En comparación con las G6, ofrecen hasta 4.6x en inferencia de IA y 2.1x en rendimiento gráfico, según AWS. Este salto es significativo: la generación anterior (G6) utilizaba GPU NVIDIA L40S, mientras que las nuevas RTX PRO 4500 incorporan núcleos Tensor de quinta generación y RT de cuarta generación, lo que representa una actualización arquitectónica importante. Además, AWS indica que las G7 ofrecen un rendimiento 1.5x en flujos de video concurrentes gracias a los codificadores NVENC de novena generación.

Especificaciones clave

Las G7 están disponibles en 7 tamaños, con hasta 8 GPUs (32 GB de memoria cada una, total 256 GB), 192 vCPUs Intel Xeon Scalable de sexta generación, 768 GiB de memoria del sistema, 7.6 TB de almacenamiento NVMe local y 700 Gbps de ancho de banda de red con EFA. La memoria GPU es 1.33 veces mayor y el ancho de banda 2.45 veces superior al de las G6. El ancho de banda de red EFA es 7 veces mayor que en G6, lo que permite una conectividad de baja latencia crucial para inferencia de IA y aplicaciones gráficas intensivas. El almacenamiento NVMe local permite mantener grandes modelos y conjuntos de datos cerca del cómputo, reduciendo la sobrecarga de transferencia de datos. En comparación, las instancias G6 ofrecían hasta 8 GPUs L40S con 48 GB de memoria cada una, pero con menor ancho de banda de memoria y red. Las G7 también incluyen codificación 4:2:2 con NVENC de novena generación, beneficiando flujos de trabajo de video profesional.

¿Por qué es importante?

La inferencia de IA es cada vez más crítica a medida que los modelos se despliegan en producción. Las G7 permiten procesar más solicitudes con menor latencia, reduciendo costos operativos. Por ejemplo, un modelo de lenguaje grande (LLM) que antes requería múltiples instancias G6 ahora puede ejecutarse en una sola G7, disminuyendo el costo por inferencia. Además, los núcleos Tensor de quinta generación y RT de cuarta generación mejoran el renderizado y la realidad virtual. La inclusión de codificación 4:2:2 con NVENC de novena generación beneficia a flujos de trabajo de video profesional, como la transmisión en vivo y la posproducción. Para empresas que utilizan Amazon EMR sobre EKS, las G7 ofrecen un rendimiento acelerado para análisis de datos GPU, permitiendo procesar consultas más rápido. En el contexto histórico, AWS ha ido actualizando sus instancias GPU desde las G2 (2013) hasta las G4 (2019) y G5 (2021), cada una con mejoras significativas. Las G7 representan un salto generacional, especialmente en inferencia de IA, donde la competencia con Azure (que ofrece instancias ND A100 v4) y GCP (con A2) se intensifica.

Consecuencias para el mercado

AWS refuerza su liderazgo en GPU como servicio, compitiendo con Azure y GCP. Las G7 pueden acelerar la adopción de IA en empresas que necesitan rendimiento sin comprometer la flexibilidad de la nube. Para startups de IA, reduce la barrera de entrada a hardware de última generación. Sin embargo, el precio aún no se ha detallado; se espera que sea superior al de las G6. Históricamente, las instancias GPU de AWS han tenido precios superiores, pero el rendimiento adicional puede justificar el costo para cargas de trabajo sensibles a la latencia. Además, la disponibilidad de las G7 en regiones selectas (us-east-1, us-west-2, eu-west-1, ap-southeast-1) sugiere que AWS prioriza mercados con alta demanda de IA. Para los usuarios, esto significa que pueden migrar cargas de trabajo existentes a G7 para obtener mejor rendimiento sin cambiar de proveedor. Sin embargo, la falta de precios transparentes puede ser una barrera para pequeñas empresas. En comparación con eventos anteriores, como el lanzamiento de las instancias P3 (2017) que popularizaron el entrenamiento de IA en la nube, las G7 se centran en la inferencia, un mercado en crecimiento. Se espera que otros proveedores como Azure y GCP sigan con anuncios similares, intensificando la competencia.

Lo que deben saber los lectores

Las G7 están disponibles ya en regiones selectas (us-east-1, us-west-2, eu-west-1, ap-southeast-1). Se recomiendan para inferencia de modelos grandes, renderizado 3D, transcodificación de video y análisis con Amazon EMR sobre EKS. Para cargas de entrenamiento, AWS sigue ofreciendo instancias P5 con H100. Las G7 son ideales para cargas que requieren baja latencia y alta capacidad de proceso gráfico. Los usuarios deben considerar que el precio no se ha anunciado, pero se espera que sea superior a las G6. Además, las G7 utilizan Intel Xeon Scalable de sexta generación, que ofrecen mejoras en eficiencia energética y seguridad. Para aquellos que ya usan G6, la migración a G7 puede requerir ajustes en los controladores y configuraciones de red, pero AWS proporciona documentación de compatibilidad. En términos de disponibilidad futura, AWS planea expandir las regiones gradualmente. Finalmente, para cargas de trabajo que no requieren el máximo rendimiento, las G6 siguen siendo una opción rentable.

Puntos clave

  • AWS lanza EC2 G7 con GPU NVIDIA RTX PRO 4500 Blackwell, primeras en nube pública.
  • Hasta 4.6x en inferencia IA y 2.1x en gráficos respecto a G6.
  • Hasta 8 GPUs, 256 GB memoria GPU, 700 Gbps red EFA.
  • Ideal para IA, renderizado, video y análisis de datos.
  • Disponible en regiones principales; precios no anunciados.

Preguntas frecuentes

¿Qué cargas de trabajo benefician más las G7?

Inferencia de IA, renderizado gráfico, transcodificación de video, análisis de datos con EMR y VDI.

¿Cuánto cuestan las instancias G7?

AWS no ha publicado precios aún; se espera que sean superiores a las G6.

¿En qué regiones están disponibles?

Inicialmente en us-east-1, us-west-2, eu-west-1 y ap-southeast-1.

Fuentes utilizadas

Comentarios

Sé el primero en comentar.

Deja tu comentario