AWS quintuplica cuotas de AgentCore para escalar agentes de IA empresariales
Los nuevos límites por defecto eliminan cuellos de botella en producción y aceleran la adopción de agentes autónomos en las empresas.
4 de julio de 2026 · 4 min de lectura
¿Qué ha ocurrido?
AWS ha anunciado un incremento significativo de las cuotas de ejecución de Amazon Bedrock AgentCore, su servicio para orquestar agentes de IA. Los cambios incluyen:
- Sesiones activas concurrentes: de 1.000 a 5.000 en las regiones US East (N. Virginia) y US West (Oregon), y de 500 a 2.500 en el resto de regiones.
- Tokens por segundo por agente: de 25 a 200 tokens/segundo en todas las regiones.
- Tasa de creación de sesiones para despliegues en contenedores: de 100 a 400 sesiones por minuto.
Estos nuevos límites por defecto eliminan la necesidad de solicitar aumentos de cuota, un proceso que según analistas podía demorar días o semanas y frenar despliegues productivos. AWS documentó el cambio en sus notas de lanzamiento, sin previo aviso ni período de transición, lo que refleja la urgencia del mercado.
¿Por qué es importante?
El movimiento de AWS responde a una tendencia clara: las empresas están pasando de experimentar con agentes de IA a desplegarlos en producción para múltiples usuarios. Según Charlie Dai, analista principal de Forrester, “el cambio más grande no es el número de agentes, sino el paso de copilotos de una sola tarea a agentes de producción que sirven a poblaciones de usuarios más grandes”. Esto implica mayor concurrencia, agentes de larga duración y patrones de orquestación más complejos que superaban las cuotas por defecto anteriores.
Ashish Banerjee, analista senior de Gartner, señala que las nuevas cuotas reducen la fricción operativa al escalar agentes de IA de pilotos a producción. Por su parte, Amit Chandak, director de análisis de Kanerika, explica que “una solicitud de aumento de cuota en un entorno empresarial significa un ticket de soporte, una justificación de negocio y un ciclo de revisión. Son días o semanas de sobrecarga en algo que no debería bloquear un despliegue”.
Históricamente, AWS ha sido cauteloso con las cuotas por defecto para evitar abusos y garantizar la estabilidad del servicio. Sin embargo, la presión competitiva de Google Cloud y Microsoft Azure, que ya habían ajustado cuotas similares en sus servicios de IA, ha forzado a AWS a ser más agresivo. Este aumento de 5x es uno de los más pronunciados en la historia reciente de la nube, comparable al incremento de cuotas de Lambda en 2023 para soportar funciones de larga duración.
Consecuencias y contexto
El aumento de cuotas tiene implicaciones directas en la arquitectura de sistemas: los equipos ya no necesitan diseñar alrededor de límites restrictivos, lo que fomenta la adopción de patrones multi-agente y la integración con sistemas empresariales. Sin embargo, AWS advierte que la mayor capacidad se traducirá en un mayor consumo de recursos subyacentes (cómputo y runtime), lo que podría incrementar los costes operativos. Las empresas deben monitorear de cerca el uso de tokens y sesiones para evitar facturas inesperadas, ya que AWS factura por uso, no por cuota.
Este anuncio se suma a la tendencia de los hiperescalares de eliminar barreras para la adopción de IA generativa. Google Cloud y Microsoft Azure también han ajustado cuotas similares en sus servicios de IA, pero el aumento de 5x de AWS es uno de los más agresivos del mercado. En concreto, Google Cloud aumentó las cuotas de Vertex AI Agent Builder en un 3x a principios de 2024, mientras que Azure AI Agent Service permitió hasta 3.000 sesiones concurrentes por defecto. AWS ahora supera esas cifras, lo que podría presionar a los competidores a responder.
Desde una perspectiva de mercado, este cambio reduce la fricción para las startups y medianas empresas que no tienen relaciones comerciales con AWS para agilizar aumentos de cuota. Según datos de Gartner, el 60% de las empresas que experimentan con agentes de IA citan los límites de cuota como un obstáculo para pasar a producción. Con estas nuevas cuotas, se espera una aceleración en la adopción de agentes de IA en sectores como atención al cliente, automatización de procesos y análisis de datos.
¿Qué deben saber los lectores?
- Los nuevos límites están activos desde el anuncio y no requieren configuración adicional.
- Las cuotas más altas aplican solo a Amazon Bedrock AgentCore; otros servicios de AWS pueden tener límites distintos.
- Las empresas que ya hayan solicitado aumentos de cuota personalizados no se verán afectadas negativamente; los nuevos valores por defecto son un piso, no un techo.
- Se recomienda monitorear el consumo para evitar sorpresas en la facturación, ya que AWS factura por uso, no por cuota.
- Para casos de uso extremos (picos estacionales, eventos), sigue siendo posible solicitar aumentos adicionales, pero ahora la base de partida es mucho más alta.
“Las cuotas más altas cambian lo que los equipos están dispuestos a intentar sin activar un proceso de excepciones, y eso da forma a las decisiones arquitectónicas, no solo al coste.” — Amit Chandak, Kanerika
En resumen, AWS ha eliminado un cuello de botella clave para la adopción masiva de agentes de IA. Las empresas deben aprovechar esta capacidad para innovar, pero también gestionar los costes asociados. El próximo movimiento de los hiperescalares será probablemente en la optimización de costes runtime, no solo en cuotas.
Puntos clave
- AWS quintuplica las cuotas de AgentCore: hasta 5.000 sesiones concurrentes y 200 tokens/segundo por agente.
- Elimina la necesidad de solicitar aumentos de cuota, reduciendo demoras de días o semanas en despliegues.
- Responde a la demanda empresarial de pasar de pilotos a producción con múltiples agentes y usuarios.
- Los equipos pueden diseñar arquitecturas más ambiciosas sin temor a topes restrictivos.
- Se espera mayor consumo de recursos y posibles incrementos en costes operativos.
Preguntas frecuentes
¿Qué es Amazon Bedrock AgentCore?
Es un servicio de AWS que permite orquestar agentes de IA generativa, gestionando sesiones, interacciones y ejecución de tareas en entornos empresariales.
¿Los nuevos límites aplican a todas las regiones?
No. En US East (N. Virginia) y US West (Oregon) el límite es de 5.000 sesiones; en el resto de regiones es de 2.500. Los tokens por segundo (200) y la tasa de creación de sesiones (400 TPM) aplican globalmente.
¿Afecta esto a los costes?
Sí, indirectamente. Aunque las cuotas son gratuitas, el mayor uso de agentes puede incrementar el consumo de recursos de cómputo y runtime, lo que se reflejará en la factura.
¿Debo hacer algo para activar los nuevos límites?
No, los nuevos valores por defecto ya están activos. Si tenías una cuota personalizada superior, se mantiene.
Fuentes utilizadas
Sigue leyendo
Comentarios
Sé el primero en comentar.