AWS Agent Toolkit: cómo usar MCP con agentes de código sin abrir demasiado la cloud

AWS Agent Toolkit convierte una noticia reciente en una decisión duradera: cómo dar acceso cloud a agentes de código sin entregarles una llave maestra.

AWS Agent Toolkit: cómo usar MCP con agentes de código sin abrir demasiado la cloud

AWS Agent Toolkit convierte una noticia reciente en una decisión duradera: cómo dar acceso cloud a agentes de código sin entregarles una llave maestra.

El 6 de mayo de 2026 AWS anunció la disponibilidad general de AWS MCP Server y lo situó dentro de Agent Toolkit for AWS. La noticia no es solo que exista otro servidor MCP. La señal técnica es que un proveedor cloud grande está intentando empaquetar documentación actual, llamadas autenticadas, skills y controles de auditoría en una capa pensada específicamente para agentes de código.

Checklist

Qué incluye AWS Agent Toolkit

El repositorio oficial de AWS describe el toolkit como un conjunto de MCP servers, skills, plugins y rules files para ayudar a agentes de IA a construir, desplegar y gestionar aplicaciones en AWS. Los plugins empaquetan configuración del MCP Server y skills para herramientas concretas. En el momento de la documentación revisada, AWS menciona plugins para Claude Code y Codex, y configuración directa para otros agentes compatibles con MCP.

La parte más importante es el AWS MCP Server gestionado. AWS documenta herramientas de conocimiento como `aws___search_documentation`, `aws___read_documentation`, `aws___retrieve_skill` y `aws___recommend`; herramientas de API como `aws___call_aws` y `aws___suggest_aws_commands`; y una herramienta `aws___run_script` para ejecutar Python en un entorno sandbox con acceso AWS.

Ese diseño intenta resolver dos problemas clásicos. Primero, el modelo no sabe qué APIs, regiones o servicios nuevos existen después de su fecha de entrenamiento. Segundo, dar al agente una shell local con AWS CLI y credenciales amplias mezcla demasiadas capacidades en un único permiso difícil de auditar.

La conclusión práctica es incómoda pero necesaria: instalar el servidor es la parte fácil. El trabajo serio está en políticas, scopes, logs, budgets, revisión de prompts de proyecto y pruebas de reversibilidad.

run_script no es una shell local

La herramienta `run_script` es una de las piezas más interesantes porque permite que el agente agrupe varias llamadas AWS, filtre resultados y compute respuestas en un solo viaje. AWS explica que se ejecuta server side en un sandbox, hereda permisos IAM y no tiene acceso de red general ni al sistema de archivos local.

Eso no la convierte en inocua. Un script con permisos de lectura puede enumerar inventario sensible. Un script con permisos de escritura puede cambiar muchos recursos rápido. Pero sí mejora el diseño frente a entregar una terminal local completa: reduces superficie, haces la operación más observable y evitas que el agente mezcle AWS, filesystem local, secretos del repo y comandos arbitrarios en el mismo espacio.

Mi regla sería permitir `run_script` primero para consultas agregadas de lectura: inventario, compliance básico, comparativas regionales, costes estimados o checks de configuración. Para mutaciones, exigiría PR de infraestructura, plan revisable y despliegue separado.

Coste y contexto

AWS insiste en que el toolkit puede reducir tokens porque mantiene corta la lista de herramientas y recupera skills/documentación bajo demanda. Eso importa. Un agente con 40 herramientas genéricas y documentación pegada en el prompt no solo cuesta más; también tiene más oportunidades de elegir mal.

Puntos a revisar

Lo que conviene comprobar

La documentación actual en tiempo real también cambia la calidad de respuestas. En el anuncio de GA, AWS usa el ejemplo de servicios recientes como S3 Vectors para mostrar que un modelo con cutoff anterior puede responder con opciones antiguas si no consulta documentación viva. Para equipos cloud, esa diferencia se nota en APIs nuevas, servicios regionales, CDK constructs y cambios de pricing.

Aun así, el ahorro de tokens no debe ocultar coste cloud real. Si un agente puede crear recursos, el coste importante puede aparecer en AWS Billing, no en el proveedor de modelos. Por eso las tareas de despliegue deben pedir estimación, tags, teardown y límites antes de ejecutar.

Checklist

Riesgo supply chain

El ecosistema de herramientas para agentes crece rápido. Un estudio sobre 177.000 herramientas MCP observó que las herramientas de acción ganaron peso con el tiempo, y otro paper sobre tool cloning encontró duplicación elevada en repositorios MCP y Skills. Eso tiene implicaciones directas: no basta con contar integraciones; hay que revisar procedencia, mantenimiento, permisos y similitud con plantillas vulnerables.

En ese contexto, que AWS publique un toolkit oficial y soportado reduce una parte del riesgo de procedencia, pero no elimina el riesgo operativo. Sigues teniendo que revisar versión, proxy local, configuración del cliente, credenciales, scopes de IAM y reglas de proyecto.

La decisión razonable no es 'solo oficiales' ni 'cualquier MCP vale'. Es una allowlist pequeña, con owners claros y revisión periódica. Las herramientas que pueden tocar cloud deben tratarse como dependencias de infraestructura, no como extensiones decorativas del editor.

Checklist de piloto

  • Empieza con un entorno sandbox o una cuenta AWS de desarrollo sin datos sensibles.
  • Activa primero documentación y skills; retrasa acciones mutables.
  • Crea una política IAM específica para el camino MCP con permisos de solo lectura.
  • Usa context keys o condiciones equivalentes para separar acciones humanas y acciones del agente.
  • Etiqueta recursos creados por flujos de agente y define una rutina de teardown.
  • Revisa CloudTrail y métricas CloudWatch después de cada sesión piloto.
  • Prohíbe secretos de producción en prompts, logs y rules files del agente.
  • Define qué comandos o herramientas requieren confirmación humana explícita.
  • Mide coste: tokens, tiempo humano, recursos AWS creados y cambios aceptados.
  • Documenta un rollback antes de permitir mutaciones reales.

La meta no es que el agente despliegue más rápido por sí solo. La meta es que llegue a una propuesta mejor informada, con menos documentación obsoleta, menos IAM demasiado amplio y más evidencia para el reviewer.

Fuentes y referencias

También te puede interesar

Amazon Q Developer: guía completaMCP en producción: seguridad, permisos y supply chainCodex con internet: sandbox y seguridadMétricas para agentes de código

Recibe una lectura semanal de herramientas IA para devs

Cada martes: Claude Code, Cursor, Copilot, MCP, agentes y herramientas nuevas. En español y sin ruido.

Suscribirme gratis