Aikido

Metamorfosis de la seguridad: una lista de verificación de arquitectura preparada para Mythos para ataques de IA autónomos

Escrito por
Mike Wilkes

La iniciativa Anthropic Glasswing reúne a Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks como socios de lanzamiento. Se pueden encontrar muchas publicaciones y reacciones en redes sociales, ya que es un gran acontecimiento que Anthropic mantenga su modelo Mythos Preview fuera del acceso general. Supuestamente, esto es para proporcionar a las principales empresas de software y seguridad un primer acceso para ayudar a resolver miles de vulnerabilidades descubiertas y verificadas en navegadores web, sistemas operativos y espacios de problemas de riesgo igualmente “complejos”. Ya sea que crea que Anthropic ha desarrollado un avance importante en las capacidades del modelo o que fue una brillante táctica de marketing, simplemente no puede evitar la presión de tener algo relevante y sensato que decir sobre el tema.

Créditos de la imagen: Gemini modificado Greta_oto.jpg por David Tiller, CC BY-SA 3.0

Por mi parte, tengo el honor de haber acuñado el término “Mythos-ready” al revisar y contribuir al informe publicado por la CSA y amigos (más de 250 CISOs y autores, lo cual en sí mismo es un esfuerzo de colaboración asombroso y una demostración de resiliencia comunitaria) el 12 de abril. Quería un término que fuera empoderador y, al mismo tiempo, capaz de indicar claramente que ninguna organización está “Mythos-ready” en este momento. Ni siquiera la propia Anthropic. 

Esta entrada de blog, sin embargo, adopta un enfoque diferente en comparación con el informe de la CSA y se esfuerza por esbozar el esqueleto de un marco de seguridad integral para organizaciones que se preparan para "Mythos", a medida que entramos en una nueva era de amenazas de IA autónomas capaces de descubrir y explotar vulnerabilidades a velocidad de máquina. 

La intención aquí al redactar y compartir un mapeo de marco de seguridad enfatiza el cambio de una seguridad simple basada en prompts a controles arquitectónicos robustos, abogando por una segmentación estricta, acceso de mínimo privilegio y entornos de ejecución aislados para limitar el posible "radio de explosión" de una brecha agéntica. Así es como diseñamos la arquitectura contra las amenazas autónomas.

Para mantener una ventaja defensiva, se anima a las empresas a implementar pruebas adversarias previas al lanzamiento y a "atacarse a sí mismas primero" a través de pipelines automatizados de red-teaming. La propia guía de Anthropic sobre el impacto en los equipos de seguridad destaca la importancia del juicio y la priorización de las vulnerabilidades (EPSS v4.1), no solo de ponerlas en cola para su remediación. Ni siquiera necesita acceso a Mythos Preview para empezar a hacer esto hoy. Puede usar cualquiera de sus modelos frontera favoritos y, a decir verdad, también modelos gratuitos de pesos abiertos. 

En última instancia, queremos presentar el primer borrador de un modelo de madurez y una lista de verificación práctica para asegurar que los sistemas internos sean resilientes contra modelos avanzados de IA que ahora pueden encadenar ataques de múltiples pasos y encontrar vulnerabilidades tanto en código de más de 20 años como en código de 20 minutos.

Antes de presentar una lista abrumadora de cosas que la gente debería hacer para preparar a su organización para escaneos y ataques tipo Mythos y Mythos, deberíamos considerar implementar:

  • Aprobaciones con intervención humana para acciones sensibles
  • Mantener un registro de alta fidelidad de todas las interacciones de herramientas autónomas
  • Límites del radio de impacto (mínimo privilegio, tokens con ámbito)
  • Interruptores de seguridad y detección de anomalías
  • Mejor segmentación entre sistemas y datos
  • Capas de validación de entrada/salida (particularmente agénticas)
  • Separación entre entornos de razonamiento y ejecución

Así pues, si la sabiduría colectiva indica que hemos pasado de la pregunta «¿deberíamos tener capacidades de defensa agénticas?» a «¿cuál es la mejor manera de implementar capacidades de defensa agénticas?», existen algunos principios y suposiciones axiomáticos que deben destacarse.

En sistemas agénticos, la superficie de ataque = todo lo que el agente puede tocar.

No está preparado para Mythos si se cumple alguna de estas condiciones:

  • Los agentes pueden acceder a producción con amplios privilegios permanentes.
  • Una única credencial expone múltiples entornos.
  • El uso de herramientas se registra de forma deficiente o no se registra en absoluto.
  • La publicación externa o el acceso a la red saliente están abiertos por defecto.
  • Las pruebas de seguridad se centran en los prompts en lugar de en la arquitectura y las rutas de ejecución.
  • El plan de incidentes solo asume atacantes a velocidad humana.

La tarjeta de sistema Anthropic Mythos Preview respalda la premisa de que los agentes de frontera pueden descubrir vulnerabilidades de forma autónoma, desarrollar exploits y ocasionalmente llevar a cabo acciones imprudentes, raras pero de alto impacto, lo que hace que los controles a nivel de arquitectura sean extremadamente importantes.

Aquí tiene una lista de verificación práctica de arquitectura de seguridad para la Era de Mythos. Es un primer borrador y probablemente necesitará ser revisado en función de los comentarios y futuras discusiones, pero se centra en ataques agénticos, una mayor frecuencia de brechas y en preservar la ventaja del defensor que proviene de conocer su propia arquitectura, integraciones y tiempos de lanzamiento mejor que cualquier atacante. Puede descargarlo al final de este blog.

"...creemos que los modelos de lenguaje potentes
beneficiarán más a los defensores que a los atacantes,
aumentando la seguridad general del ecosistema de software."

Project Glasswing no es solo otro capítulo en la evolución de la IA de defensa. Se siente más como una sacudida a un sistema que había quedado en silencio bajo el peso de la complejidad, el ruido y el pensamiento reactivo. Durante años, la seguridad de las aplicaciones ha flaqueado ante la aceleración de la velocidad y la escala exigidas por el desarrollo de software moderno. Lo que Glasswing representa es un cambio del monitoreo pasivo a la reanimación activa: un desfibrilador cibernético que no solo detecta amenazas, sino que restaura el ritmo, la claridad y la intención en la forma en que defendemos el software.

Con cierta inquietud, se puede asumir con seguridad que en algún Patch Tuesday no muy lejano, los resultados de apuntar Mythos Preview a los repositorios de código de Microsoft Windows nos proporcionarán un nuevo hito en vulnerabilidades. Según mi recuerdo, uno de los peores hasta ahora fue de 400 vulnerabilidades y 10 zero days. Apostaría a que podemos elevar esa cifra a 4.000 vulnerabilidades y 400 zero days, dado que Firefox incluyó 271 vulnerabilidades en la versión 150 el 21 de abril.

Al inyectar inteligencia directamente en el torrente sanguíneo de AppSec, la IA deja de ser una característica adicional y se convierte en el pulso mismo: continuo, adaptable y receptivo. Es una disciplina reanimada, una que finalmente puede operar a la misma velocidad que los sistemas que protege. Si la última década de seguridad se trató de sobrevivir, esta próxima era, impulsada por esfuerzos como Project Glasswing, trata de volver a la vida, más fuerte, más aguda y preparada para lo que venga.

Si desea aún más recursos para prepararse ante las amenazas de la IA agéntica, Aikido también ha publicado una lista de verificación de seguridad preparada para Mythos para CTOs. Échele un vistazo.

Rellene este formulario para descargar la Guía de Seguridad de Arquitectura Mythos

Compartir:

https://www.aikido.dev/blog/metamorphosis-mythos-era

Suscríbete para recibir noticias

4.7/5
¿Cansado de los falsos positivos?

Prueba Aikido como otros 100k.
Empiece ahora
Obtenga un recorrido personalizado

Con la confianza de más de 100k equipos

Reservar ahora
Escanee su aplicación en busca de IDORs y rutas de ataque reales

Con la confianza de más de 100k equipos

Empezar a escanear
Vea cómo el pentesting de IA prueba su aplicación

Con la confianza de más de 100k equipos

Empezar a probar

Asegura tu plataforma ahora

Protege tu código, la nube y el entorno de ejecución en un único sistema central.
Encuentra y corrije vulnerabilidades de forma rápida y automática.

No se requiere tarjeta de crédito | Resultados del escaneo en 32 segundos.