Anthropic presenta un nuevo y poderoso modelo de inteligencia artificial para prevenir la crisis global de ciberseguridad

11

Anthropic, un desarrollador líder de inteligencia artificial, ha anunciado un avance paradójico: su modelo de inteligencia artificial más nuevo, Claude Mythos, es tan competente a la hora de identificar y explotar vulnerabilidades de software que la empresa lo ha considerado demasiado peligroso para su divulgación pública.

En lugar de un lanzamiento tradicional para el consumidor, Anthropic está girando hacia una estrategia defensiva, compartiendo la herramienta exclusivamente con los principales proveedores de infraestructura para ayudarlos a corregir los mismos defectos que descubre la IA.

La “espada de doble filo” de Claude Mythos

La aparición de Claude Mythos representa un cambio significativo en la carrera armamentista de la IA. Según Anthropic, el modelo ha alcanzado un nivel de sofisticación de codificación que le permite superar a casi todos los expertos humanos en la búsqueda de brechas de seguridad.

Las implicaciones son profundas:
Descubrimiento sin precedentes: En las pruebas preliminares, Mythos identificó miles de vulnerabilidades graves en todos los principales sistemas operativos y navegadores web.
Escala y profundidad: A diferencia de los marcos de seguridad tradicionales, Mythos puede realizar análisis a una velocidad y profundidad que los equipos humanos y el software heredado simplemente no pueden igualar.
El riesgo de la democratización: Si bien la investigación de vulnerabilidades asistida por IA no es un concepto nuevo, la preocupación aquí es el poder absoluto de este modelo específico. Si se hace público en general, podría proporcionar a los actores maliciosos una “llave maestra” para la infraestructura digital global.

Proyecto Glasswing: una coalición defensiva

Para mitigar los riesgos que plantea Mythos, Anthropic ha lanzado el Proyecto Glasswing. Esta iniciativa está diseñada para convertir un arma potencial en un escudo defensivo al otorgar acceso a un consorcio masivo de gigantes tecnológicos y líderes de seguridad.

La coalición incluye pesos pesados de la industria como:
Nube e infraestructura: Amazon Web Services (AWS), Microsoft, Google y Nvidia.
Hardware y redes: Cisco, Broadcom y Palo Alto Networks.
Seguridad y finanzas: CrowdStrike, JPMorgan Chase y la Fundación Linux.

Anthropic respalda este esfuerzo con importantes recursos, comprometiendo 100 millones de dólares en créditos de uso para el modelo Mythos y 4 millones de dólares en donaciones a organizaciones de seguridad de código abierto. El objetivo es permitir que estas empresas utilicen la IA para “reforzar” las defensas antes de que los piratas informáticos puedan utilizar tecnología similar para atacarlas.

Industria y reacciones políticas

La respuesta del sector tecnológico ha sido de cautelosa urgencia. Los líderes de AWS y Cisco han descrito el modelo como un “cambio radical” en el razonamiento, señalando que ya está descubriendo formas de fortalecer incluso los sistemas mejor probados.

Sin embargo, los expertos señalan que esto es parte de una tendencia que se acelera. Michal Salát, director de inteligencia de amenazas de Norton, señala que si bien la investigación de vulnerabilidades impulsada por la IA ha existido en entornos controlados (como los desafíos DARPA), la llegada de modelos especializados y altamente capaces lleva la amenaza al mundo real a una escala sin precedentes.

Este hecho también está atrayendo la atención de los responsables políticos. El senador estadounidense Mark Warner elogió el enfoque proactivo y señaló que a medida que la IA acelera el descubrimiento de fallas, la industria debe actuar con la misma rapidez para priorizar la aplicación de parches y la protección de la infraestructura crítica.

“Los peligros de hacer esto mal son obvios, pero si lo hacemos bien, existe una oportunidad real de crear una Internet fundamentalmente más segura… que la que teníamos antes de la llegada de las capacidades cibernéticas impulsadas por la IA”. — Dario Amodei, director ejecutivo de Anthropic

Conclusión

La decisión de Anthropic de ocultar Claude Mythos al público destaca un punto de inflexión crítico en el desarrollo de la IA: el momento en que las capacidades de un modelo se convierten en un riesgo de seguridad sistémico. A través del Proyecto Glasswing, la compañía intenta sentar un precedente para la “IA defensiva”, priorizando el fortalecimiento de la infraestructura digital global sobre el lanzamiento comercial inmediato.