La velocidad a la que la IA descubre vulnerabilidades ha superado la velocidad a la que las parchea.

By: blockbeats|2026/03/30 18:07:49

El 27 de marzo, un caché de datos no asegurado en Anthropic expuso alrededor de 3000 archivos internos. Una entrada de blog en borrador reveló el próximo nuevo modelo, Mythos, que Anthropic se autoevaluó como "superando con creces cualquier modelo de IA en capacidad de ciberseguridad." El mismo día, CrowdStrike y Okta cayeron un 7%, mientras que Palo Alto Networks cayó un 6%.

El pánico del mercado no se debe a que ha surgido un modelo más potente. Se debe a que el creador de este modelo afirmó que su progreso en el lado del ataque ha superado la velocidad a la que el lado de la defensa puede mantenerse al día.

Dominio de la Ciberseguridad de la IA

Según los resultados de las pruebas del benchmark académico CAIBench, en la prueba Cybench que simula un entorno real de ataque-defensa, Claude Sonnet logró una tasa de éxito del 46%. El segundo clasificado, GPT-5, estaba en un 28%, el Gemini 2.5 Pro de Google solo alcanzó un 18%, y el modelo de código abierto qwen3-32B cayó aún más bajo, hasta un 10%.

La velocidad a la que la IA descubre vulnerabilidades ha superado la velocidad a la que las parchea.

Aunque un 46% puede no parecer alto, esta es la tasa de éxito de tareas de penetración complejas, incluyendo pasos como el descubrimiento de vulnerabilidades, la construcción de cadenas de explotación y la escalada de privilegios. En una prueba más básica, la tasa de éxito de Claude ya ha alcanzado el 75%, acercándose a su límite.

La diferencia no está en quién es ligeramente mejor, sino en la magnitud. La capacidad de ataque-defensa compleja de Claude es 1.6 veces la de GPT-5 y 2.5 veces la de Gemini. En esta dimensión de la ciberseguridad, la distribución de habilidades entre los modelos no es una escalera, sino una brecha.

Duplicándose en 6 Meses

Lo que vale más la pena diseccionar no es la brecha horizontal, sino la velocidad vertical.

Según los datos oficiales de Anthropic, Sonnet 3.7, lanzado en febrero de 2025, logró una tasa de éxito del 35.9% en Cybench (10 intentos). En la segunda mitad del mismo año, Sonnet 4.5 alcanzó el 76.5%. La conclusión del equipo de investigación de Anthropic es: en un plazo de 6 meses, la tasa de éxito se duplicó.

¿Qué significa esta velocidad? En una comparación de escenarios del mundo real: Claude Opus 4.6 se utilizó para auditar la base de código de Firefox en marzo de este año. Según InfoQ, se descubrieron 22 vulnerabilidades de seguridad en un plazo de dos semanas, de las cuales 14 eran de alto riesgo. Estas vulnerabilidades habían pasado desapercibidas a pesar de años de auditorías manuales y millones de horas de pruebas de fuzzing de CPU. El equipo de seguridad de Anthropic había revelado anteriormente que Claude descubrió más de 500 vulnerabilidades de alto riesgo en múltiples proyectos de código abierto de calidad de producción, algunas de las cuales habían estado presentes durante décadas.

Y el plazo estándar de la industria para las pruebas de penetración tradicionales es de 2 a 3 semanas, y eso es solo para una aplicación. Según el Informe de Investigaciones sobre Brechas de Datos de Verizon 2025, el tiempo medio desde la divulgación pública de una vulnerabilidad crítica hasta la explotación masiva por parte de los atacantes es de 5 días, con un tiempo medio para aplicar parches de 32 a 38 días.

La velocidad a la que la IA descubre vulnerabilidades está creciendo exponencialmente, mientras que la velocidad de parcheo humano es lineal. La diferencia en el tiempo es la ventana de ataque.

En el borrador filtrado de Mythos, Anthropic escribió que este modelo "anuncia una próxima ola de modelos que pueden explotar vulnerabilidades de una manera muy superior a los esfuerzos del defensor." Basado en la curva de capacidad conocida públicamente, esto no es una exageración.

Cuanto más rápido es el lanzamiento, más urgente es la advertencia.

Si colocas las acciones de Anthropic en los últimos tres años en una línea de tiempo, verás un patrón claro: cada vez que se lanza un modelo más fuerte, es rápidamente seguido por una respuesta de seguridad de mayor nivel.

En julio de 2023, la Casa Blanca firmó un compromiso voluntario, seguido por la publicación de la primera Política de Escalado Responsable (RSP v1.0) en septiembre del mismo año. En octubre de 2024, la RSP se actualizó a v2.0, añadiendo un umbral para las capacidades de armas biológicas. En noviembre de 2025, Anthropic reveló el incidente GTG-1002. Un grupo de amenazas respaldado por China explotó alrededor de 30 organizaciones utilizando el Código Claude, con la IA ejecutando de forma independiente entre el 80% y el 90% de las operaciones tácticas a lo largo de la operación. Esta fue la primera campaña de espionaje interorganizacional a gran escala orquestada por IA documentada.

En febrero de 2026, el RSP se actualizó a la versión 3.0, con el lanzamiento simultáneo de Claude Code Security. En el mismo mes, el Pentágono etiquetó a Anthropic como un "riesgo de cadena de suministro" porque Anthropic se negó a eliminar cláusulas en el contrato que prohibían la vigilancia a gran escala y las armas totalmente autónomas. Un mes después, la filtración de Mythos reveló que Anthropic reconoció en el borrador que este modelo plantea "riesgos de seguridad en la red sin precedentes."

El ritmo de los lanzamientos de capacidades está acelerándose. Hay un intervalo de un año entre Claude 1 y Claude 3, y menos de tres meses entre Opus 4.5 y Opus 4.6. Las respuestas de seguridad también están acelerándose, pero siempre son reactivas: las capacidades se explotan primero, y los parches de políticas vienen después. La caída colectiva en las acciones de ciberseguridad el 27 de marzo es la valoración de este delta temporal.

Una encuesta de Dark Reading a principios de este año reveló que el 48% de los profesionales de ciberseguridad identificaron a los agentes impulsados por IA como el principal vector de ataque para 2026. Hace dos años, esta opción apenas estaba en la parte superior de la lista.

La estrategia de lanzamiento de Mythos de Anthropic implica proporcionar acceso anticipado a organizaciones defensivas, "dándoles una ventaja de primer movimiento." Esta declaración en sí misma reconoce la asimetría entre el ataque y la defensa. Si los defensores no necesitan una ventaja de primer movimiento, significa que los atacantes aún no han llegado a la puerta.

Te puede gustar

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.

Informe matutino | Strategy vendió 32 BTC y más de 800.000 acciones de MSTR la semana pasada; Binance anunció oficialmente su portal de trading de acciones de EE. UU.; Polymarket alcanzó una asociación exclusiva con OneFootball

Resumen de los eventos importantes del mercado el 1 de junio

Bootcamp de trading WEEXPERIENCE en Polonia: cómo WEEX y FireCrew están haciendo que el trading de criptomonedas sea accesible para todos

WEEX se asoció con Firecrew en Polonia el 29 de mayo para el bootcamp de trading WEEXPERIENCE. Lee el resumen de las sesiones de expertos sobre análisis técnico, psicología de trading y herramientas de IA que demuestran la misión de WEEX de hacer que el trading de criptomonedas sea accesible para todos.

París reina: cómo el PSG truncó el sueño del Arsenal en una final histórica de la Champions League

PSG contra Arsenal, drama, destino y una maldición de 20 años rota. Revive la final de la Champions League 2026 donde el PSG defendió su corona en una tensa tanda de penaltis, mientras el momento estelar de Ousmane Dembélé y un fallo agónico hicieron historia en Budapest.

TaiJi completa una ronda de financiación estratégica de 3,5 millones de dólares, con inversiones de Castrum Capital, Becker Ventures y Coinvestor Ventures

La plataforma de inteligencia de mercado on-chain impulsada por IA para Web3, TaiJi, anunció la finalización de una financiación estratégica de 3,5 millones de dólares, que acelerará la construcción de un nuevo motor de simulación de mercado basado en IA.

¿Bitcoin estancado cerca de los 73 000 $? Cómo los traders encuentran recompensas en un mercado lateral en junio

Bitcoin está estancado cerca de los 73 000 $ a medida que los flujos de los ETF se enfrían y la incertidumbre macroeconómica mantiene a los traders cautelosos. Así es como las campañas de recompensas como Weex Joker Party ayudan a los traders a mantenerse activos durante un mercado lateral en junio.

Cómo hacer staking de Solana: una guía paso a paso para 2026

Encuentra las mejores criptomonedas de IA en 2026 con selecciones basadas en datos: Bittensor, Render y proyectos emergentes. Incluye métricas on-chain, riesgos y guía de trading en WEEX.

Precio garantizado ya disponible en WEEX: opere con mayor precisión

Para ofrecer una experiencia de trading de futuros más fluida, los futuros de WEEX han lanzado una función de "Precio garantizado".

Última investigación del BIS: El futuro de las stablecoins y el panorama monetario global

El informe sostiene que las stablecoins fortalecerán el dominio del dólar estadounidense a corto plazo, planteando riesgos para la soberanía monetaria de los mercados emergentes y las economías en desarrollo, mientras que su trayectoria a largo plazo dependerá de sus modelos de adopción, respuestas regulatorias y la sinergia de...

Entrevista con el maestro de la macroeconomía Raoul Pal: La competencia en IA está dando lugar a una "singularidad económica", no te deshagas fácilmente de tus activos en los próximos cuatro años

En comparación con el Nasdaq, Bitcoin se encuentra actualmente en una posición de sobreventa severa dentro de su tendencia a largo plazo.

La defensa rota de los guardianes de Solana: para atacar a Hyperliquid, ¿han rescatado el guion que alguna vez criticaron de Ethereum?

El auge de HYPE desata una batalla de gigantes. Un líder de Solana critica duramente a Hyperliquid por su centralización, mientras que Arthur Hayes responde con contundencia y una apuesta de 100.000 dólares.

¿Por qué Peter Thiel, el hombre detrás de Palantir, prepara su salida de Argentina?

Palantir, el riesgo político y la autopreservación de los oligarcas tecnológicos.

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.