IA & Política

Cuando un gobierno puede apagar un modelo de IA: el caso Fable 5

23 de junio de 2026 8 min de lectura

Si te ganas la vida enviando software, este es el escenario que merece tu atención: enchufas un modelo nuevo a tu producto, a tu CI, a las funciones que ven tus clientes. Funciona. Y entonces, un viernes por la tarde, un gobierno con el que nunca has tenido trato le manda una carta a tu proveedor, y para el fin de semana el modelo ha desaparecido. No deprecado. No con rate limit. Desaparecido, para todos los clientes del planeta, con una fecha límite para pedir reembolso en lugar de un parche.

No es una hipótesis. Pasó este mes.

Aquí va el detalle que conviene asimilar primero: el "jailbreak" que desató todo esto fue pedirle al modelo que leyera una base de código concreta y corrigiera cualquier fallo de software. Esa era la amenaza a la seguridad nacional. Si has usado un asistente de programación con IA esta semana, has lanzado alguna versión exacta de ese prompt.

Qué pasó en realidad

El 9 de junio de 2026, Anthropic lanzó Claude Fable 5, el primer modelo de acceso público de su línea de clase Mythos. Fable destaca en ingeniería de software, trabajo de conocimiento y visión, y salió con límites de seguridad estrictos: en áreas de alto riesgo como ciberseguridad, biología, química y destilación, bloquea la respuesta y recurre a Claude Opus 4.8. Esos disparadores se activan, de media, en menos del 5% de las sesiones.

Tres días después era inalcanzable. El viernes 12 de junio a las 17:21 ET, una directiva de control de exportaciones del gobierno de EE. UU. ordenó a Anthropic "suspender todo acceso a Fable 5 y Mythos 5 por parte de cualquier ciudadano extranjero, esté dentro o fuera de Estados Unidos" — incluidos los propios empleados extranjeros de Anthropic. Como adelantó Axios, el secretario de Comercio, Howard Lutnick, envió la carta al CEO Dario Amodei.

El detonante fue un supuesto jailbreak. Según un funcionario de la administración citado por Axios, Comercio actuó después de que otra empresa dijera que podía hacerle jailbreak a Mythos; el gobierno primero intentó que Anthropic pausara los lanzamientos, no lo consiguió, y recurrió a los controles de exportación. La técnica demostrada era estrecha: pedirle al modelo que "lea una base de código concreta y corrija cualquier fallo de software", lo que esquiva las salvaguardas de ciber. Anthropic sostiene que la vulnerabilidad era menor e igual de accesible desde modelos de la competencia.

Aquí está la parte en la que merece la pena detenerse. La directiva apuntaba a ciudadanos extranjeros. Pero no existe un interruptor limpio que desactive un modelo alojado por nacionalidad a mitad de vuelo, así que Anthropic desactivó Fable 5 y Mythos 5 para todos los clientes del mundo para cumplir. Una norma sobre acceso extranjero acabó produciendo una caída global total.

Por qué Mythos justificaba prudencia, y Fable no

El modelo de base es genuinamente serio. Claude Mythos es un sistema de ciberseguridad de frontera capaz de encontrar y explotar vulnerabilidades de software mejor que casi cualquier humano, salvo los más expertos. Ha identificado miles de zero-days de gravedad alta, incluidos fallos en todos los sistemas operativos y navegadores web principales. Lee una base de código, ordena los archivos por superficie de ataque, formula hipótesis sobre dónde están los fallos, ejecuta el objetivo para confirmarlo y produce un exploit de prueba de concepto que funciona. No es de acceso general — fue a parar a unos 40 socios críticos (Microsoft, Apple, Google, AWS, la Linux Foundation y otros) a través de "Project Glasswing". Tratarlo con cautela es razonable.

Fable 5 es el modelo orientado al consumidor. Y la respuesta de Anthropic al presunto jailbreak fue tajante:

"Creemos que esto es un malentendido y estamos trabajando para restaurar el acceso lo antes posible."

El argumento técnico cuesta más de descartar. Anthropic señala que "la resistencia perfecta al jailbreak no es posible hoy para ningún proveedor de modelos". Si un único jailbreak demostrado — uno que además funciona en la competencia — basta para retirar un modelo, entonces ningún modelo de frontera podrá lanzarse nunca limpio. De ahí la frase que debería preocupar a todos los laboratorios:

"Si este estándar se aplicara en toda la industria, creemos que detendría prácticamente todos los nuevos despliegues de modelos de todos los proveedores de modelos de frontera."

A 20 de junio, la lectura era "Trump suaviza el tono, la directiva sigue en pie". La Casa Blanca confirmó que el presidente rebajó sus preocupaciones de seguridad nacional tras reunirse con Amodei en el G7 de Evian-les-Bains, pero el acceso seguía sin restaurarse, y ese mismo día venció el plazo de reembolso para clientes. Hay un rastreador de estado en vivo en isfableback.org.

Por qué esto es un precedente de gobernanza, no un caso aislado

Quita los detalles y lo que queda es nuevo: un Estado retiró un modelo comercial de internet, de la noche a la mañana, con una carta. No una orden judicial con fase de pruebas y apelaciones. No una ventana de cumplimiento por fases. Una directiva un viernes y un apagón global para el fin de semana.

Ya habíamos tenido caídas de proveedores, deprecaciones, cambios de precio y recortes de cuota. Lo que no habíamos visto es a un tercero — un gobierno sin relación comercial contigo — alcanzar a través de tu proveedor y apagar una dependencia sobre la que construiste. El mecanismo es el control de exportaciones, una herramienta diseñada para bienes físicos y acceso extranjero. Aplicado a un modelo alojado, "restringir el acceso extranjero" colapsa en "apágalo para todos", porque la arquitectura no admite nada más fino.

Si eres fundador, ese es un tipo de riesgo que no puedes meter en el precio con un SLA.

Tu proveedor puede ser plenamente cooperativo, plenamente solvente, estar plenamente disponible, y aun así recibir la orden de apagarse.

El giro geopolítico

Ahora la parte que se lee como una lección de estrategia escrita por alguien con un sentido del humor muy negro.

En la ventana exacta en que cayó el veto, tres lanzamientos de pesos abiertos aterrizaron en ese mismo intervalo. Cohere sacó "North Mini Code" tres días antes de la orden, Moonshot sacó "Kimi K2.7-Code" el mismo día, y Zhipu abrió "GLM-5.2" al día siguiente — con su lanzamiento programado a las 17:21, un guiño a la directiva. North Mini Code y Kimi K2.7-Code llegaron con pesos descargables; GLM-5.2 salió primero a través del Coding Plan de Zhipu, con los pesos abiertos prometidos para la semana siguiente.

La advertencia honesta: ninguno de estos modelos se construyó en respuesta al veto. Un modelo de frontera no se entrena en un fin de semana. La coincidencia temporal fue casual, oportunista como mucho. Pero la trayectoria es real: para el 21 de junio, según techtimes.com, "GLM-5.2 encabeza los rankings abiertos sobre chips de Huawei mientras Fable 5 sigue vetado".

Detente en eso. Un control de exportaciones pensado para contener capacidad coincidió con GLM-5.2, un modelo chino descargable corriendo sobre chips de Huawei, encabezando los rankings abiertos — mientras Fable 5 seguía caído. Puedes apagar una API alojada. No puedes hacer retroceder un archivo de pesos. El episodio puso el foco sobre las alternativas de pesos abiertos, aunque su sincronización fuera casual, y la conclusión de los analistas ya ha cristalizado en una frase: el riesgo de modelo es el nuevo vendor lock-in. La cobertura recomendada es una pasarela de IA multiproveedor.

La ironía de producto que nadie menciona

Aquí está el detalle al que sigo volviendo como builder. Fable 5 ya recurre a Opus 4.8 exactamente en los dominios de alto riesgo — ciberseguridad incluida — de los que supuestamente iba el veto. El comportamiento seguro por defecto ya venía en el producto. El jailbreak estrecho que lo desató todo ("lee una base de código, corrige los fallos") ataca la misma superficie que la cláusula de respaldo existe para proteger.

Y el respaldo no es un bajón de nivel. Opus 4.8 es ahora mismo el número 1 del Artificial Analysis Intelligence Index, descrito por Anthropic como dotado de "mejor criterio, más honestidad sobre su propio progreso y la capacidad de trabajar de forma independiente durante más tiempo que sus predecesores". Así que en los temas de alto riesgo que motivaron la directiva, el efecto neto fue retirar un modelo que ya delegaba esos temas en otro más seguro y mejor clasificado. Puedes argumentar que el respaldo era imperfecto — Anthropic admite que la resistencia perfecta no es posible para nadie. Pero la distancia entre "jailbreak conocido, menor y común a toda la industria, con un respaldo de seguridad diseñado" y "desactivar el modelo globalmente" es todo el debate de política, comprimido en un solo producto.

La conclusión para builders

No dejo en fuente única nada que pueda tumbar mi producto. Después de este mes, esa regla cubre también a los modelos.

La lección no es "no uses Fable" ni "no te fíes de Anthropic". Anthropic disputó públicamente los fundamentos y dijo que estaba trabajando para restaurar el acceso lo antes posible, y Opus 4.8 sigue intacto en lo más alto de los rankings. La lección es que el modo de fallo cambió de forma. Tu dependencia de un modelo puede ahora ser cortada por un actor ajeno a tu contrato, ajeno a tu jurisdicción, en un plazo que no controlas. Eso no es un problema de fiabilidad que se resuelva refrescando una página de estado.

Tres movimientos concretos:

Abstrae el modelo detrás de una pasarela. Que cambiar de proveedor sea un cambio de configuración, no una refactorización. Si el riesgo de modelo es el nuevo vendor lock-in, entonces la portabilidad — y esto es mi propia manera de verlo — es lo que te mantiene en marcha.
Ten un respaldo probado que de verdad puedas ejecutar. No un modelo del que has oído que es bueno — uno que ya tengas enchufado, evaluado sobre tus propias tareas, y que pudieras ascender a principal esta misma tarde. Los pesos abiertos forman parte ahora de una historia de resiliencia, no solo de coste.
Trata la geopolítica como un input de tu stack. Dónde está constituido tu proveedor, qué gobierno puede alcanzarlo y cómo se entrega el modelo (alojado frente a descargable) son hoy decisiones de arquitectura, no notas al pie.

El 9 de junio, el modelo de clase Mythos más reciente de acceso público estaba a una sola llamada de API de distancia. Tres días después ya no lo estaba, y nadie de los que construyeron sobre él tuvo voto. La frontera avanza rápido. Solo asegúrate de que, cuando una puerta se cierre un viernes, ya tengas otra cableada por dentro.

También publicado en Medium. Construyo todo esto en solitario, en público — andygarcia.pro.

¿Un proyecto del mismo estilo?

Diseño y despliego productos como este. Hablemos.

Hablemos