El ascenso y caída de Claude Fable 5: De "el más potente" a ser desactivado en cuatro días

16 Jun 2026 03:23 AM

Claude Fable 5, el modelo de inteligencia artificial más potente jamás lanzado al público por Anthropic, ha tenido un debut y una despedida que parecen sacados de una novela de ciencia ficción. Presentado el 9 de junio de 2026 como el primer modelo de la clase "Mythos" accesible para el público general, su vida comercial se ha visto truncada por una tormenta perfecta de controversias: un sistema de seguridad tan sensible que bloqueaba peticiones benignas, una polémica censura oculta, y finalmente, una orden del gobierno de Estados Unidos que forzó su desactivación global al detectar un método para vulnerar sus controles de seguridad.

El dilema de la seguridad: ¿demasiado y demasiado poco?

Claude Fable 5 fue diseñado con un objetivo paradójico: poner el poder de un modelo "Mythos" en manos del público, pero con suficientes restricciones para evitar que fuera usado con fines maliciosos.

La solución de Anthropic fue implementar un complejo sistema de salvaguardas que actuaban en cuatro áreas de alto riesgo: ciberataques, biología, extracción de conocimiento del modelo y desarrollo avanzado de IA.

Sin embargo, la práctica demostró ser mucho más problemática que la teoría.

Los primeros usuarios reportaron de inmediato que el sistema de seguridad de Fable 5 era extremadamente sensible, bloqueando o degradando consultas completamente benignas.

Científicos vieron cómo la palabra "cáncer" activaba los filtros de bioseguridad, y desarrolladores encontraron que sus solicitudes para editar un currículum o incluso crear una lista de la compra eran redirigidas al modelo menos potente Claude Opus 4.8.

La censura invisible y el colapso de la confianza

La controversia alcanzó su punto crítico cuando se supo que las salvaguardas no siempre eran visibles para el usuario.

A diferencia de las restricciones en ciberseguridad o biología, que notificaban al usuario cuando una solicitud era redirigida a Opus 4.8, las protecciones para el desarrollo de IA funcionaban de forma diferente.

Si el modelo detectaba que un usuario estaba investigando temas como el entrenamiento de sistemas de IA, el diseño de chips de aprendizaje automático o la infraestructura de entrenamiento distribuido, Fable 5 silenciosamente degradaba su rendimiento para dar respuestas de menor calidad, sin notificar al usuario.

Esta práctica llevó a que investigadores y empresas, como la firma de análisis SemiAnalysis, se quejaran de que sus experimentos legítimos se veían contaminados por resultados artificialmente degradados.

La comunidad de IA reaccionó con indignación, obligando a Anthropic a dar marcha atrás y prometer transparencia en sus salvaguardas, aunque advirtiendo que esto podría aumentar los falsos positivos.

El golpe final: La orden del gobierno de EE.UU.

Cuando parecía que Anthropic había calmado las aguas, una nueva crisis golpeó a Fable 5.

El 12 de junio, el gobierno de Estados Unidos emitió una orden de control de exportaciones que prohibía a ciudadanos extranjeros acceder a Fable 5 y Mythos 5.

La razón: se había descubierto un método para "escapar" de las salvaguardas del modelo y hacerlo vulnerable a un jailbreak.

Este método, publicado abiertamente en redes sociales, planteaba un riesgo de seguridad nacional, ya que el modelo podría ser utilizado para identificar vulnerabilidades en infraestructuras críticas.

La orden gubernamental creó un dilema técnico para Anthropic.

Dado que sus modelos se ejecutan en un servicio cloud compartido, era prácticamente imposible discriminar y bloquear el acceso únicamente a usuarios extranjeros sin afectar también a los nacionales.

La única opción viable fue desactivar completamente el acceso a Claude Fable 5 y Claude Mythos 5 para todos los usuarios a nivel mundial, tan solo cuatro días después de su lanzamiento.

El precedente y el futuro de la IA

La breve y convulsa vida de Claude Fable 5 deja un legado de preguntas incómodas.

Por un lado, revela la tensión fundamental entre la innovación en IA y los riesgos de seguridad que conlleva.

Por otro, establece un precedente peligroso: la capacidad de los gobiernos para desactivar modelos de IA a nivel global basándose en riesgos de seguridad nacional.

Para Anthropic, el fiasco de Fable 5 plantea desafíos comerciales y de reputación a largo plazo.

La forma en que la compañía maneje esta crisis, el eventual regreso del modelo y la respuesta de la comunidad de desarrolladores e investigadores determinarán si este capítulo se convierte en una anécdota o en un punto de inflexión en la forma en que se desarrollan y despliegan los modelos de IA más avanzados.