Nuevos modelos de IA reabren la discusión sobre seguridad, control humano y normas públicas.
Anthropic trabaja con modelos de inteligencia artificial muy avanzados. En junio, la empresa habló de una señal importante: algunos sistemas podían ayudar a mejorar otros sistemas parecidos. A esto se le llama mejora recursiva.
La idea parece simple, pero puede ser delicada. Una IA ayuda a crear una versión mejor. Después, esa versión puede ayudar a crear otra todavía mejor. Si nadie pone límites claros, las personas pueden perder poco a poco el control sobre lo que hace la máquina.
El 12 de junio, la Casa Blanca pidió limitar el acceso de personas extranjeras a dos modelos nuevos de Anthropic, llamados Fable 5 y Mythos 5. La orden también afectaba a algunos investigadores de la propia empresa. Ante esta situación, Anthropic decidió apagar los modelos por completo.
La preocupación no era solo que la IA escribiera textos o código. Según las pruebas citadas, Mythos 5 podía hacer ciberataques completos sin ayuda humana. Un ataque de ese tipo puede dañar servicios básicos, como hospitales, transporte o redes eléctricas.
Por eso se propone una regla sencilla: antes de construir o publicar modelos tan potentes, las empresas deberían tener una licencia y pasar pruebas de seguridad. En otros sectores peligrosos, como la energía nuclear o los aviones, ya existen controles estrictos. La idea es que una tecnología con mucho riesgo debe demostrar primero que es segura.
Basado en: Stuart Russell, The Guardian
