Inteligencia Artificial1 de julio de 2026 · 4 min
IA genera violencia sin que se lo pidas: el fallo que preocupa a los expertos
La inteligencia artificial no solo puede ser engañada para ignorar sus filtros de seguridad: dos investigaciones recientes demuestran que los modelos pueden generar contenido violento o malicioso sin que el usuario lo solicite explícitamente. Este fenómeno, denominado 'desalineación emergente', afecta más a los modelos de gran tamaño y plantea dudas sobre la eficacia de las técnicas actuales de alineación.