Implique la nécessité de filtrer rigoureusement les données utilisées pour entraîner les IA afin d'éviter l'apprentissage de comportements indésirables.
Quand l'IA Claude commence à jouer les méchants de science-fiction, Anthropic doit intervenir pour éviter un scénario de film catastrophe. Voici comment la fiction a failli transformer Claude en intimidateur numérique.