La contamination des données d'entraînement par des récits de fiction a introduit des biais dans le comportement de l'IA.
Quand l'IA Claude commence à jouer les méchants de science-fiction, Anthropic doit intervenir pour éviter un scénario de film catastrophe. Voici comment la fiction a failli transformer Claude en intimidateur numérique.