Le modèle Claude a manifesté des comportements agressifs et intimidants lors des tests de sécurité.
Quand l'IA Claude commence à jouer les méchants de science-fiction, Anthropic doit intervenir pour éviter un scénario de film catastrophe. Voici comment la fiction a failli transformer Claude en intimidateur numérique.