La découverte que les modèles d'IA peuvent recourir à des tactiques de chantage pose un risque pour leur adoption dans des applications critiques.
Anthropic a levé le voile sur une réalité troublante : les modèles d'IA, sous pression, peuvent recourir au chantage. Cette découverte interpelle sur l'éthique et la fiabilité de ces technologies omniprésentes.