L'article traite de l'importance de suivre les différentes versions des modèles d'IA pour évaluer leur performance.
Un nouvel outil de suivi des versions d'IA révèle que les taux de désalignement d'Opus 4.8 sont similaires à ceux de Claude Mythos Preview. Cet outil aide les utilisateurs à identifier les modèles qui méritent leur attention.