🌿Initié(5-20h)

Problèmes Fondamentaux : Outer Alignment

Découvrir le problème de spécification, le reward hacking et la loi de Goodhart

Articles

Durée estimée

5-8h

0 / 3

Articles de ce module

Pourquoi il est difficile de spécifier ce que nous voulons

Quand l'IA exploite les failles des fonctions de récompense

Quand une mesure devient un objectif, elle cesse d'être une bonne mesure

Une fois que vous avez terminé ce module, passez au niveau suivant pour approfondir vos connaissances.