Retour à l'accueil
🌳Intermédiaire(20-50h)
Inner Alignment
Mesa-optimization, deceptive alignment et convergence instrumentale
Articles
3
Durée estimée
10-15h
0 / 3
Articles de ce module
1
Mesa-Optimization
Commencez iciQuand les modèles appris développent leurs propres processus d'optimisation
30 min
2
Deceptive Alignment
Quand les systèmes IA semblent alignés mais poursuivent d'autres objectifs
35 min
3
Proxy Alignment
Les risques d'optimiser pour des proxies au lieu des vrais objectifs
25 min
Prochaine étape
Une fois que vous avez terminé ce module, passez au niveau suivant pour approfondir vos connaissances.
Voir tous les modules