Le défi le plus important

L'Iceberg de l'Alignement

Explorez les profondeurs du problème d'alignement de l'IA

~10% visible

Cliquez sur les couches pour découvrir les conceptsCliquez sur les couches

Sécurité de l'IA

Débutant

Rendre les systèmes IA sûrs et bénéfiques pour l'humanité. C'est le concept fondamental qui englobe toute la recherche sur l'alignement.

Niveau de profondeur1/11

« Comme un iceberg, la plupart des difficultés de l'alignement sont invisibles en surface »

Explorez plus

30+

Articles détaillés

5

Niveaux de progression

50+h

De contenu

100+

Ressources

Votre Parcours d'Apprentissage

Suivez un parcours progressif de 🌱 débutant à 🏔️ expert. Chaque niveau construit sur le précédent.

Commencez ici

Débutant•0-5h

Comprendre les bases de l'alignement de l'IA et pourquoi c'est important

Problèmes Fondamentaux

Initié•5-20h

Découvrir l'outer alignment, le problème de spécification et la loi de Goodhart

Inner Alignment

Intermédiaire•20-50h

Mesa-optimization, deceptive alignment et convergence instrumentale

Solutions & Recherche

Avancé•50-100h

Approches actuelles : RLHF, Constitutional AI, Interprétabilité et leurs limites

Frontières de la Recherche

ELK, scalable oversight et problèmes ouverts en recherche d'alignement

Pourquoi c'est urgent

De nombreux chercheurs estiment des probabilités très élevées de risque existentiel (50-99%+) si nous ne résolvons pas le problème de l'alignement avant le développement d'une IA de niveau humain (AGI).

"Atténuer le risque d'extinction lié à l'IA devrait être une priorité mondiale au même titre que d'autres risques à l'échelle de la société tels que les pandémies et la guerre nucléaire." — Déclaration sur le risque de l'IA (2023)

Ressources par Niveau

Papers, vidéos et cours organisés par difficulté

Organisations

MIRI, Anthropic, ARC et les acteurs clés

Cours Pratiques

Formations et programmes certifiants