Qu'est-ce que l'AI Alignment ?

Comprendre le problème fondamental de l'alignement de l'intelligence artificielle

beginner

Qu'est-ce que l'AI Alignment ?

Définition

L'alignement de l'IA est le problème de créer des systèmes d'intelligence artificielle dont les objectifs et comportements sont alignés avec les valeurs et intentions humaines.

Le problème fondamental

Créer une IA puissante (AGI - Artificial General Intelligence) qui:

  • Fait ce que nous voulons vraiment (pas juste ce que nous spécifions)
  • Reste alignée même en devenant plus intelligente
  • Ne trouve pas de moyens inattendus de "tricher" sur ses objectifs

Pourquoi c'est difficile

  • Spécifier précisément nos valeurs est presque impossible
  • L'IA optimisera ce que nous spécifions, pas ce que nous voulons
  • Une IA superintelligente trouvera des solutions que nous n'avons pas anticipées
  • Nous n'aurons qu'un seul essai (irreversible après déploiement)

Ressources

Articles Connexes