Normativité indirecte

La normativité indirecte est une approche du problème de l’alignement de l’IA qui tente de spécifier indirectement les valeurs de l’IA, par exemple en se référant à ce qu’un agent rationnel valoriserait dans des conditions idéalisées, plutôt que par le biais d’une spécification directe.

Pour en savoir plus

Nick Bostrom (2017) Superintelligence, Malakoff: Dunod, chap. 13.

Paul Christiano (2012) A formalization of indirect normativity, Ordinary Ideas, 21 avril.

Eliezer Yudkowsky (2013) Five theses, two lemmas, and a couple of strategic implications, Machine Intelligence Research Institute’s Blog, 5 mai.

Entrées associées

alignement de l’IA • méthode de sélection de la motivation