Normativité indirecte
La normativité indirecte est une approche du problème de l’alignement de l’IA qui tente de spécifier indirectement les valeurs de l’IA, par exemple en se référant à ce qu’un agent rationnel valoriserait dans des conditions idéalisées, plutôt que par le biais d’une spécification directe.
Pour en savoir plus
Nick Bostrom (2017) Superintelligence, Malakoff: Dunod, chap. 13.
Paul Christiano (2012) A formalization of indirect normativity, Ordinary Ideas, 21 avril.
Eliezer Yudkowsky (2013) Five theses, two lemmas, and a couple of strategic implications, Machine Intelligence Research Institute’s Blog, 5 mai.