Malédiction de l’optimiseur
La malédiction de l’optimiseur est le phénomène qui fait qu’un agent optimisant sur un ensemble d’options à la valeur incertaine surestime systématiquement la valeur de l’option choisie.
Les auteurs de l’article à l’origine du concept de la malédiction de l’optimiseur fournissent une illustration simple du phénomène :1
Supposons que nous évaluions trois alternatives qui ont toutes des valeurs réelles d’exactement zéro. La valeur de chaque alternative est estimée et les estimations sont indépendantes et normalement distribuées avec une moyenne égale à la vraie valeur de zéro (elles sont conditionnellement sans biais) et un écart-type de un. La sélection de l’estimation de la valeur la plus élevée revient alors à sélectionner le maximum de trois tirages d’une distribution normale standard. La distribution de cette estimation de la valeur maximale est facilement déterminée par simulation ou à l’aide des résultats des statistiques d’ordre et est illustrée à la figure 1. La moyenne de cette distribution est de 0,85 ; dans ce cas, la déception attendue, , est donc de 0,85.

Luke Muehlhauser (2011) The optimizer’s curse and how to beat it, LessWrong, 15 septembre.
James E. Smith & Robert L. Winkler (2006) The optimizer’s curse: skepticism and postdecision surprise in decision analysis, Management Science, vol. 52, p. 311–322.