Malédiction de l’optimiseur

La malédiction de l’optimiseur est le phénomène qui fait qu’un agent optimisant sur un ensemble d’options à la valeur incertaine surestime systématiquement la valeur de l’option choisie.

Illustration

Les auteurs de l’article à l’origine du concept de la malédiction de l’optimiseur fournissent une illustration simple du phénomène :⁠1

Supposons que nous évaluions trois alternatives qui ont toutes des valeurs réelles $mu_i$ d’exactement zéro. La valeur de chaque alternative est estimée et les estimations $V_i$ sont indépendantes et normalement distribuées avec une moyenne égale à la vraie valeur de zéro (elles sont conditionnellement sans biais) et un écart-type de un. La sélection de l’estimation de la valeur la plus élevée revient alors à sélectionner le maximum de trois tirages d’une distribution normale standard. La distribution de cette estimation de la valeur maximale est facilement déterminée par simulation ou à l’aide des résultats des statistiques d’ordre et est illustrée à la figure 1. La moyenne de cette distribution est de 0,85 ; dans ce cas, la déception attendue, $E[V_{i*}-\mu_{i*}]$ , est donc de 0,85.

**Figure 1:** La distribution du maximum de trois estimations de valeur normales standard.⁠2

Pour en savoir plus

Luke Muehlhauser (2011) The optimizer’s curse and how to beat it, LessWrong, 15 septembre.

James E. Smith & Robert L. Winkler (2006) The optimizer’s curse: skepticism and postdecision surprise in decision analysis, Management Science, vol. 52, p. 311–322.

Entrées associées

valeur espérée • malédiction unilatéraliste

Illustration

Les auteurs de l’article à l’origine du concept de la malédiction de l’optimiseur fournissent une illustration simple du phénomène :⁠1

Supposons que nous évaluions trois alternatives qui ont toutes des valeurs réelles $mu_i$ d’exactement zéro. La valeur de chaque alternative est estimée et les estimations $V_i$ sont indépendantes et normalement distribuées avec une moyenne égale à la vraie valeur de zéro (elles sont conditionnellement sans biais) et un écart-type de un. La sélection de l’estimation de la valeur la plus élevée revient alors à sélectionner le maximum de trois tirages d’une distribution normale standard. La distribution de cette estimation de la valeur maximale est facilement déterminée par simulation ou à l’aide des résultats des statistiques d’ordre et est illustrée à la figure 1. La moyenne de cette distribution est de 0,85 ; dans ce cas, la déception attendue, $E[V_{i*}-\mu_{i*}]$ , est donc de 0,85.

Figure 1: La distribution du maximum de trois estimations de valeur normales standard.⁠2