El sábado estuve viendo 21… y aunque es entretenida, desde luego no es nada del otro mundo, y está llena de fallos de guión. Pero al principio de la película hay una escena que me dió cien patadas… aunque cuentan una historia relacionada con probabilidad que resulta paradójica, pero que realmente no lo es. La pena es que lo cuenten tan mal.
La escena a la que me refiero está al principio de la película, así que no reviento nada. Se trata de una clase de Resolución de ecuaciones no lineales, y Kevin Spacey está enseñado el método de Newton-Raphson de búsqueda de soluciones a sus alumnos. Se trata de un método que funciona con funciones bien comportadas (que no tengan saltos, y que no cambien bruscamente de inclinación), y a veces es difícil encontrar la solución si empezamos a buscar muy lejos de ella.
El caso es que, de repente, comienzan a hablar de un problema que no tiene nada que ver con el análisis matemático: ¿qué pasa si vas a un concurso de televisión donde te dan a elegir entre tres puertas, y sólo detrás de una de ellas hay premio? El presentador va a abrir una puerta, y cuando queden sólo dos puertas nos da a elegir si queremos mantener nuestra elección, o cambiarla. ¿Qué estrategia, en promedio, da mejor resultado: cambiar o no cambiar?
Intuitivamente, parecería que es indiferente: el presentador ha abierto necesariamente una de las puertas sin premio (si abre la puerta que contiene el premio premio no hay emoción, no hay lugar a poder cambiar), y por tanto nos queda una puerta con premio, y otra sin premio. Hay un 50 por ciento de posibilidades de haber acertado, así que cambiar o no cambiar sería indiferente. Sin embargo, veremos que merece la pena cambiar.
Hay 9 posibilidades de juego, según dónde esté el premio, y según la puerta que elijamos, pero por simetría nos quedaremos en considerar que siempre elegimos la puerta 1, y es el regalo el que puede estar en la puerta 1, 2, o 3.
- Si el premio está en la puerta 1, el presentador abrirá 2 o 3. Si no cambiamos, ganamos, pero si cambiamos, perdemos.
- Si el premio está en la puerta 2, el presentador siempre abrirá 3. Si no cambiamos, perdemos, pero si cambiamos, ganamos.
- Si el premio está en la puerta 3, el presentador siempre abrirá 2. Si no cambiamos, perdemos, pero si cambiamos, ganamos.
Como los tres casos son equiprobables (no tenemos información a priori sobre dónde está el premio), está claro que la mejor estrategia consiste en cambiar: en promedio, cambiando tenemos 2/3 de posibilidades de ganar, frente a sólo 1/3 si no cambiamos.
Este problema se conoce como paradoja de Monthy Hall, que era el nombre del presentador del programa Hagamos un trato (en España, tuvimos una versión, Trato Hecho, presentada por Bertín Osborne.) Podéis encontrar una explicación formal en el artículo A Genuine decision tree for the Monthy Hall problem.
El auténtico cabreo con la escena viene por el hecho de que al cambio de puerta deciden llamarlo… cambio de variable. Que no tiene nada que ver con lo que se está tratando, que es la elección de una estrategia en teoría de juegos. Y encima, el problema está mal contado, porque tuve que estar discutiéndolo para acabar de entenderlo, y todo por meter el dichoso término cambio de variable.
