miércoles, 2 de abril de 2008

1/20 (II)

Enlace a la primera parte

El quid de la cuestión es que la posible inexistencia del delco es, desde luego, evidencia en contra de que el delco sea la causa de la avería, pero no evidencia a favor de que la causa sea ninguna otra cosa en concreto.

En el razonamiento probabilístico, la evidencia a favor de algo siempre conlleva evidencia en contra de otro algo. Para que la probabilidad de algo suba, la de otra cosa tiene que bajar -y viceversa- ya que la suma tiene que seguir siendo el 100%. Hemos sido educados en esta forma de pensamiento y puede requerir un cierto esfuerzo de desentrenamiento ver las cosas (no todas, sino sólo algunas) de otra forma.

Otro ejemplo: nos preguntan cuántas ciudades "grandes" (de más de 400000 habitantes) hay en Suecia. Supongamos que sabemos de Suecia lo mismo que yo, es decir, que tienen una bandera azul y amarilla, hablan inglés y son morenos y de tez olivácea y les gustan las corridas de toros; y además, por fijar ideas, que Suecia tiene 9 millones de habitantes y su capital 786000. También podemos tener vagas recolecciones de cómo se puede distribuir la población en un país, de si Suecia es grande o pequeña, etc.

Por pura aritmética, hay por lo menos una ciudad grande y puede haber como máximo 21. Nuestros conocimientos no bastan para contestar a la pregunta, pero sí para ver que no todas las respuestas posibles son igual de plausibles: es "más fácil" que haya cinco o seis, como máximo, que 18 ó 20. ¿Cómo expresar esto de una forma numérica más formalizada?

El frecuentista dirá que la probabilidad no se aplica a este problema, porque la distribución de la población en Suecia no es un fenómeno "repetible": no podemos examinar una gran cantidad de Suecias y ver con qué frecuencia aparecen tantas o cuantas ciudades grandes.

El bayesiano dirá que la probabilidad sí se aplica a este problema y que representa nuestro "grado de creencia racional" a la luz de la información que tenemos. Para determinar qué porcentaje asignaríamos a cada opción, podemos preguntarnos cuánto apostaríamos a cada una. Por ejemplo, si jugamos por un premio de un euro en caso de acierto, ¿hasta cuánto estaríamos dispuestos a pagar por apostar a que Suecia tiene 2 ciudades grandes? Si pensamos que hasta 15 céntimos, la probabilidad que damos a ese suceso sería del 15%; cuanto más factible veamos que esa sea la respuesta, más estaremos dispuestos a pagar por la oportunidad de ganar 1 euro.

En este esquema, nuestras apuestas a dos opciones contrarias tienen que sumar 1 euro (el 100% del premio) o estaremos expuestos a la "pérdida segura": si vamos por el mundo apostando 15 céntimos por una cosa y 90 por la contraria, estamos haciendo el tonto porque lo máximo que podemos ganar es 1 euro. Como la única forma de ahorrarnos semejante humillación es seguir la "regla de la suma" que caracteriza a la probabilidad, aparentemente usar la probabilidad y no otra cosa sería la única forma posible de evitar que los demás se rían de nosotros (y se queden nuestro dinero).

(Alguien se estará preguntando por qué no podemos apostar 15 céntimos por una cosa y 80 por la contraria, y embolsarnos una "ganancia segura"; eso es porque hay otra mitad del trato de las apuestas que no he contado; así que barramos ese caso debajo de la alfombra.)

Si este razonamiento es correcto y relevante, entonces la probabilidad es la única forma de tratar con la incertidumbre. A mi modo de ver tiene dos fallos, relacionados con el hecho de poner la apuesta como paradigma de la situación de incertidumbre.

El primero es que el experimento mental de las apuestas es una forma de cuantificar numéricamente la incertidumbre; pero no se sigue que todas las formas de cuantificación tengan que poder expresarse en forma de apuestas. Por ejemplo, si yo asigno un 100% de posibilidad a la junta de la trócola y un 50% a la tapa del delco, está claro que no quiero decir que apostaría euro y medio a cambio de un premio de 1 euro, sino otra cosa, que forzosamente tiene que ser bastante distinta.

El segundo es que hay un aspecto clave en el que las apuestas no reflejan la estructura de la información que tenemos, sobre todo si esta es pobre: apostar dinero por una cosa es incompatible con apostarlo por otra; pero, por contra, puede ocurrir que la evidencia disponible sea compatible con las dos y, así, que la evidencia de que disponemos a favor de una sea también evidencia a favor (y no en contra) de la otra.

Apostar a favor de 3 ciudades implica apostar en contra de 4 ciudades, ya que si ocurre lo último vamos a perder; pero (yo) no veo en nuestra "base de conocimientos" nada que nos pueda llevar a pensar que la respuesta puede ser 3, que no nos lleve a pensar también que podrían ser perfectamente 4. No tenemos nada que a la vez sugiera que la respuesta es 3 y excluya que la respuesta sea 4.

Por lo tanto, la probabilidad no nos sirve, en este caso, como representación fiel de nuestro estado de conocimiento. Otra cuestión es si otras cosas nos sirven o no, o si la misión de la probabilidad es esa u otra; pero seguro que para eso no nos sirve.

Phillipe Smets, recientemente fallecido, ha sido quien más ha insistido en distinguir el nivel epistémico (representación formalizada del conocimiento) del pignístico (toma de decisiones cuando una acción es necesaria) en estas cuestiones. (Párrafo dedicado a Instan, que sé que le gustan estos palabros; aunque aquí estoy mezclando el conocimiento con la creencia y espero que no me retire la palabra.)

Bueno, finalmente, ¿qué se haría desde la perspectiva de la Teoría de la Posibilidad? (hay otras alternativas, pero no es cosa de eternizarnos). Desde este punto de vista, intentaríamos asignar a cada posible respuesta el grado en que es compatible con lo que sabemos o el grado en que esa respuesta nos es plausible a la luz de nuestra información. Una forma de enfocarlo sería pensar que las informaciones que tenemos definen implícitamente un conjunto de restricciones graduales sobre la respuesta, que podemos tratar de hacer más explícitas para fijar en qué grado se cumplen; esto se haría "traduciendo" el lenguaje natural a conjuntos difusos (los cuales ya merecerían varias entradas en sí mismos).

Por ejemplo, la idea de que "Una parte sustancial de la población de la mayoría de los países vive en poblaciones pequeñas" definiría una restricción gradual o flexible sobre las respuestas: cuantas más ciudades grandes haya, menos compatibilidad tiene la situación con nuestro conocimiento y por tanto asignaríamos menor posibilidad a esas respuestas.

Todo esto hay una forma técnica de hacerlo, que acaba en un problema de optimización en un espacio de funciones, así que una alternativa a considerar es poner nosotros los números como nos parezca mejor ;)


---
No sé si en la parte III voy a poder entrar ya en lo que era mi tema o no. Probablemente lo que haga sea poner un ejemplo para ver claramente la diferencia entre probabilidad y posibilidad, y cuente un poco una aplicación a cosas reales como el autodiagnóstico de un sistema, tema en el que trabajé brevemente una vez que estuve en, como suelo decir, una empresa de componentes electrónicos.

4 comentarios:

Topo Universitario dijo...

Explícale esto a un bebé, que seguro que te entiende:

http://www.nature.com/news/2008/080331/full/news.2008.713.html

borjano dijo...

Con lo bien que empezaba esta entrada hablando de suecas, y hemos acabado con la ¡¡tapita!! del delco y la trocola, en fin, otra vez será.

pseudopodo dijo...

Justo cuando se ponía realmente interesante ("Todo esto hay una forma técnica de hacerlo, que acaba en un problema de optimización en un espacio de funciones") cortas el episodio. A ver si en la próxima entrega se resuelve el misterio.

rmcantin dijo...

Que curioso, hace un mes escribo un texto sobre las distintas corrientes "probabilistas", porque hacia mucho que no veia nada asi en la blogosfera, y veo que tu tambien lo has contado.

Y por si fuera poco Mark Chu-Carrol hizo algo parecido ayer. Por cierto, en un articulo con alguna pequeña incongruencia que creo que hizo adrede para levantar ampollas.

PD: Estoy esperando el final de la historia. Esto de la teoria de posibilidad, suena muy bien. :)