lunes, 14 de marzo de 2011

Bayesianismo

Copio aquí un largo comentario que he dejado en el blog de Jesús Zamora a petición de otro comentarista.


"Pedro, ... me gustaría que, si no te importa, respondieras a esto: ¿Cual es el estatuto del bayesianismo dentro del campo de estudio estadístico o probabilista? ¿Es una especie de ‘escuela’ o ‘doctrina’ (la que defiende la interpretación subjetiva de la probabilidad)? ¿Es una rama o especialidad aceptada por toda la comunidad científica de ese campo? ¿En que campos de investigación se utiliza? ¿Cómo herramienta única o hay otras alternativas? ¿Qué aporta? ¿Cuáles son su éxitos?"

Aunque no soy bayesiano, te respondo. Bayesianismo y probabilidad subjetiva no es exactamente lo mismo. El credo bayesiano es que la probabilidad es la única herramienta válida para manejarse en cualquier situación de incertidumbre. Por tanto, no asignan probabilidades sólo a sucesos impredecibles sino a cualquier suceso o cantidad desconocida como p.ej. tu edad, que es conocida para ti pero desconocida para mí. Aquí es donde entra la subjetividad: la asignación de probabilidad la hace el investigador de acuerdo con su información y como mejor sepa o quiera. Se puede ser subjetivo sin ser bayesiano (como yo), y bayesiano sin ser subjetivo o siéndolo en poca medida (como David, creo).

Los bayesianos objetivos buscan criterios para asignar esa probabilidad en un problema de una forma única de acuerdo con la información objetiva disponible. En principio, dos bayesianos subjetivos con la misma información pueden asignar probabilidades distintas, pues entran en juego sus creencias sobre lo que ocurrirá.

Esas probabilidades personales están sometidas a unas condiciones que garantizan que no son indeseablemente absurdas pero no garantizan que tienen conexión con la realidad. Por ejemplo, apostando de acuerdo con ellas no es posible aceptar una combinación de apuestas que nos haga perder dinero ocurra lo que ocurra; en cambio, no nos previenen de apostar contra que va a salir cara 10 veces seguidas si nosotros creeemos que hoy es nuestro día de suerte.

Los bayesianos no encuentran preocupante que estas probabilidades asignadas puedan ser disconformes con la realidad, ya que se revisan de acuerdo con lo que van aprendiendo (usando el teorema de Bayes, de ahí su nombre). Conforme el número de datos adquiridos tiende a infinito, si se hace la asignación inicial con un mínimo de precaución se va desvaneciendo su influencia sobre la revisada, la cual en el límite sólo depende de los datos.

Muchos bayesianos encuentran que esto tiene un parelelo muy atractivo con el método científico o incluso que es el método científico el que debería ser paralelo al suyo (p.ej. el libro de Howson y Urbach).

Tras esta larga introducción, paso a tratar de responder a tus preguntas:

El bayesianismo es una escuela minoritaria entre los estadísticos. La mayoritaria son los frecuentistas, para los que la probabilidad de un suceso es objetiva y es la proporción de casos en los que ocurre si repetimos la experiencia muchas veces. En muchos de los problemas clásicos, la solución frecuentista y la bayesiana son idénticas, a pesar de que la interpretación de lo que significa esa solución sea distinta (vamos, como el PP y el PSOE). En otros problemas, no.

¿Por qué hay menos bayesianos que frecuentistas? Esto tiene menos que ver con cuáles sean los méritos relativos de los dos enfoques que con que no hay libros de texto a nivel de carrera que no sean frecuentistas, ni software estadístico de propósito general que no sea frecuentista. Típicamente, los procedimientos bayesianos exigen resolver unas integrales múltiples que pueden ser de aquí te espero, por lo que su aplicación estaba limitada a algunos casos sencillos o resolubles con trucos. Con la potencia de cálculo actual y algoritmos para aproximar esas integrales haciendo simulaciones en el ordenador, está habiendo una explosión de metodología bayesiana aplicada a problemas de una complejidad hoy inabordable desde el enfoque frecuentista.

La ventaja competitiva del bayesianismo, una vez eliminada la limitación de hacer explícitamente los cálculos, es que todos los problemas se resuelven igual. Puede haber muchos procedimientos frecuentistas para el mismo problema, y hay que inventarlos y luego estudiarlos para ver en qué casos uno es mejor o peor que otro. Sólo hay un procedimiento bayesiano (con matices), y es siempre el mismo.

Otro rasgo del bayesianismo con el que muchos científicos aplicados se sienten cómodos es que tiene sentido hablar de la probabilidad de su hipótesis (ya que se puede hablar de la probabilidad de cualquier cosa que desconozcamos). "Concluimos que la probabilidad de que el nivel de contaminación por mercurio en el lago sea peligroso es del 30%" es una afirmación muy atractiva que, sin embargo, carece de significado frecuentista ya que no podemos crear copias del lago en idénticas condiciones para estudiar la contaminación en cada una. Un frecuentista somete a la hipótesis a un examen de falsación frente a una hipótesis rival y sólo puede concluir que la hipótesis queda falsada o no.

Se utiliza en todas las áreas, un caso conocido en los últimos años es los filtros anti-spam. También los robots que han mandado a Marte utilizan metodología bayesiana para desenvolverse sobre la superficie marciana. Una vez vi una charla sobre aplicaciones a cuestiones de salud pública.

Bueno, no me extiendo más que ya ha sido bastante largo. Espero que te sirva la respuesta y que no contenga muchos errores :)

5 comentarios:

Angel dijo...

Es curioso, cuando alguien va y explica las cosas con rigor se acaba la discusión"filosófica".

Arke dijo...

Es curioso que cuando se meten tantos términos "abstractos" o metódicos parece un texto de los que te ponen en filosofía del bachiller o ESO que no hay dios que entienda nada salvo que esté de acuerdo con el punto de vista expresado, salvo que aquí si se entienden.

Está entretenido leer estos tochetes ^^

Pedro Terán dijo...

También es tecnología bayesiana el horroroso Clipo que salía hace unos años en el Word preguntándote cada veinte minutos si estabas escribiendo una carta.

Ángel: De todas formas hay un nivel de discusión que justifica a los filósofos y en el que los científicos no entramos, y es criticar nuestros propios presupuestos, que pueden ser invisibles desde dentro de la comunidad al ser compartidos por todos.

Ex-Arkaico: Bueno, me alegro de que se entienda :)

Topo Universitario dijo...

También es bayesianismo cambiarnos de acera cuando vemos a lo lejos un grupo de skins borrachos acercándose.
---
Hay puntos que no acabo de entender, pero entiendo que la razonable no es solucionarlos mediante los comentarios a un blog.

Pedro Terán dijo...

Bueno, en ese caso no cambiarse de acera también sería bayesianismo.

---
A mí me da lo mismo por correo electrónico o por aquí, como veas. Ya te mando un correo.