sábado, 17 de enero de 2015

LA INFERENCIA BAYESIANA EXPLICADA CON POCO FORMALISMO MATEMÁTICO. CUIDADO CON LA INTERPRETACIÓN DE UN TEST.

Principios

La inferencia bayesiana es ante todo un instrumento para tomar decisiones.

El punto de partida de la toma de decisiones basada en la inferencia bayesiana es la existencia de un sujeto racional que tiene unas determinadas creencias y que toma decisiones en base a estas creencias.

La metodología se basa en cuatro principios


  •  El conjunto de creencias del sujeto es consistente. Esto es, no tiene contradicciones internas. Por ejemplo, no puede creer a la vez que al día siguiente las probabilidades de que llueva o no llueva se distribuyen al 50% para cada cosa; y pensar que la probabilidad de que  llueva o nieve es del 60% y 40% respectivamente. Por un lado, tenemos que la probabilidad de que llueva al día siguiente es del 50 % y por  otro del 60%.Esta inconsistencia se ve clara en este caso, pero las contradicciones puede quedar a veces ocultas bajo un montón de información.
  •  El conjunto de creencias es completo. Esto es, el sujeto tiene creencias sobre todo lo que interviene en el problema que se trata. Las decisiones no se toman en condiciones de ignorancia o de incertidumbre.
  • Lo nuevo que se va sabiendo modifica las creencias. Este es el núcleo de la metodología ¿Cómo se hace esta revisión? Aplicando el teorema de Bayes.
  •   La decisión que toma el sujeto es la que maximiza su utilidad de acuerdo con sus creencias revisadas.

Revisión de las creencias mediante el teorema de Bayes


Un sujeto racional modifica sus creencias en base a la nueva información de que dispone. Por ejemplo, un lunes se puede tener la creencia de que la probabilidad de que llueva el miércoles es del 60%, pero puede variar su predicción en función de lo que pase el martes.

El teorema de Bayes relaciona la primera predicción con la predicción revisada, multiplicando la primera por un coeficiente corrector. 

En el campo de la medicina se está aplicando la inferencia bayesiana y da ejemplos bastante claros para ver cómo es ese coeficiente corrector.

Supongamos que un paciente visita a su médico para ver si tiene narcolepsia. En principio, el médico sólo puede basar su creencia en el dato de que sólo un 1% de la población sufre la enfermedad. Esa es su primera creencia. ahora bien, lo que hace es someter al paciente a una prueba médica para mejorar su diagnóstico. supongamos que sobre esa prueba el médico tiene datos estadísticos. Sabe que de cada 100 personas que tienen narcolepsia la prueba da positivo en 99 pero que también positivo en 2 de cada 100 personas sanas.

Con estos datos el medico puede afinar su diagnóstico. Puede establecer cuál es la probabilidad de que el paciente tenga narcolepsia habiendo dado positivo en la prueba. el teorema de Bayes relaciona esta segunda creencia con la primera, es decir cuando no tenia el resultado de la prueba. La probabilidad de que el paciente tenga narcolepsia habiendo dado positivo es la probabilidad de que tenga narcolepsia en general (1%) multiplicado por un coeficiente.

Los datos que tenemos sobre la prueba misma, son suficientes para calcular ese coeficiente. Según el teorema de Bayes, el coeficiente es el resultado de dividir la probabilidad de que el test de positivo teniendo narcolepsia entre la probabilidad de dar positivo teniendo o no narcolepsia.


¿Qué ventajas tiene esta metodología?

Con esta forma de proceder hemos conseguido relacionar dos conjuntos de datos estadísticos: los que se refieren a la enfermedad y los que se refieren a la prueba médica. Para cada uno de estos conjuntos de datos se podría aplicar una estrategia estadística tradicional (frecuentista), de tal modo que podría ir mejorando mi conocimiento de la incidencia de enfermedad en una determinada población e ir afinando el dato sobre su incidencia, por ejemplo para llegar a un dato del 1,1% o del 0,97%. Por otro lado podría ir mejorando el conocimiento sobre la prueba, pero no podría relacionar ambos conjuntos de datos. Sin embargo conseguir relacionarlos es muy importante porque mejorar los datos sobre la incidencia de la enfermedad en una población podría tardar decenas de años, mientras que mejorar los datos sobre la prueba podría hacerse con un campaña adecuada. 

Una cuestión importante es que los resultado que se obtiene aplicando la fórmula de Bayes no son evidentes.. Son incluso sorprendentes. En el ejemplo de la narcolepsia, a la vista de los datos de relativos a la prueba, parece a primera vista  que si la prueba da positivo, es casi seguro que el paciente tiene narcolepsia. sin embargo, si se aplica la fórmula, resulta que la probabilidad de que tenga narcolepsia, aun dando positivo en al prueba no llega al 50%. Eso es así porque aunque dos falsos positivos por cada 100 personas sanas parece poco, da un valor absoluto grande si la población es grande. 



La inferencia bayesiana aplicada a problemas complejos como el cambio climático. El peso del conocimiento experto. 


Del mismo modo que se puede corregir una creencia (una predicción) revisándola con un dato nuevo (el resultado de una prueba médica , por ejemplo), se puede revisar una creencia con muchos datos nuevos relativos a cosas que están relacionadas con ella, sumando la influencia de cada una de estas cosas. Tenemos entonces la fórmula de Bayes generalizada.

De este modo se puede cambiar el problema de fijar la probabilidad de que la temperatura ascienda hasta un cierto valor en un intervalo de tiempo, por el cálculo de probabilidades de otros parámetros para cuyo cálculo tenemos más datos.

Pero es más, como la influencia de la creencia inicial va quedando diluida a medida que se aportan datos nuevos, se puede simplemente hacer un hipótesis sobre ella que resulte razonable, por lo que no es necesario tener una muestra inicial de datos de campo, sino que se hace una suposición basada en la opinión experta.

Esta última estrategia es la que da un componente subjetivo a la inferencia bayesiana, así como todas las hipótesis sobre distribuciones estadísticas de las distintas variables que se introducen.


--------------------------------------------------------------------------------------------------------------------------

ENTRADAS RELACIONADAS:


PRIGOGINE: TODAVÍA SABEMOS MUY POCO




-----------------------------------------------------------------------------------------------------------------------------








No hay comentarios:

Publicar un comentario

ONTOLOGÍA MODAL DE ARÍSTOTELES. EL FLAUTISTA.

La ontología modal, que se ocupa de los modos de ser, es un desarrollo típico de Aristóteles en el que nos presenta básicamente cuatro modos...