¡Recomienda este blog!

martes, 11 de febrero de 2014

Modelado y Construcción de una Red Bayesiana

Tabla de contenido:

1. Problema a Modelar 
2. Especificación de la parte cualitativa del modelo. 
    2.1. Variables extraídas del problema. 
    2.2. Relaciones encontradas en el modelo. 
    2.3. Modelado de la Red Bayesiana. 
3. Especificación de la parte cuantitativa del modelo. 
4. Análisis de la Red Bayesiana con SamIAm. 

1. Problema a Modelar

Una tarde, iba en bicicleta a visitar a mis amigos. Sin previo aviso me caí al suelo. Pensé que me había caído debido al viento, hasta que observé que había hecho algunos derrapes en el suelo. Entonces especulé, con la posibilidad de que fuese debido a la rueda y en la posibilidad de haber pasado por una zona llena de cristales.
A continuación se pasará a identificar las variables y sus relaciones dentro del modelo.

2. Especificación de la parte cualitativa del modelo.

    2.1.   Variables extraídas del problema

Una vez que se tiene los conocimientos suficientes sobre el problema que se plantea, se procede a identificar las variables que son relevantes en el problema expuesto. Para ello, se prestará atención a aquellas variables que tengan interés dentro del problema.
Para ello, intentaremos resolver una serie de preguntas:
  1. ¿Cuál es el problema que se plantea?
  2. ¿Qué posibles causas hicieron que me cayera de la bicicleta?
  3. ¿De qué evidencias dispongo para que las causas, problemas, etc. anteriores puedan darse?
A continuación y tomando como base el enunciado expuesto, se tratará de responder a estas preguntas. En este caso, parece que tuve una caída mientras iba en la bicicleta. Las causas posibles son que hacía demasiado viento o que sufrí una avería.

La avería pudo ser causada por que la rueda estaba desgastada y además pasé por una zona llena de cristales. Por otro lado, la evidencia que sugiere que la rueda estaba desgastada puede encontrarse en que a lo largo del paseo se iba constantemente derrapando.

Con lo que se obtendrían las siguientes variables:
  • Caída
  • Viento
  • Avería
  • Rueda desgastada
  • Cristales
  • Derrapes
En todo lo anterior se pueden observar variables objetivo, que permiten modelar fenómenos que no son directamente observables. En el problema expuesto, al caerme, directamente pensé en dos posibilidades: O me había tirado el viento o había pisado un cristal.

2.2. Relaciones encontradas en el modelo.

Basándonos en que la ausencia de un arco entre dos variables indica que no existen relaciones de dependencias entre ellas, y observando las variables obtenidas anteriormente se puede determinar que las variables Caída y Rueda desgastada no son directamente dependientes, y por ello no ha de existir un arco que las una.

Por otro lado, Rueda desgastada tiene influencia causal en Derrapes, y por tanto debe existir un arco entre las dos variables. También Existe una independencia causal entre Viento y Avería, donde cada una de las causas tendrán un efecto con probabilidad x en la caída.

También se observan relaciones de independencia condicional, pues Caída sería condicionalmente independiente de Rueda Desgastada y Cristales dado Avería. Estas relaciones de independencia condicional corresponderán a relaciones de independencia en la distribución de probabilidad en el apartado 3, del presente documento.

Una vez definidas las variables y sus relaciones se procede a la creación de la estructura del modelo.

2.3. Modelado de la Red Bayesiana.

En el problema expuesto, se quiere dar respuesta a la caída que sufrí con la bicicleta. Por esto introducimos en la red un nodo llamado Caída.


Figura 1: Primer nodo de la red Bayesiana de la Caída.

Las causas de la caída pudieron ser: El Viento o una Avería. Por ello se añaden al modelo los nodos Viento y Avería:


Figura 2: Se añaden las causas a la Red Bayesiana.

Entonces observé que había hecho algunos derrape en el suelo.


Figura 3: Se añaden fuentes de evidencia a la Red Bayesiana.

Tras esto, empecé a pensar en que la rueda podría estar desgastada, cosa que puede hacer que la rueda derrape por falta de "grip".



 Figura 4: Se añaden explicaciones a la Red Bayesiana

Lo que hace que piense que la caída sufrida podría ser debida a una avería, causada por pisar un cristal con la rueda desgastada.



Figura 5: Red Bayesiana que modela el problema expuesto.

De este modo, se ha construido el modelo de la Red Bayesiana siguiendo una metodología incremental, obteniendo así el DAG (Directed Acyclic Graph) asociado a este.

3. Especificación de la parte cuantitativa del modelo.

Para comenzar a proporcionar las probabilidades necesarias de forma inicial se establecerán una serie de probabilidades a priori o en ausencia de información a los nodos raíz y posteriormente se calcularán las probabilidades condicionales para el resto de los nodos.

De este modo, se requiere proporcionar una probabilidad al nodo Rueda Desgastada. Para esto, podemos hacer un balance y pensar en todos aquellos ciclistas que van con las ruedas desgastadas (por ejemplo, basado en estadísticas). De otro modo, es una buena opción realizar una estimación razonable. Con todo esto, se considerará que un 18% de los ciclistas circulan con las ruedas desgastadas, con lo que la probabilidad es 0.18.

Por el mismo razonamiento, se establece que el 25% de las zonas destinadas a circular en bicicleta tienen algún cristal o cristales. Y tomando como referencia las estadísticas de viento según la estación del año se establece un 22% de viento.

Para todos aquellos nodos que descienden de otros, se han de establecer variables condicionadas.

En el problema que se quiere resolver, se necesita establecer la probabilidad de Caída, dado Viento y Avería. En este sentido, se ha de pensar en la relación de estas tres variables, ya que es de tipo OR y por tanto, tanto una como otra pueden causar una caída. De este modo, si tenemos ambas, el riesgo de caída se incrementa considerablemente.

De este modo, se podrían establecer las siguientes probabilidades:
  • P(Caída | Viento, Avería) = 0.98
  • P(Caída | Viento, ┐Avería) = 0.80
  • P(Caída | ┐Viento, Avería) = 0.9
  • P(Caída | ┐Viento, ┐Avería) = 0.03
Como se puede observar, el modelo establecería que cuando hay más de una causa presente es más probable que ocurra una caída, en este caso. Por esto, la primera probabilidad dada está tan cercana a 1.
El resto de probabilidades se alejan paulatinamente de 1, aunque cabe destacar que en este caso es más probable sufrir una caída si se tiene una avería en la bicicleta, que si hace solo viento, estableciendo así Avería, como una causa más fuerte.

Por último, se ha de establecer que aunque no existan ningunas de las causas expuestas, siempre se puede sufrir una caída por otras causas.

De este modo, si se procede de la misma forma con el resto de nodos, se deben de establecer las probabilidades condicionales definidas para el nodo Avería. En este caso se ha de destacar que el modelado se ha realizado basado en una relación tipo AND, con lo que en nuestro caso la avería solo ocurriría cuando la rueda está desgastada y existen cristales en el suelo.

Y para concluir, determinar que la probabilidad de que existieran derrapes debidos a rueda de bicicleta será mayor si existen ruedas desgastadas en estas.

Con todo lo anterior, el modelo gráfico completo, con todo lo necesario para dar el modelo por finalizado se muestra en la siguiente figura.

Figura 6: Modelo Completo.


4. Análisis de la Red Bayesiana con SamIAm.

Tras especificar el modelo tanto cualitativo como cuantitativo de la red bayesiana, en este apartado se procede a analizar dicha red con la herramienta SamIAm.

En la Figura 7, puede observarse el modelo completo realizado en la aplicación SamIAm, además a continuación (Figura 8) puede observare el modelo con las probabilidades prestablecidas.


Figura 7: Modelo Completo en SamIAm.



Figura 8: Modelo con Probabilidades.

A continuación se mostrarán algunos casos interesantes que se dan en el proceso de análisis de la red.
Por ejemplo, en la Figura 9, se prestablece la evidencia de que no se ha sufrido ninguna caída, por este motivo observamos como disminuyen las probabilidades de que haga Viento y de que se haya sufrido una avería. Además, de que también se modifique la probabilidad de tener una rueda desgastada o el hecho de haber encontrado cristales.



Figura 9: No existe Caída.

Por otro lado, es muy interesante observar los cambios en las probabilidades que existen de sufrir una caída cuando se establecen evidencias certeras en los nodos raíz.

Por ejemplo, si se establece que se tiene una rueda desgastada y que además hace viento, como puede observarse en la Figura 10), la probabilidad de sufrir una caída se dispara se convierte en algo casi inevitable.


Figura 10: Se evidencia Viento y una Rueda desgastada

Para concluir este pequeño análisis del modelo, es muy interesante destacar el peso de la variable Cristales. Si se presta atención en la Figura 11, expuesta a continuación, se observa que evidenciando la ausencia de cristales, el riesgo de sufrir una avería disminuye notoriamente y por ende, el riesgo de sufrir una caída.


Figura 11: No hay cristales.

Además de estas pruebas se realizan también algunas simulaciones del modelo estableciendo valores aleatorios de inicio. Por ello, a este documento se adjunta un archivo comprimido donde se encuentran los ficheros del modelo presentado en el presente documento y una muestra de 10 interacciones sobre el modelo estableciendo a modo de simulación.

0 comentarios:

Publicar un comentario