3 dic. 2009

Sistemas de razonamiento Probabilístico

Aquí se explica un mecanismo de inferencia, para construir un sistema de razonamiento para situaciones en donde está presente la incertidumbre. La principal ventaja del razonamiento probabilístico con el razonamiento lógico reside en el que el agente puede tomar decisiones racionales aun sin disponer de suficiente información para probar que una acción dada funcionará.

Para representar la dependencia que existe entre determinadas variables se utiliza una estructura de datos conocida como red de creencia, y también para especificar de manera concisa la distribución de probabilidad conjunta. La red de creencia es una gráfica en la que se cumple lo siguiente:

1. Los nodos de la red están formados por un conjunto de variables aleatorias.

2. Cada par de nodos se conecta entre si mediante un conjunto de enlaces o flechas. El significado implícito de una flecha que vaya del nodo X al nodo Y es el de que X ejerce una influencia directa sobre Y.

3. Por cada nodo hay una tabla de probabilidad condicional que sirve para cuantificar los efectos de los padres sobre el nodo. Los padres de un nodo son aquellos nodos cuyas flechas apuntan hacia éste.

4. La gráfica no tiene ciclos dirigidos, por lo tanto es una gráfica dirigida, acíclica, o GDA.
Luego hay que especificar la tabla de probabilidad condicional, o TPC, de cada uno de los nodos, donde cada hilera de la tabla indica la probabilidad condicional correspondiente al valor de nodo de un caso condicionante. Un caso condicionante es una posible combinación de los valores de los nodos padres.

La semántica de las redes de creencia
Hay dos maneras de interpretar la semántica de las redes de creencia:

1. Considerar la red como una representación de la distribución de probabilidad conjunta.
2. Considere la red como la codificación de un conjunto de aseveraciones de independencia condicional.

Aunque ambas consideraciones son equivalentes, la primera es útil para poder saber cómo construir las redes, en tanto que la segunda sirve en el diseño de procedimientos de inferencia.

Representación de la Distribución de Probabilidad Conjunta

Es posible calcular cada una de las entradas de la distribución de probabilidad conjunta desde la información de la red. Una entrada genérica es la probabilidad de una conjunción de asignaciones particulares hechas a cada variable. Como ejemplo, P(X1=x1^...^Xn=xn). Una forma abreviada es P(x1,...,xn). La fórmula genérica es: P(x1,...,xn) = П P(xiPadres(Xi)) desde i = 1 hasta n
Por lo tanto, las entradas de la probabilidad conjunta se representan mediante el producto de los respectivos elementos de la TPC de la red de creencia.

Relaciones de independencia condicional en las redes de creencia

La información sobre la independencia condicional es una forma vital y sólida de estructurar información sobre un dominio incierto. Para poder diseñar algoritmos de inferencia, es necesario saber si también son válidas independencias condicionales de tipo más general. Nos entregan una red. ¿Hay alguna manera de saber si el conjunto de nodos X es independiente de otro conjunto Y, dado que poseemos un conjunto E de nodos de evidencia? La respuesta es sí, y el método se deriva del concepto de separación de la dirección o separación d. Esta última se trata de la separación dependiente de la dirección de las flechas convergentes y/o divergentes de un nodo y de su condición de oculto u observable.

La inferencia en las redes de creencia
El principal objetivo de un sistema de inferencia probabilista es el cálculo de la distribución de probabilidad posterior de un conjunto de variables de consulta (p.ej., "robo" es una variable de consulta), con base en determinadas variables de evidencia. En general la forma como un agente captura valores para las variables de evidencia es ya sea a través de sus percepciones o de su razonamiento basado en otros mecanismos. Pregunta los valores posibles de otras variables de manera de poder decidir qué acción tomar. Las redes de creencia tienen una flexibilidad que permite a un nodo funcionar como variable de evidencia.