Regla Delta Rna
Aprender: modificar la conducta Imitación: base del entrenamiento
Objetivo de la Sección
Analizar los cálculos realizados por los sistemas E-R para que la selección de acciones pueda ser aprendida
Temas
Aprendizaje Entrenamiento de una ULU (Unidad lógica con Umbral)
Aprendizaje
Si se expone el sistema a un conjunto de ejemplos, laselección de ejemplos puede ser aprendida
Conjunto de Ejemplos: parejas formadas por un posible valor de las variables de entrada junto con la acción que debe de tomar para dicho valor
Aprendizaje Artificial
Redes neuronales (ULU: Unidad Lógica con Umbral) con pesos ajustables Proceso de aprendizaje:
modificación sucesiva de los pesos de la ULU, hasta que la red responda adecuadamente a lasentradas que le son presentadas
Formulación del Problema
•Conjunto de vectores de dimensión n:
{ X[n] | x(i); i = 1,...,n son componentes de X }
•Vectores de características calculados por el sistema perceptual de un agente reactivo. •Componentes con valores reales o booleanos
•Para cada X del conjunto se conoce la acción que le corresponde:
•Etiquetas ó clases del vector obtenidasobservando como un instructor, responde a dicho conjunto de entradas
•Conjunto de entrenamiento:
Conjunto de vectores
+
Etiquetas asociadas al vector
Solución del Problema
Encontrar la función f(X) que responda aceptablemente a los elementos del conjunto de entrenamiento. Aprendizaje supervisado:
las acciones calculadas por f, se corresponden con las etiquetas asociadas a los vectoresde entrada, en tantos casos como sea posible
Incertidumbre
Si encontramos una función que responda apropiadamente a todos los vectores del conjunto de entrenamiento:
¿Dicha función responderá de forma adecuada a posibles vectores de entrada que no forman parte del conjunto de entrenamiento?
•Afirmativo:
–Experiencia –Marco teórico
Marco teórico
Teoría del aprendizaje probable yaproximadamente correcto:
Se demuestra (bajo ciertas condiciones) que:
Si el conjunto de entrenamiento contiene elementos “significativos” de las distintas clases en que se pueden dividir los vectores de entrada las restantes entradas que no se encuentran en dicho conjunto “probablemente” producirán salidas “aproximadamente” correctas
Entrenamiento de una sola ULU
Las entradas (pesos) de la ULUdeben de ser numéricas (para poder calcular la suma ponderada)
Las características categorizadas se deben de codificar numéricamente.
Perceptron ó Adaline ( adaptative linear element)
Red neuronal de un solo elemento Desarrolla solo dos posibles acciones ( una por cada salida posible de la ULU) El entrenamiento de una sola ULU se realiza ajustando los pesos variables hasta conseguir lassalidas deseadas
Definición de una ULU
La ULU se define por:
Los valores de su vector de pesos:
W = (w1, wi, ...,wn)
Su Umbral,
variable teta θ
La salida de la ULU
será igual a 1, siempre que
el producto escalar s = X • W > θ
y será igual a 0 en cualquier otro caso
Entrenamiento de una ULU
Ecuación del Hiperplano X•W-θ=0
Interpretación geométrica del funcionamiento de una ULU:• Divide linealmente el espacio formado por los posibles vectores de entrada:
•
Con una recta en un espacio de 2 dimensiones
• Con un plano en un espacio de 3 dimensiones • Con un hiperplano en un espacio de n dimensiones X X•W-θ >0 En este lado
W Vector unitario normal |W| al hiperplano
X•W-θ 0 En este lado
W Vector unitario normal |W| al hiperplano
X•W-θ 0, la salida de la ULUserá 1 y en cualquier otro caso será 0
MÉTODO DEL GRADIENTE DESCENDENTE
Problema del entrenamiento de una sola ULU:
Que responda apropiadamente a los vectores del conjunto de entrenamiento
La solución consiste en definir una función de error que debe de minimizarse ajustando el valor de los pesos Función error cuadrático epsilon ε:
MÉTODO DEL GRADIENTE DESCENDENTE
Función error...
Regístrate para leer el documento completo.