redes neuronales VS modelo estad sticos
Redes neurales vs modelos estadísticos:
Simulaciones sobre tareas de predicción y
clasificación
Alfonso Pitarque*, Juan Francisco Roy y Juan Carlos Ruiz
Universitat de València
En este trabajo se comparan mediante simulación redes neuronales (del tipo
perceptrón multicapa) con modelos estadísticos (regresión múltiple, análisis
discriminante y regresión logística)en tareas de predicción y clasificación
(binaria o no binaria), manipulando los patrones de correlación existentes
entre los predictores (o variables de entrada) por un lado, y entre predictores
con el criterio (variable de salida) por otro. Los resultados muestran que en
tareas de predicción redes neurales y modelos de regresión múltiple tienden
a rendir por igual. Por contra en las tareas declasificación en todo tipo de
condiciones las redes neurales rinden mejor que los modelos estadísticos de
análisis discriminante y regresión logística. Se discuten los resultados en el
marco de la polémica redes neurales vs modelos estadísticos
convencionales.
Palabras clave
: redes neuronales,
clasificación.
modelos
estadísticos,
predicción,
En investigación aplicada es muy común encontrarsituaciones en las que
debemos estimar o predecir el comportamiento de una variable criterio en
función de una o varias variables predictoras. Cuando el criterio es una variable
cuantitativa se suele hablar de problemas de predicción o estimación, mientras
que cuando es una variable cualitatativa/categorial se habla entonces de
problemas de clasificación.
Tradicionalmente la solución a estos problemasse ha llevado a cabo desde
la óptica de modelos estadísticos de regresión: regresión simple o múltiple para
*
Los autores quieren expresar su gratitud a dos revisores del trabajo por sus sugerencias.
Correspondencia: Alfonso Pitarque; Area de Metodología; Facultad de Psicología; Avda.
Blasco Ibáñez 21; 46010 Valencia; E-mail: pitarque@uv.es
problemas de predicción; análisis discriminante omodelos de regresión logística
para problemas de clasificación. Casi todas estas técnicas descansan en el
llamado modelo de regresión general lineal , pudiendo ser conceptualizadas a su
vez como casos particulares del análisis de correlación canónica (ver p.e. Knapp,
1978; Allison, Gorman y Primavera, 1993).
Este tipo de modelos estadísticos han sido suficientemente analizados en la
literatura (verp.e. Cohen y Cohen, 1983; Tabachnick y Fidell, 1989; Tatsuoka,
1989). Cuando los datos satisfagan a priori las condiciones de aplicabilidad de
estas técnicas (normalidad e igualdad de varianzas; independencia; linealidad;
normalidad de los residuos; tamaño muestral suficiente,...), el rendimiento
dependerá del patrón de correlaciones que mantengan los predictores entre sí, y
cada predictor con elcriterio: será óptimo cuando existan altas correlaciones de
los predictores con el criterio, pero bajas correlaciones entre los predictores. Por
contra, el rendimiento será peor a medida que aquellas correlaciones desciendan,
y/o que éstas últimas aumenten (colinealidad).
A partir de 1986 (Rumelhart y McClelland, 1986; McClelland y
Rumelhart, 1986) las llamadas redes neurales o modelos conexionistashan ido
progresivamente utilizándose como herramientas de predicción y clasificación.
De forma breve una red neural es un sistema informático reticular (de inspiración
neuronal) que aprende de la experiencia mediante la auto-modificación de sus
conexiones (ver p.e. para revisiones Hectht-Nielsen, 1990; Hertz, Krogh y
Palmer, 1991; Wasserman, 1989, entre otros muchos buenos manuales; y encastellano Hilera y Martínez, 1995; Martín y Sanz, 1997).
Como herramientas de predicción/clasificación, muchos autores están
estudiando las relaciones entre las técnicas estadísticas convencionales y los
modelos conexionistas (ver p.e. Cherkassky, Friedman y Wechler, 1994; Flexer,
1995; Michie, Spiegelhalter y Taylor, 1994; Ripley, 1996; Sarle, 1994, 1998). De
hecho las redes neurales han sido...
Regístrate para leer el documento completo.