Analisis discriminante en spss

Solo disponible en BuenasTareas
  • Páginas : 11 (2580 palabras )
  • Descarga(s) : 7
  • Publicado : 25 de agosto de 2010
Leer documento completo
Vista previa del texto
-------------------------------------------------
Análisis Discriminante en SPSS

El análisis discriminante es una técnica que resulta útil para las situaciones en las que se desea construir un modelo predictivo para pronosticar el grupo al que pertenece una observación a partir de determinadas características observadas que delimitan su perfil.

Es una técnica de clasificación ad hoc, quepermite asignar o clasificar nuevos individuos u observaciones dentro de grupos previamente definidos. El objetivo fundamental es producir una regla o un esquema de clasificaciones que permita predecir la población la que es más probable que tenga que pertenecer una nueva observación o individuo.

El modelo predictivo que pronostica el grupo de pertenencia de una observaciones en virtud de superfil define la relación entre una variable dependiente no métrica (categórica) y varias variables independientes (métricas).

En sentido estricto, la función discriminante minimiza la probabilidad de equivocarse al clasificar los individuos en cada grupo. Para ello, las variables originales se deben distribuir como una normal multivariante y las matrices de covarianzas deben ser iguales entodos los grupos. En la práctica es una técnica robusta y funciona bien aunque las dos restricciones anteriores no se cumplan.

Si un conjunto de variables se distribuye como una normal multivariante, entonces cualquier combinación lineal de ellas se distribuye como una normal univariante. Por ello, si alguna de las variables originales no se distribuye como una normal, entonces es seguro que todaslas variables conjuntamente no se distribuirán como una normal multivariante.

La segunda restricción se refiere a la igualdad entre las matrices de covarianzas de los grupos. Para comprobar esto, se puede usar la prueba M de Box, que está incluida en el SPSS. Dicha prueba tiene como hipótesis nula que las matrices de covarianzas son iguales.

Se basa en el cálculo de los determinantes de lasmatrices de covarianzas de cada grupo. El valor obtenido se aproxima por una F de Snedecor. Si el p-valor es menor que 0,05 se rechaza la igualdad entre las matrices de covarianzas. El test M de Box es sensible a la falta de normalidad multivariante, es decir, matrices iguales pueden aparecer como significativamente diferentes si no existe normalidad. Por otra parte, si las muestras son grandes,pierde efectividad (es más fácil rechazar la hipótesis nula).

La predicción de pertenencia a los grupos se lleva a cabo determinando una o más ecuaciones matemáticas, denominadas funciones discriminantes que permitan las clasificaciones de nuevos casos a partir de las informaciones que poseemos sobre ellos.

Hipótesis en el modelo discriminante
El modelo subyacente en el AD requiere de unacomprobación de determinados supuestos. Para comenzar, la aplicación del AD requiere que contemos con un conjunto de variables discriminantes y una variable nominal que define dos o más grupos. Los datos deben corresponder a casos clasificados en dos o más grupos mutuamente excluyentes.

En cuanto a los casos aislados o valores atípicos, es necesario detectar su existencia en cada una de lasvariables consideradas por separado. Para la detección de casos aislados multivariantes podría recurrirse al cálculo de la distancia de Mahalanobis de cada individuo respecto al centro del grupo o a un método grafico.

Por otro lado, la aplicación del AD se apoya en una serie de supuestos básicos como la normalidad multivariante, homogeneidad de matrices de varianza covarianza(homoscedasticidad) y linealidad. El supuesto de homogeneidad de matrices de varianza covarianza obliga a que las matrices sean iguales, hipótesis que suele probarse mediante la prueba de M de Box.

Por otro lado el supuesto de linealidad implica que existen relaciones lineales entre las variables dentro de cada grupo o mediante el cálculo de coeficientes de correlacione lineal de Pearson. Una vez comprobado...
tracking img