Antonia

Páginas: 11 (2647 palabras) Publicado: 15 de mayo de 2012
Capítulo 9 ANALISIS DE CORRESPONDENCIAS
9.1 Introducción

El Análisis de Correspondencias (AC) es una técnica multivariante que permite representar las categorías de las filas y columnas de una tabla de contingencia. Supongamos que tenemos dos variables categóricas A y B con I y J categorías respectivamente, y que han sido observadas cruzando las I categorías P A con las J categorías B,obteniendo n = ij fij observaciones, donde fij es el número de veces en que aparece la interseccón Ai ∩Bj , dando lugar a la tabla de contingencia I × J : B1 f11 f21 fI1 f·1 B2 f12 f22 fI2 f·2 ··· ··· ··· ... ··· ··· BJ f1J f2J fIJ f·J

A1 A2 . . . AI

f1· f2· . . . fI· n

(9.1)

P P donde fi· = j fij son las frecuencias de Ai , f·j = i fij son las frecuencias de Bj . Hemos de tener en cuenta quela tabla (9.1) resume la matriz de datos 137

138

CAPÍTULO 9. ANALISIS DE CORRESPONDENCIAS

inicial, que típicamente es de la forma 1 . . . i . . . n A1 1 . . . 0 . . . 0 A2 0 . . . 0 . . . 0 ··· ··· ... ··· ... ··· AI 0 . . . 1 . . . 1 B1 1 . . . 0 . . . 0 B2 0 . . . 1 . . . 0 ··· ··· ... ··· ... ··· BJ 0 . . . 0 . . . 1

en la que damos el valor 1 cuando se presenta una característicay 0 cuando no se presenta. Así, el individuo “1” presentaría las características A1 y B1 , el individuo “i” presentaria las características AI y B2 , y el individuo “n” las características AI y BJ . La matriz de datos n × (I + J) es pues Z = [X, Y]. A partir de ahora utilizaremos el nombre de variables filas y variables columnas a las variables A y B, respectivamente. Indiquemos por N = (fij ) lamatriz I × J con las frecuencias de la tabla de contingencia. La matriz 1 P = N, n es la matriz de correspondencias. Indiquemos por r el vector I × 1 con los totales marginales de las filas de P, y por c el vector J × 1 con los totales marginales de las columnas de P : r = P1, Tenemos entonces que r= 1 0 1 X, n c= 1 0 1 Y, n c = P0 1.

son los vectores de medias de las matrices de datos X, Y.Indiquemos además Dr = diag(r), Dc = diag(c),

las matrices diagonales que contienen los valores marginales de filas y columnas de P. Se verifica X0 X = nDr , Y0 Y = nDc , X0 Y = nP = N.

9.2. CUANTIFICACIÓN DE LAS VARIABLES CATEGÓRICAS

139

Por lo tanto, las matrice de covarianzas entre filas, entre columnas y entre filas y columnas, son S11 = Dr − rr0 , S22 = Dc − cc0 , S12 = P − rc0 .Puesto que la suma de las variables es igual a 1, las matrices S11 y S22 son singulares.

9.2

Cuantificación de las variables categóricas

El problema de las variables categóricas, para que puedan ser manejadas en términos de AM clásico, es que no son cuantitativas. La cuantificación 0 ó 1 anterior es convencional. Asignemos pues a las categorías A1 , . . . ,AI de la variable fila, los valoresnuméricos a1 , . . . , aI , y a las categorías B1 , . . . ,BJ de la variable columna, los valores numéricos b1 , . . . , bJ . es decir, indiquemos los vectores a = (a1 , . . . , aI )0 , b = (b1 , . . . , bJ )0 , y consideremos las variables compuestas U = Xa, V = Yb.

Si en un individuo k se observan las categorías Ai ,Bj , entonces los valores de U, V sobre k son Uk = ai , Vk = bj . Deseamosencontrar a, b tales que las correlaciones entre U y V sean máximas. Claramente, estamos ante un problema de correlación canónica, salvo que ahora las matrices S11 y S22 son singulares. Una g-inversa de S11 es la matriz S− = D−1 que verifica r 11 S11 S− S11 = S11 . 11 En efecto, (Dr −rr0 )D−1 (Dr −rr0 ) = (Dr −rr0 )(I − 1r0 ) r = Dr −Dr 1r0 −rr0 +rr0 1r0 = Dr −rr0 −rr0 +rr0 = Dr −rr0 .

140CAPÍTULO 9. ANALISIS DE CORRESPONDENCIAS

Análogamente S− = D−1 . Aplicando la teoria de la correlación canónica 22 c (Sección 4.3), podemos considerar la descomposición singular D−1/2 (P − rc0 )D−1/2 = UDλ V0 , r c (9.2)

donde Dλ es la matriz diagonal con los valores singulares en orden decreciente. Si u1 , v1 son los primeros vectores canónicos, tendremos entonces a = S11 u1 ,
−1/2

b = S22...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • antonio
  • Antonia
  • antonia
  • Antonio
  • Antonio
  • Antonio
  • Antonio
  • Antonio

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS