Ggfd
Análisis de
Componentes Principales
Omar A. Barriga
Guillermo Henríquez
Departamento de Sociología
Universidad de Concepción
El Fundamento
• En 1990, las Naciones Unidas publicó el
primer Informe de Desarrollo Humano.
• En él se planteaba que el desarrollo
humano, como constructo teórico, se debía
entender como la ampliación de las
capacidades de laspersonas.
• Conceptualmente, esto implicaba examinar
3 variables: vida sana, conocimientos
necesarios e ingresos suficientes.
• Operacionalmente, esto implicaba examinar
3 indicadores específicos:
– Esperanza de vida como una operacionalización
de una “vida sana”;
– Alfabetización adulta como una
operacionalización de “conocimientos
necesarios”;
– PIB per cápita como una operacionalizaciónde
“ingresos suficientes”.
1
El Problema
• Quisiera ver si los tres indicadores
identificados por el PNUD logran captar la
esencia del “desarrollo humano” en el caso
de los 10 países principales de América del
Sur.
• Extraje los valores para esos 3 indicadores
para los 10 países del mismo informe del
PNUD de 1990.
El Abordaje
• El análisis de esta tabla de datos se puedepensar de dos formas análogas:
– estudiar las relaciones entre casos; es
decir, examinar las semejanzas y
diferencias entre los casos
– estudiar las relaciones entre indicadores;
es decir, examinar las semejanzas y
diferencias entre los indicadores
Los Datos
CORR
1
2
3
4
5
6
7
8
9
10
PAÍS
AR
BO
BR
CO
CL
EC
PY
PE
UY
VE
EV
71
54
65
65
72
66
67
63
71
70
AL96
75
78
88
98
83
88
85
95
87
PB
4647
1380
4307
3524
4862
2687
2603
3129
5063
4306
El Objetivo
• Si logro identificar ciertas semejanzas y
diferencias entre diferentes casos, puedo
lograr agrupaciones de casos y posiblemente
lograr captar la esencia de tipos latentes.
• Si logro identificar ciertas semejanzas y
diferencias entre indicadores, puedo lograragrupaciones de indicadores y posiblemente
lograr captar la esencia de variables latentes.
2
El Beneficio
• Si logro establecer tipologías de casos e
identificar variables latentes, lo que estoy
haciendo es reducir complejidad.
• El PNUD hace eso al establecer:
– el IDH como variable construida en función de
los 3 indicadores señalados, y
– “clases” de países de alto, medio y bajo DH
• Alfin y al cabo, el interés del científico
social pasa por ahí y no por los indicadores
en sí.
• La información en la matriz se puede
entender como un conjunto de vectores,
cada uno representando a un caso.
• Cada vector (xi1, xi2, xi3) se puede entender
como la coordenada de ese i-ésimo caso en
un espacio de tres dimensiones
– ℜ3 [ℜp en el caso de p indicadores]
• Donde cada dimensiónrefleja un indicador.
Tabla de n × p
c1
c2
c3
c4
c5
c6
c7
c8
c9
c10
k1
x11
x21
x31
x41
x51
x61
x71
x81
x91
x101
k2
x12
x22
x32
x42
x52
x62
x72
x82
x92
x102
k3
x13
x23
x33
x43
x53
x63
x73
x83
x93
x103
Las Semejanzas
• La tabla de datos original, de n casos por p
indicadores, se puede estudiar de las
siguientes formas:
– Por un ladoexaminar las semejanzas entre
casos, para lo cual se genera una tabla de n × n
donde cada celda incorpora una medida de
similitud entre casos.
– Por el otro lado, examinar las semejanzas entre
indicadores, para lo cual se genera una tabla de
p × p donde cada celda incorpora una medida de
similitud entre indicadores.
3
Semejanzas entre casos
Semejanzas entre indicadores
c1
c2c3
c4
c5
c6
c7
c8
c9
c10
c1
c2
s1,1
s2,1
s1, 2
s2, 2
s1,3
s2,3
s1, 4
s2, 4
s1,5
s2 , 5
s1,6
s2, 6
s1, 7
s2 , 7
s1,8
s2,8
s1,9
s2 , 9
s1,10
s2,10
c3
s3,1
s3, 2
s3,3
s3, 4
s3,5
s3,6
s3, 7
s3,8
s3,9
s3,10
c4
c5
s4,1
s5,1
s4, 2
s5, 2
s4,3
s5,3
s4, 4
s5, 4
s4 , 5
s5,5
s4, 6
s5,...
Regístrate para leer el documento completo.