Analisis componentes principales

Solo disponible en BuenasTareas
  • Páginas : 7 (1644 palabras )
  • Descarga(s) : 0
  • Publicado : 1 de diciembre de 2010
Leer documento completo
Vista previa del texto
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY

DOCTORADO EN ADMINISTRACIÓN (Finanzas)

ANÁLISIS DE COMPONENTES PRINCIPALES Y DE FACTORES DE LOS ÍNDICES BURSÁTILES DE LOS 26 PAÍSES MÁS IMPORTANTES.

Dr. Piotr Wisnieski

Presentan:
Juan Antonio Laguna Guerrero
Marco Antonio Leyva Grado

1. Marco Teórico.

El análisis de componentes principales trata de explicar laestructura de varianza-covarianza de pocas combinaciones lineales de las variables originales. Sus objetivos generales son:

a. La reducción de datos.
b. La interpretación de los mismos.

Aunque ( componentes son requeridos para reproducir la variabilidad total del sistema mucha de esta variabilidad puede ser representada a través de un pequeño número, k, de los componentesprincipales. De ser así, hay tanta información en los k componentes como la hay en las ( variables. Los k principales componentes pueden sustituir, por lo tanto, las ( variables iniciales, y el conjunto de datos originales, consistente en n medidas sobre las ( variables es reducido a 1 consistente en n medidas de los k componentes principales.

Un análisis de los componentes principales amenudo muestra relaciones que no eran notorias anteriormente y por lo tanto permite interpretaciones nuevas de la información.

Un análisis de componentes principales es más bien un medio que un fin por si mismo por que frecuentemente son utilizados como pasos intermedios en investigaciones más grandes. Por ejemplo, los componentes principales pueden ser insumos de una regresión múltiple o deun cluster analysis.

Componentes principales de la población.

Algebraicamente, los componentes principales son combinaciones lineales particulares de ( variables aleatorias X1, X2, ..., X(. Geométricamente, estas combinaciones lineales representan la selección de un nuevo sistema de coordenadas obtenido a través de la rotación del sistema original con X1, X2, ..., X( los ejes delas coordenadas. Los nuevos ejes representan las direcciones de máxima variabilidad y proveen de una descripción más simple de la estructura de covarianza.

Como se observa, los componentes principales dependen únicamente de la matriz de covarianza ( (o la matriz de correlación () de X1, X2, ..., X( . Su desarrollo no requiere del supuesto de normalidad multivariada. Por otro lado,los componentes principales derivados de poblaciones normales multivariadas tienen interpretaciones útiles en términos de las densidades constantes elipsiodes. Además, se pueden realizar inferencias de los componentes muestrales donde la población es normal multivariada.

Sea el vector aleatorio X´ = (X1, X2, ..., X( ) que tiene una matriz de covarianza ( con eigen valores (1 ( (2 ( . .. ( (p ( 0.

Se deben de considerar las combinaciones lineales:

Y1 = (´1X = (11 X1 + (21X2 + ..... + (p1 Xp

Y2 = (´2X = (12 X1 + (22X2 + ..... + (p2 Xp
.
.
.

Yp = (´pX = (1p X1 + (2pX2 + ..... + (pp Xp

Por otro lado, sabemos que:

Var(Yi ) = (´i ( (´i i = 1,2, .... , p

Cov(Yi, Yik ) = (´i( (´k i, k = 1,2, .... , p

Los componentesprincipales son aquellas combinaciones lineales Y1, Y2, ... , Yp cuyas varianzas en la ecuación correspondiente son lo más grandes posible.

El primer componente principal es la combinación lineal con máxima varianza. Esto es, maximiza Var(Y1) = (´1 ( (´1 . Es claro que Var(Y1) = (´1 ( (´1 puede ser aumentada multiplicando cualquier (1 por alguna constante. Para eliminar estaindeterminación, es conveniente restringir nuestra atención únicamente a los coeficientes de vectores unitarios. Por lo tanto, definimos:

• El primer componente principal = a la combinación lineal (´1 X que maximiza
Var((´1 X ) sujeto a que (´1(1 = 1

• El segundo componente principal = a la combinación lineal (´2 X que maximiza...
tracking img