Multivariado cl2 CP

Páginas: 22 (5384 palabras) Publicado: 9 de mayo de 2015
Análisis de Componentes Principales (ACP)

Análisis de Componentes Principales (cont.)

Introducción.

Objetivos

j , introducida por
p Pearson ((1901)) y
Es una de las técnicas más viejas,
desarrollada por Hotelling (1933) y Rao (1964). Sin embargo, es una
de las técnicas más empleadas en un amplio rango de disciplinas.

• Reducir la dimensión de los datos sin demasiada pérdida en lavariabilidad de la información (inercia).

Consiste en obtener variables aleatorias (componentes) no
correlacionadas que son combinaciones lineales de las variables
aleatorias cuantitativas originales, de manera que con un grupo
reducido de componentes se pueda mantener la mayor parte de la
información (variabilidad medida en términos de varianza total)
contenida en los datos originales.
g
La reducción de ladimensión de los datos es esencial en el Análisis
Exploratorio de Datos, en el cual los métodos gráficos de
visualización
i li ió de
d la
l información
i f
ió juegan
j
un papell fundamental.
f d
t l ACP
puede resultar una herramienta de utilidad, y es una de las
1
técnicas más empleadas para variables cuantitativas.
cuantitativas

Si hay p variables medidas, se requieren p componentes parareproducir la variabilidad total del sistema.
Si la mayor parte se puede explicar por un número pequeño r <
p de CP, entonces las CP pueden reemplazar a las variables
originales.
p
Esto permite:
1.- Explorar los datos: graficar en 2 o 3 dimensiones las
observaciones; ver si hay datos atípicos; etc..
2 - Obtener las CP como un paso intermedio al uso de otras
2.técnicas uni/multivariadas (regresiónmúltiple, análisis
2
de conglomerados, análisis discriminante, etc.).

ACP Sea un conjunto de n observaciones medidas sobre p vbles aleatorias
ACP:
X1, X2, ..., Xp (Xnxp). Los datos pueden venir de una población o de una
muestra. Si p
proviene de una muestra los CP son estimaciones.

Análisis de Componentes Principales (cont.)
Objetivos

a.- Enfoque descriptivo:
descriptivo

• Interpretar la información:ACP puede revelar relaciones
insospechadas y lograr interpretaciones que no se hubieran
obtenido de otra manera.
manera
g
,
generalmente
g
• Transformar
las
variables
originales,
correlacionadas, en variables no correlacionadas.
• A
Analizar
li
l variables:
las
i bl
l distancia
la
di t
i entre
t los
l puntos
t asociados
i d a
dos variables se interpreta en términos del ángulo que forman
ambosvectores, cuyo coseno es la correlación entre ambas vbles.
3

Se desea encontrar un subespacio
p
de dimensión r < p tal q
que al
proyectar sobre él los puntos (centrados) conserven su estructura
con la menor distorsión posible. Esto se logra exigiendo que las
distancias entre los puntos originales y sus proyeciones sobre el
subespacio de dimensión r sean lo mas pequeñas posibles.
Ej: recta queminimiza las
distancias ortogonales de los
puntos a ella (datos centrados)
La idea es encontrar yi:
n

min ∑ ri 2
i =1

y1
4

Análisis de Componentes Principales

Análisis de Componentes Principales
a.- Enfoque descriptivo (cont.):

a.- Enfoque descriptivo (cont.):
Si se considera un p
punto xi y una dirección e1=(e
( 11, e12, ...,, e1p))' con
e1 de norma unidad, la proyección del punto xi sobre estadirección
es el escalar:
yi = e11 xi1+ ...
...+ e1p xip = e1' xi
y el vector que representa esta proyección sera yi ei. Llamando ri a
la distancia entre el punto xi y su proyección sobre la dirección e1,
este criterio, usando el teorema de Pitágoras, implica:

xi ' xi = yi2 + ri 2
Si sumamos sobre todos los puntos:
n

n

n

∑ x 'x = ∑ y + ∑r
i =1

i

i

i =1

2
i

i =1

i

n

2

min ∑ ri 2
i =1

⇒i =1



n

max ∑ yi2
i =1

Como los yi están centrados maximizar la SC es maximizar la
varianza.
El criterio
i i para encontrar la
l dirección
di
ió de
d las
l proyecciones
i
consiste
i
en hallar la dirección que maximice la varianza de los datos
proyectados
p
y
((1° CP).
)
Para las restantes componentes se maximiza la varianza residual
preservando la ortogonalidad entre CP.
CP

n

max ∑ yi2...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Multivariado
  • Multivariables
  • multivariante
  • multivariable
  • multivariado
  • Multivariable
  • Cp
  • CP

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS