lala

Páginas: 13 (3164 palabras) Publicado: 26 de junio de 2013
Tema 3: Análisis de Componentes
Principales
Introducción a la distribución normal multivariante
Cuando se trabaja en la vida real, la suposición más habitual es que la variable en
estudio se distribuye como una normal: muchas características que se miden son la conjunción de muchas causas que actúan conjuntamente sobre el suceso. Por ejemplo, la altura
de las personas se considera que sedistribuye como una normal, ya que su valor es debido
a múltiples causas ambientales, alimentarias y genéticas.
La justificación matemática de esto se encuentra en el Teorema Central del Límite que
demuestra que la suma de variables independientes se distribuye en el límite como una
normal.
Teorema Central del Límite
Si X1 , . . . , Xn son v.a. independientes con media µ y varianza común σ 2 <∞, la v.a.
Z definida como
Z=

X −µ

σ/ n

es una v.a. cuya función de densidad se aproxima a la distribución normal cuando n es
grande:
Z ∼ N (0, 1)
esto es,


µ
X1 + · · · + Xn
σ
= X ' N µ, √
n
n
1

Distribución normal bivariante
Es una generalización para vectores de v.a. del modelo normal. En el caso bivariante,
la distribución normal de un vector (X, Y )0 de media µ =(µ1 , µ2 )0 y matriz de covarianzas
Σ=

µ

σ2
cov(X, Y )
1
cov(X, Y )
σ2
2



,

tiene como función de densidad
½
1
1
f (x, y) = ¡√ ¢2 p
exp − [x − µ1
2

|Σ|

−1

y − µ2 ] Σ



x − µ1
y − µ2

¸¾

,

y se representa como N (µ, Σ) ,

Esta expresión se generaliza de modo inmediato al caso de un vector de v.a. con n
componentes.
Por ejemplo, en R se puededibujar la función de densidad con la siguiente secuencia
de comandos:
library(mvtnorm)
n = 50
x = seq(-3, 3, length = n)
y = x
z = matrix(0,n,n)
sigma = diag(2)
for (i in 1:n)
for (j in 1:n)
z[i,j] = dmvnorm(c(x[i],y[j]),c(0,0), sigma)
end
end
persp(x,y,z,theta=25,phi=20,zlab="density function",expand=0.5,col="blue")

# Con matriz de covarianzas diferente
2

z = matrix(0,n,n)f1 = c(1,-0.75)
f2 = c(-0.675,1)
sigma = rbind(f1,f2)
for (i in 1:n)
for (j in 1:n)
z[i,j] = dmvnorm(c(x[i],y[j]),mean=c(0,0),sigma)
end
end
persp(x,y,z,theta=25,phi=20,zlab="density function",expand=0.5,col="blue")

0

N2 (µ, Σ) donde µ = (0, 0) , Σ =

3



1 0
0 1

¸

0

N2 (µ, Σ) donde µ = (0, 0) , Σ =



1 −0,75
−0,75
1

¸

Propiedades
1. La distribuciónmarginal de X es N (µ1 , σ 1 )
2. La distribución marginal de Y es N (µ2 , σ 2 )
3. La distribución de Y condicionada por X = x es
µ
cov(X, Y )
(x − µ1 ) ;
N µ2 +
σ2
1


p
2
σ2 1 − ρ

donde ρ es el coeficiente de correlación,
ρ=

cov(X, Y )
σ1σ2

4. Si un vector aleatorio (X, Y )0 tiene distribución N (µ, Σ) y cov(X, Y ) = 0 entonces
X e Y son independientes. Como
Σ=

µ
4σ2 0
1
0 σ2
2



,

sustituyendo en la expresión de la función de densidad, se obtiene que
f (x, y) = f (x) · f (y)

Análisis de Componentes Principales
Introducción
Cuando se recoge la información de una muestra de datos, lo más frecuente es tomar el
mayor número posible de variables. Sin embargo, si tomamos demasiadas variables sobre
¡ ¢
un conjunto de objetos, por ejemplo20 variables, tendremos que considerar 20 = 180
2

posibles coeficientes de correlación; si son 40 variables dicho número aumenta hasta 780.
Evidentemente, en este caso es difícil visualizar relaciones entre las variables.

Otro problema que se presenta es la fuerte correlación que muchas veces se presenta
entre las variables: si tomamos demasiadas variables (cosa que en general sucedecuando
no se sabe demasiado sobre los datos o sólo se tiene ánimo exploratorio), lo normal es que
estén relacionadas o que midan lo mismo bajo distintos puntos de vista. Por ejemplo, en
estudios médicos, la presión sanguínea a la salida del corazón y a la salida de los pulmones
están fuertemente relacionadas.
Se hace necesario, pues, reducir el número de variables. Es importante resaltar el...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Lalo
  • Lala
  • Lala
  • Lala
  • Lala
  • lala
  • lala
  • lala

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS