Analiisis de datos en tres vias
´ P ROGRAMA DE P REGRADO EN M ATEM ATICAS
T RABAJO DE G RADO
´ A N ALISIS DE D ATOS DE T RES V´AS I
R EQUISITO PARCIAL PARA OPTAR AL T´TULO DE I ´ M ATEM ATICO
´ M ONICA L ILIANA A RTEAGA S IERRA
D IRECTORA : D RA . A MPARO VALLEJO A RBOLEDA
2008
´ndice general I
Nomenclatura Introduccion ´ 1. Preliminares´ 1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 1.2. Descripcion de los datos . . . . . . . . . . . . . . . . . . . . .
III V
8 8 9
1.3. Operaciones Elementales . . . . . . . . . . . . . . . . . . . . . 10 1.4. Conceptos de Linealidad . . . . . . . . . . . . . . . . . . . . . 14 2. An´ lisis de Componentes Principales de Dos V´as a ı 16
´ 2.1. Introduccion .. . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2. An´ lisis de Componentes Principales (ACP) . . . . . . . . . 17 a 2.3. An´ lisis de Componentes de Dos V´as . . . . . . . . . . . . . 18 a ı 2.4. M´ todos Biplot Cl´ sicos . . . . . . . . . . . . . . . . . . . . . 20 e a 3. An´ lisis de Componentes Principales de Tres V´as a ı 21
3.1. Modelo Tucker3 . . . . . . . . . . . . . . . . .. . . . . . . . . 22 3.2. DVS de Tres V´as (Modelo PARAFAC) . . . . . . . . . . . . . 34 ı 3.3. Modelo Tucker2 . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.4. Modelo de Tucker1 . . . . . . . . . . . . . . . . . . . . . . . . 38 ´ 3.5. Representacion Biplot . . . . . . . . . . . . . . . . . . . . . . . 39
II
4. Aplicaciones Bibliograf´a ı
43 48
III
Nomenclatura
a x X XX(I × JK)(J × IK)(K × IJ) e, E, E r(A) vec(A) tr(A) A, B, C D D I I G G ∗ ⊗ ∆
un escalar un vector ´ matriz o arreglo de dos v´as ı arreglo de tres v´as o multi v´as ı ı ´ matrizacion de X ´ vector, matriz o arreglo de tres v´as de residuales ı rango de A ´ vectorizacion de A traza de A matrices de cargas matriz diagonal arreglo de tres v´as super diagonal ı matriz identidad arreglo de tresv´as superdiagonal con unos en la diagonal ı ´ matrizacion arreglo core arreglo core de tres producto directo o Hadamard producto Khatri-Rao producto Kronecker producto Tensor
IV
Introduccion ´
´ El an´ lisis de datos multivariados proporciona multiples m´ todos donde a e ˜ el objetivo es reducir dimensionalidad, a costa de una pequena p´ rdida e ´ de informacion, pero consiguiendo unas´ntesis de los datos. Uno de estos ı m´ todos es el An´ lisis de Componentes Principales cl´ sico (ACP), donde e a a dadas I observaciones medidas sobre J variables, se analiza, si es posi´ ´ ble representar adecuadamente esta informacion con un numero menor de variables construidas como combinaciones lineales incorrelacionadas ´ de las variables originales, permitiendo representar optimamente en un ´˜ espacio de dimension pequena, observaciones que originalmente estaban ´ en un espacio de muchas dimensiones, lo que facilita la interpretacion de los datos. La t´ cnica de Componentes Principales es debida a Hotelling e (1933), aunque sus or´genes se encuentran en los ajustes ortogonales por ı m´nimos cuadrados introducidos por K. Pearson (1901). ı ˜ En el ACP los datos se disponen en unamatriz X de tamano (I × J), donde las columnas contienen las variables y las filas los objetos o individuos, previamente los datos se centran respecto a la media, entonces las variables tienen media cero y su matriz de covarianzas vendra dada por:
1 X I
˜ ´ X (de tamano (J × J)), esta matriz y su descomposicion en valores
propios constituyen la herramienta fundamental para resolver el proble˜ madescrito en el ACP, Pena (2002). Otra de las t´ cnicas del An´ lisis Multivariado, es el escalado multidimene a sional (EMD), que se aplica cuando en lugar de disponer de una matriz
V
de observaciones por variables, se dispone de una matriz cuadrada D de ˜ tamano I × I, de distancias o de disimilaridades entre los individuos, estas distancias pueden haberse obtenido a partir de ciertas...
Regístrate para leer el documento completo.