Componente principales: como hacer un buen trabajo

Solo disponible en BuenasTareas
  • Páginas : 8 (1829 palabras )
  • Descarga(s) : 0
  • Publicado : 27 de noviembre de 2011
Leer documento completo
Vista previa del texto
Análisis de Componente Principales
Definición del problema y de las variables
El ejemplo presentado constituye un trabajo de investigación en que se analizan diversas variables en 100 madres y sus correspondientes recién nacidos en parto normal. De entre estas variables se han seleccionado, para un análisis de Componentes Principales, las siguientes 9:
* PESOM: Peso madre (kg).
*TALLAM: Talla madre (cm).
* SEM: Semanas de gestación (semanas).
* PASM: Presión arterial sistólica de la madre (mm Hg).
* PADM: Presión arterial diastólica de la madre (mm Hg).
* PESOR: Peso recién nacido (kg).
* TALLAR: Talla recién nacido (cm).
* PTR: Perímetro Torácico recién nacido (cm).
* PCR: Perímetro Craneal recién nacido (cm).
Para empezar a hacer el análisisdebemos mirar primero el comportamiento de cada variable. Para analizar estos datos procederemos a utilizar SPSS, de donde se obtuvieron los siguientes resultados. |
| PESOM | TALLAM | SEM | PASM | PALM | PESOR | TALLAR | PTR | PCR |
N | Válidos | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
| Perdidos | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Media | 61,00 | 165,77 | 37,94 | 126,16 |71,21 | 3,283 | 49,94 | 31,55 | 34,72 |
Mediana | 61,50 | 165,00 | 38,00 | 122,50 | 67,50 | 3,200 | 50,00 | 32,00 | 35,00 |
Moda | 65 | 165 | 38 | 125 | 60 | 3,2 | 50 | 32 | 35 |
Desv. típ. | 7,541 | 6,553 | 1,536 | 23,233 | 16,195 | ,4058 | 1,757 | 2,504 | 2,327 |
Varianza | 56,869 | 42,947 | 2,360 | 539,752 | 262,289 | ,165 | 3,087 | 6,270 | 5,416 |
Asimetría | -,288 | ,275 | -1,859 |,501 | ,947 | ,630 | -,135 | -2,345 | 5,701 |
Error típ. de asimetría | ,241 | ,241 | ,241 | ,241 | ,241 | ,241 | ,241 | ,241 | ,241 |
Curtosis | ,727 | -,250 | 10,711 | -,731 | ,292 | ,533 | ,819 | 7,663 | 47,867 |
Error típ. de curtosis | ,478 | ,478 | ,478 | ,478 | ,478 | ,478 | ,478 | ,478 | ,478 |
Mínimo | 34 | 152 | 29 | 90 | 50 | 2,5 | 45 | 21 | 30 |
Máximo | 79 | 182 | 41 | 180 |120 | 4,4 | 54 | 35 | 54 |
Tabla 1. Estadísticos Descriptivos
En la tabla 1 se muestran las medidas de localización y dispersión de cada una de las variables (análisis univariante). Dado que las variables tienen diferentes escalas de medición y se distribuyen de manera diferente con respecto a la normal, dado el coeficiente de Curtosis y Asimetría, debemos proceder a la estandarización de losdatos para que las unidades de medida sean homogéneas y así evitar que algunas variables pesen más que otras a la hora de hacer el análisis. Para ver esto de forma más clara mostraremos los histogramas de cada uno de los aspectos estudiados.

Grafico 1. Histograma de las Variables

Aquí puntualmente vemos que las Semanas de gestación del bebe tiene un sesgo a la izquierda y es la única variableque presenta este comportamiento, mientras que las demás variables mantienen su forma normal, aunque algunas presenten sesgo hacia la derecha pero no tan notable.

Grafico 2. Boxplot de las variables

El Grafico 2 es muy importante aunque la mayoría lo pasa por alto. Su importancia se debe a que nos muestra de manera eficaz los datos atípicos de cada una de las variables. Estos atípicos puedenvenir de diferentes formas, sean problemas de digitación o en realidad casos atípicos, como por ejemplo en Semanas de gestación que vemos una estrella, este puede ser el caso de un niño prematuro y por ende no deberíamos sacarlo del estudio. Así como este ejemplo aparecen datos atípicos en la mayoría de variables; lo recomendable seria eliminar estos puntos ya que pueden cambiar el sentidocompleto de nuestro análisis de componentes principales, pero antes de esto se debe hacer una investigación del porque son atípicos, ya que no se pueden eliminar así porque si. En este caso no vamos a eliminar ningún dato porque no tenemos la forma de saber de dónde viene.

Dado que estandarizamos las variables, por la razón antes dicha, procederemos a utilizar la matriz de correlación, en vez de la...
tracking img