Analisis multivariado

Solo disponible en BuenasTareas
  • Páginas : 12 (2844 palabras )
  • Descarga(s) : 0
  • Publicado : 4 de septiembre de 2012
Leer documento completo
Vista previa del texto
Introducción.

De acuerdo con el planteamiento de la asignatura Análisis Multivariante I, referente a todos aquellos métodos destinados al análisis de múltiples variables en conjunto, nos disponemos a realizar un estudio sobre los datos obtenidos de 13 variables, referentes al mes de septiembre del año 2000, que representan las características principales en automóviles.El objetivo fundamental y motivación de este trabajo es poder aplicar las técnicas multivariantes más relevantes (Análisis multivariante de la varianza, análisis factorial, análisis de componentes principales), ya que vamos a disponer de un número elevado de variables, así como detectar la potencial relación entre las variables consideradas y aplicar en consecuencia los citados métodos para elagrupamiento de variables. (Análisis factorial y análisis de componentes principales).


La muestra seleccionada está formada por 24 automóviles para los cuales se han medido datos técnicos y relativos a la dimensión de los mismos. En concreto las variables consideradas son las siguientes:


Precio del automóvil. (En pesetas)
Tipo de combustible.
Tracción.Número de cilindros.
Cilindrada. (En centímetros cúbicos)
Potencia. (En caballos de vapor)
Longitud. (En centímetros)
Anchura. (En centímetros)
Altura. (En centímetros)
Volumen del maletero. (En litros)
Peso. (En kilogramos)
Consumo medio. (En litros)
Velocidad máxima. (En kilómetros/hora)

Lo querepresenta cada variable es muy claro, además, en conjunto, definen de manera acertada las principales características en las que un posible comprador debe fijarse a la hora de adquirir un automóvil.


Estamos interesados en detectar cuales son las variables que influyen de manera significativa en el precio de un coche, la detección de grupos de variables que estén correlacionadas y lasdiferencias significativas que pueden existir atendiendo al tipo de combustible utilizado (gasolina o diesel) y a la tracción (delantera o trasera).

Metodología.

El proceso de análisis, como ya hemos dicho anteriormente, tiene como objetivo la detección de grupos de variables altamente relacionadas. Para este fin la metodología empleada es la siguiente:
Análisis inicial delos datos, obteniendo previa información sobre las variables y la relación existente entre ellas, así como la formulación y comprobación de las hipótesis del modelo.


Aplicación de la técnica MANOVA.
Análisis de componentes principales.
Análisis factorial.
Conclusiones.


Las distintas técnicas empleadas se irán explicando de forma breve a lo largo delproceso analítico.
A continuación presentamos una tabla en la que aparecen los datos obtenidos y los estadísiticos más relevantes como pueden ser la media y desviación típica de cada variable numérica:
[pic]

[pic]


Análisis previo de los datos y comprobación de las hipótesis.

La formulación y comprobación de las hipótesis previas viene motivada por lanecesidad de que los datos cumplan una serie de requisitos necesarios para la realización de las técnicas multivariantes. Con esto nos aseguraremos una mayor fiabilidad en los resultados obtenidos.


Como ya es sabido, las hipótesis que hemos de comprobar son:
• Linealidad.
• Normalidad.
• Aleatoriedad.
• Homocedasticidad.
Elincumplimiento de alguna de estas hipótesis nos lleva a la realización de transformaciones adecuadas para que se verifiquen.

Análisis inicial de los datos.

Presentamos a continuación el vector de medias, la matriz de varianzas-covarianzas, la matriz de correlación de las variables numéricas.

Vector de medias.

[pic] [pic]
El orden de las variables es...
tracking img