Analisis exploratorio de datos
Segunda entrega.
15/12/2011
Grado en Estadística y Empresa
Carlos Gimeno Cristellys
NIU: 100283498
RELACIÓN ENTRE VARIABLES CUALITATIVAS
Tabla defrecuencias esperadas
Al haber dependencia entr las variable es
4,8476 > 4,61 La hipótesis de independencia no es creible.
Tras estudiar la independencia y observar que las variables no sonindependientes, estudiamos el Coeficiente de contingencia de Pearson y la V de Cramer.
Con estos datos podemos concluir que las variables no son independientes y que presentan una asociación débil,alrededor del 30%.
Tras el estudio se concluye que el sexo de una persona tiene una débil relación con el nivel de estudios que presenta
RELACIÓN ENTRE VARIABLES CUANTITATIVAS
* La relación entre laedad y los ingresos es lineal directa fuerte.
* La relación entre la edad y las semanas de vacaciones es lineal directa pero no fuerte.
* La relación entre los ingresos y las semanas devacaciones es lineal directa pero muy fuerte.
Entre las variables Ingresos y Semanas de vacaciones tiene sentido plantear un modelo de regresión lineal. La variable dependiente es el semanas devacaciones, ya que varía según los ingresos del individuo, que es la variable independiente, puesto que no varía ante cambios en entre semanas de vacaciones.
La relación entre ambas variables tendría estarepresentación gráfica:
Ajustamos la recta según el método de los mínimos cuadrados:
= a+bx b=2644,07/6445579,72=0,00041
a=2,32-0,00041*1,716=0,89929
= 0,89929 +0,00041x
a Cuando una persona tiene 0 semanas de vacaciones, sus ingresos son 0,89929€.
b Cuando los ingresos de una persona aumentan 1€ sus vacaciones aumentan en 0,00041 semanas.Para estudiar la bondad de ajuste de la recta utilizamos el coeficiente de determinación R2.
R2= rxy2= 0,80892= 0,6543. El 65,43% del peso queda explicado por la altura. El resto depende de otras...
Regístrate para leer el documento completo.