estadística
Tema 3: An´
alisis de datos bivariantes
Contenidos
3.1 Tablas de doble entrada.
Datos bivariantes.
Estructura de la tabla de doble entrada.
Distribuciones de frecuencias marginales.
Distribuci´
on conjunta de frecuencias relativas.
Distribuciones de frecuencias condicionadas.
Tabla de doble entrada para variables cuantitativas.
3.2 Correlaci´
on.
Diagrama de dispersi´
on.Tipos de relaci´
on entre dos variables cuantitativas.
Medidas de dependencia lineal.
Correlaci´
on y heterogeneidad.
Correlaci´
on y datos at´ıpicos.
Correlaci´
on y causalidad.
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
Tema 3
2
Tema 3: An´
alisis de datos bivariantes
3.3 Recta de regresi´
on.
Definici´
on de la recta.
Estimaci´
on de loscoeficientes.
Interpretaci´
on de los coeficientes.
Valores predichos, residuos y varianza residual.
Bondad del ajuste.
An´
alisis de residuos.
Los datos de Anscombe.
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
Tema 3
3
Lecturas recomendadas
Pe˜
na, D. y Romo, J., Introducci´
on a la Estad´ıstica para las Ciencias
Sociales.
Cap´ıtulos 7, 8 y 9.
Newbold, P.Estad´ıstica para los Negocios y la Econom´ıa.
Secciones 2.5 y 12.1–12.4.
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
Tema 3
4
Datos bivariantes
Ejemplo Nivel educativo (X ) y situaci´
on laboral (Y ) de 10 Madrile˜
nos.
Nivel educativo (1=Primaria o menos, 2=Secundaria, 3=Post-secundaria)
Situaci´
on laboral (1=Empleado, 2=Desempleado, 3=Inactivo)
Individuo
Niveleducativo (X )
Situaci´
on laboral (Y )
1
2
3
2
3
1
3
2
1
4
3
3
5
2
3
6
2
3
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
7
1
3
8
1
3
9
3
1
10
2
3
Tema 3
5
Datos bivariantes
Datos bivariantes: provienen de la observaci´
on simult´anea de dos variables
(X , Y ) en una muestra de n individuos. Los datos bivariantes sonparejas
de valores, num´ericos o no, de la forma:
(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )
Se usan para describir las dos variables conjuntamente o una variable en
funci´
on de la otra.
A menudo se intenta describir el comportamiento de una de las variables,
que se llama la variable dependiente y se denota por Y , en funci´on de la
otra variable, que se llama la variable independiente oexplicativa, y se
denota por X .
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
Tema 3
6
Estructura de la tabla de doble entrada
Representamos los valores de una de las variables (p.ej. X ) en las
cabeceras de las filas de una tabla, y los valores de la otra variable (p.ej.
Y ) en las cabeceras de las columnas de la tabla.
En la casilla correspondiente a cada parde valores de X e Y , se escribe la
frecuencia absoluta o n´
umero de individuos en cada combinaci´on de
valores.
Cuando al menos alguna de las dos variables es cualitativa, la tabla de
doble entrada tambi´en se denomina tabla de contingencia.
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
Tema 3
7
Estructura de la tabla de doble entrada/tabla de
contingenciaEjemplo Datos de 1508 madrile˜
nos (Encuesta de Condiciones de Vida). X :
Nivel educativo, Y : Situaci´
on laboral
X
Primaria
Secundaria
Post-secundaria
Empleado
95
393
317
Y
Desempleado
6
28
8
Inactivo
315
257
89
Se denomina distribuci´
on conjunta de (X , Y ) al conjunto formado por los
valores observados en forma de pares, junto con las frecuencias absolutascorrespondientes a cada par.
Estad´ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11
Tema 3
8
Estructura de la tabla de doble entrada
Tabla de doble entrada con k filas y m columnas
Y
y1 · · ·
yj
···
ym
x1 n11 · · · n1j · · · n1m
..
..
..
..
.
.
.
.
X
Total
n1
..
.
xi
..
.
ni1
..
.
···
nij
..
.
···
nim
..
.
ni
..
.
xk...
Regístrate para leer el documento completo.