muestreo noprobabilistico
Tema
2.
Modelos
de
regresión
María
Dolores
Frías
Domínguez
Jesús
Fernández
Fernández
Carmen
María
Sordo
Departamento
de
Matemá.ca
Aplicada
y
Ciencias
de
la
Computación
Este
tema
se
publica
bajo
Licencia:
Crea.ve
Commons
BY-‐NC-‐SA 3.0
TEMA 2: Modelos de regresión
Datos bidimensionales
●
Gráficos, estadísticos bidimensionales
Método de mínimos cuadrados
●
Regresión lineal simple
●
Regresión lineal múltiple
●
Regresión no lineal
●
Idoneidad del modelo
●
Medidas de la calidad del ajuste
María Dolores Frías, Jesús Fernández y Carmen María Sordo
Datos bidimensionalesLos métodos vistos hasta ahora solo permiten trabajar con datos
unidimensionales.
Si se analizan las variables por separado se pierde información sobre la
distribución de frecuencias conjunta.
Las variables bidimensionales surgen cuando se estudian dos
características asociadas a la observación de un fenómeno
En concreto, resultan de tomar una muestra de tamaño n de una
variable aleatoria bidimensional (X,Y)
{(x1,y1), (x2,y2), ..., (xn,yn)}
Ejemplo
Peso y altura de una muestra de personas
Altura
(cm)
Peso
(kg)
160 165 168 170 171 175 175 180 180 182
55
58
58
61
67
62
66
74
María Dolores Frías, Jesús Fernández y Carmen María Sordo
79
79
Datos bidimensionales
La relación entre dos variables (X, Y) se puede estudiar
mediante tablas.
Distribución de frecuencias conjunta y marginales de la altura
y el peso de 200 personas.
ALTURA
PESO 155160 160165 165170 170175 175180
5060
2
11
2
0
0
6070
3
43
95
24
1
7080
0
0
5
12
2
TOTAL
5
54
102
36
3
TOTAL
15
166
19
200
También se puede expresar la tabla en función de las frecuencias relativas, sin más que dividir entre n.
María Dolores Frías, Jesús Fernández y Carmen María Sordo
Diagrama de dispersión
La forma más sencilla de representar gráficamente datos
bidimensionales es mediante los diagramas de dispersión,
que representa los pares de datos de la muestra sobre unos
ejes cartesianos.
Ejemplo
Se observa que cuando la
altura aumenta el peso
aumenta.
Existe una relación lineal
directa entre las variables.
María Dolores Frías, Jesús Fernández y Carmen María Sordo
Diagrama de dispersión
La forma más sencilla de representar gráficamente datos
bidimensionales es mediante los diagramas de
dispersión,que representa los pares de datos de la muestra
sobre unos ejes cartesianos.
Y
YX
X
Cuando X crece Y crece:
relación lineal directa.
Cuando X crece Y decrece:
relación lineal inversa.
Casi todos los puntos pertenecen
al primer y tercer cuadrante
Casi todos los puntos pertenecen
al segundo y cuarto cuadrante.
María Dolores Frías, Jesús Fernández y Carmen María Sordo
Correlación linealEs posible estimar la relación lineal entre los datos tomados
de dos variables mediante el coeficiente de correlación:
donde Sn(x,y) es la covarianza muestral.
Toma valores entre 1 (dependencia
directa) y 1 (dependencia inversa).
Si se acerca a 0 la dependencia lineal
es débil.
María Dolores Frías, Jesús Fernández y Carmen María Sordo
Ejercicio
Regresión
En la práctica surge con frecuencia la necesidad de tener
que relacionar un conjunto de variables a través de una
ecuación (ej, el peso de unas personas con su altura).
La regresión es una técnica estadística que permite
construir modelos que representan la dependencia entre
variables o hacer predicciones de una variable Y en función
de las observaciones de otras (X1, ..., Xp)....
Regístrate para leer el documento completo.