Distribucion Normal Bivariada
La Normal bivariante (modelo de probabilidad)
Ajuste de una recta a una nube de puntos (análisis de datos)
1
Distribución Normal Bivariante (parámetros m1, m2, s1, s2, r)
m1= E(X) m2 = E(Y) s12 = Var(X) s22 = Var(Y) r = Coef. Correlación (X,Y)
2
Distribución Normal Bivariante (simulación de datos)
rho=0, sigma1=sigma2
10
rho=0,sigma1)1, sigma2=3
2
-2
m1= m2 = 0 s1 = s2 = 1 r =0
-3 -2 -1 0 1 2 3
5
m1= m2 = 0 s1 = 1 s 2 = 3 r =0
-10 -5 0 5 10
0
1
-1
rho=0.8, sigma1=sigma2
-10
-3
-5
0
rho=-0.8, sigma1=sigma2
-4
-2
0
2
4
-5
m1= m2 = 0 s 1 = s2 = 1 r = 0.8
-5
m1= m2 = 0 s1 = s2 = 1 r = - 0.8
5
0
0
5
-4
-2
0
2
4
3
Normalbivariante: Distribuciones condicionadas
Y/X=x es una N(b0+b1x , s)
E(Y/X=x)
x
Ejemplo de David W. Stockburger (Modelo para X resultado de un test, Y errores de producción)
y= b0+b1x es la recta de regresión de Y sobre X
4
Las técnicas de Regresión lineal simple parten de dos variables cuantitativas:
La variable explicativa (x) La variable respuesta (y)
Y tratan de explicar la ymediante una función lineal de la x representada por la recta
y = b0 + b1 x
Para ello dispondremos: De un modelo de probabilidad (la Normal) y de n pares de datos (xi,yi) que suponemos que provienen del modelo establecido
5
El origen:On the laws of inheritance in man Karl Pearson Biometrika 1903
Variables: X altura del padre Y altura del hijo Datos: n= 1078 parejas de padres e hijos Mediade los padres = 68 pulgadas Media de los hijos = 69 pulgadas vx = vy = 2.7 r =0.51
6
Modelo 1 (una variable aleatoria, fijado x)
Modelo 2 (dos variables aleatorias)
s
7
¡La diferencia está en cómo se tomarán los datos !
Modelo 1: El experimentador fija los valores de las xi y obtiene “al azar” los correspondientes yi Modelo 2: El experimentador obtiene “al azar” parejas devalores (xi ,yi) En ambos casos Los datos son un conjunto de n parejas (xi ,yi)
8
Muestra aleatoria
i = 1,2,…,n
Interpretación de los parámetros: Representa el valor medio de la respuesta (y) cuando la variable explicativa (x) vale cero Representa el incremento de la respuesta media (y) cuando la variable explicativa (x) aumenta en una unidad
9
Ajuste de una recta a n pares de datos(xi,yi)
DATOS
Gráfico de los puntos (xi,yi) i =1,2,…,n
10
Ajuste de una recta a n pares de datos (xi,yi)
Gráfico de puntos
¿tiene sentido una relación lineal? ¿tiene sentido alguna relación?
11
Ajuste de una recta a n pares de datos (xi,yi)
¿Cuál es la recta que mejor predice la altura en función de la edad?
Mínimos cuadrados Hacemos mínima la suma de los cuadrados de lasdiferencias entre el valor real de cada yi con el valor que predice la recta
12
Ajuste de una recta a n pares de datos (xi,yi) Estimación de los coeficientes de la recta
Recta de regresión estimada
13
Estimación de la varianza residual s2 (mide la dispersión de los puntos a la recta)
Los residuos del modelo son
Los grados de libertad de los residuos son n-2
Varianza residual14
ESTIMACIÓN PUNTUAL DE LOS PARÁMETROS DE LA REGRESIÓN
Estimación de r
15
ESTIMACIÓN POR INTERVALOS DE LOS PARÁMETROS DE LA REGRESIÓN (suponiendo Normalidad)
16
Análisis estadístico: requisitos previos
1. Normalidad: los datos obtenidos se ajustan razonablemente a una distribución Normal 2. Homocedasticidad: la variabilidad de los datos para los distintos valores de x essimilar 3. Linealidad: los residuos (diferencia de los datos a la recta) se distribuyen sin forma alrededor del cero
4. Independencia: las observaciones se realizan de forma independiente unas de otras
SI HAY DESVIACIONES SIGNIFICATIVAS SOBRE ESTOS REQUISITOS LOS RESULTADOS POSTERIORES PUEDEN SER INCORRECTOS
17
La importancia de los gráficos de puntos (4 conjuntos de datos emparejados)...
Regístrate para leer el documento completo.