Regresión Multiple
•FACULTAD NACIONAL DE SALUD PÚBLICA •“Héctor Abad Gómez”
•Facultad Nacional de Salud Pública “Héctor Abad Gómez”
•La Regresión es una técnica estadística utilizadas para estimar (interpolar) valores de una variable dependiente Y, teniendo en cuenta una sola variable independiente X, deben ser ambas cuantitativas.
•La correlación mide el grado de asociaciónentre esas dos variables y en que sentido. En muchos casos se usa la correlación sin aplicar el procedimiento de regresión. Lo contrario no aplica.. •En Regresión Simple.
•"Y es una función de X" •Y = f(X)
•www.leondariobello.com •www.ciemonline.info
•Los valores de la variable independiente X son fijos, medidos sin error. •La variable Y es aleatoria •Para cada valor de X, existe unadistribución normal de valores de Y (subpoblaciones Y) •Las variancias de las subpoblaciones Y son todas iguales. •Todas las medias de las subpoblaciones de Y están sobre la recta. •Los valores de Y están normalmente distribuidos y son estadísticamente independientes.
•www.leondariobello.com •www.ciemonline.info
•www.leondariobello.com •www.ciemonline.info/blog
• • • • • • •
Identificar X,Y Construír diagrama de dispersión Estímar los parámetros del modelo. Probar la signifícancia Determinar la fuerza de la asociación Verificar la exactitud de la predicción Análisis de residuales
V.dependiente
V.Independiente ^ Y= b0 + b1 X Modelo matemático
b1
n xi yi ( xi )( yi ) n xi ( xi ) 2
2
b0 y b1 x
•www.leondariobello.com •www.ciemonline.info/blog
Seestá interesado en medir el grado de asociación entre dos variables y en que sentido (X, Y = Y, X)
SCR R2= ----------SCTO
Coeficiente de Determinación
i i
r
x y x
2 i
nx y
nx
2
y
2 i
ny
2
Coeficiente de Correlación
•www.leondariobello.com •www.ciemonline.info/blog
Además de la apreciación visual de la correlación, existe un parámetro llamadocoeficiente de correlación de Pearson ( r ) que nos permite valorar el grado de asociación
Débil Buena
Poca
0.33 0.33
Débil
Buena
-1
0.90
0.70 0.50
0
Pésimo
0.50
0.70
0.90
+1
Ideal
Ideal
Definitivamente es algo empírico, hay que analizar las variables relacionadas y su impacto en el entorno.
•www.leondariobello.com •www.ciemonline.info/blog
Métodomultivariante que analiza la relación entre una única variable dependiente y varias variables independientes. El objetivo es predecir cambios en la variable dependiente en respuesta a cambios en varias de las variables independientes
Cada variable predictor es ponderada, indicando la ponderación su contribución relativa a la predicción conjunta
El conjunto de variables independientesponderadas se denomina valor teórico de la regresión o ecuación de regresión Y= b0 + b1X1 + b2X2 +.....+ bn Xn
•www.leondariobello.com •www.ciemonline.info
Objetivos Diseño de Investigación
Creación de Variables Adicionales
Supuestos de R. Múltiple Estimar el modelo Interpretación del Valor Teórico Validación
Predicción – Explicación Tamaño muestral – Potencia de prueba(.80) Transformaciones – V. Dummy – Polinomios
Normalidad – Linealidad – Homocedasticidad – Independencia de los ei
Selección de la técnica de Investigación.
•www.leondariobello.com •www.ciemonline.info/blog
Análisis de regresión múltiple
SUPUESTOS EN LA REGRESIÓN MÚLTIPLE
NORMALIDAD El perfil de la distribución de los datos se corresponde con unadistribución normal. Si la variación respecto de la distribución normal es amplia, los tests estadísticos resultantes no son válidos, dado que se requiere la normalidad para el uso de los estadísticos de la t y de la F. La normalidad univariante ayuda a obtener normalidad multivariante, pero no la garantiza. La normalidad multivariante implica que las variables individuales son normales. ¿cómo evaluarla?...
Regístrate para leer el documento completo.