Análisis de regresión

Solo disponible en BuenasTareas
  • Páginas : 7 (1612 palabras )
  • Descarga(s) : 0
  • Publicado : 12 de diciembre de 2011
Leer documento completo
Vista previa del texto
CASOS PERDIDOS: MENOS DEL 10% SE REEMPLAZAN POR LA MEDIA.

REGRESIÓN LINEAL MÚLTIPLE:
• Técnica de análisis multivariante que permite explicar el comportamiento de una variable dependiente a partir de un conjunto de variables independientes.
• La relación entre las variables del modelo debe ser lineal.
• Propósito: A partir de las variables independientes se persigue predecir elcomportamiento de la variable dependiente. Permite ordenar jerárquicamente las variables independientes en función de su poder explicativo.
• Objetivos:
o Determinar si un conjunto de variables independientes explican el comportamiento de una variable dependiente.
o Jerarquizar las variables independientes en según su poder explicativo en relación con la variabledependiente.
o Predecir el comportamiento de la variable dependiente asignándole un puntaje a aquellos casos que no presentaban valores en esta variable.

Requisitos:
• Variables escalares. Acepta variables ordinales como si fueran escalares
• 2 o más variables independientes y una variable dependiente.
• Cada variable independiente debe aportar con información original, a laexplicación de la variable dependiente (Evitar a multicolinealidad).
• Variables independientes correlacionadas con variable dependiente. Pedir tabla de correlaciones.
• Distribución normal de las variables.
• Homocedasticidad: Valores de la variable dependiente tienen una dispersión similar en cada valor de la variable independiente

• Coeficiente de determinación r2: proporciónde la varianza de la variabledependiente explicada por el conjunto de variables independientes. La varianzaexplicada por el modelo debe ser mayor que la no explicada.
• Coeficiente de determinación r2 ajustado: como su nombre lo indica se trata de una corrección del coeficiente de determinación, la que sirve para controlar la sensibilidad de este estadístico cuando las muestras son de grantamaño. Se lee como porcentaje de varianza explicada por el modelo.
• Anova entre varianza explicada por el modelo y la varianza residual (no explicada por el modelo): se espera que la primera sea mayor que la segunda y que esto se de a un nivel de significación inferior a 0,05.
• Coeficientes beta estandarizados: permiten evaluar el poder explicativo que aporta cada una de las variablesindependientes ordenándolas de manera jerárquica. Complementariamente observamos a través de una prueba t de student que variables presentan diferencias significativas entre los valores pronosticados y los residuos. Se espera que el nivel de significación de esta prueba sea menor que 0,05; aquellas variables que aportan con menos explicación al modelo, presentan diferencias no significativas en laprueba t.

REGRESIÓN LOGÍSTICA:

• Persigue los mismos objetivos que regresión lineal.

• Técnica de análisis multivariante que permite explicar el comportamiento de una variable dependiente a partir de un conjunto de variables independientes.

• Variables dependientes dicotómicas (valores 1 y 0). Tiene la ventaja de no requerir supuestos como el de normalidad multivariable yel de homocedasticidad.

• El dibujo del gráfico se asemeja a un S.

• A partir de las variables independientes se persigue predecir el comportamiento de la variable dependiente mediante el cálculo de probabilidades de la ocurrencia de las categorías (valores) de la variable dicotómica.

• Al igual que la regresión lineal permite ordenar jerárquicamente las variablesindependientes en función de su poder explicativo.

• Se analiza en función del valor 1.

• Requisitos:

o Variable dependiente: Dicotómica (0,1)

o Variables independientes: Escalares, ordinales o nominales (transformadas en variables dummy).

o Cada variable independiente debe aportar con información nueva y relevante para la predicción

o Relaciones no lineales entre...
tracking img