Estadistica
Cuando se tiene una variable, llamada dependiente, cuyos resultados son un valor promedio de una función de una o mas variables no aleatorias, llamadas independientes (el concepto de independencia y dependencia se establece en términos matemáticos, no probabilístico), se tiene que recurrir a un tipo de técnicas que permitan modelar estasituación.
Existen dos formas de obtener estos modelos: funciones determinísticas, y funciones probabilísticas, nuestro interés es sobre estos últimos. Aunque para fines prácticos, si el error es despreciable se deben de usar los determinísticos, pero si se quiere estimar el error se deben usar los probabilísticos, a pesar de que no representen exactamente a la realidad.
Si la función es de tipolineal, en la cual el exponente de las variables independientes no es mayor de uno, el modelo se denomina de regresión lineal, si no es el caso entra en lo que se denomina superficies de respuesta.
Si solo existe una variable independiente se llama simple y si son dos o más variables independientes se les llama múltiple.
MODELO DE REGRESIÓN LINEAL SIMPLE
Cuando se busca un modelo en el cual se tieneuna sola variable independiente, y esta es una función lineal, el modelo se puede expresar de la forma:
Donde:
ε es el error aleatorio con media cero y la misma varianza de la población, que representa todas las variables que no entran en el modelo, por no poderse incluir a todas y afectar mínimamente a Y, lo que hace que no sea una representación exacta de la realidad.
La técnicaque se mostrará a continuación, estima a los parámetros de este modelo usando la técnica que se conoce como mínimos cuadrados. Los supuestos en que se requieren para aplicar esta técnica son:
La variable dependiente es una variable aleatoria, cuyo valor promedio está determinado por la variable independiente.
La relación entre las variables dependiente e independiente es lineal.
Lasvarianzas de las distribuciones condicionales de la variable dependiente, para diversos valores de la variable independiente, son iguales. Propiedad llamada Homoscedasticidad.
Si se desea realizar estimación por intervalos, se debe cumplir adicionalmente con el supuesto de:
Las distribuciones condicionales de la variable dependiente, para diversos valores de la variable independiente, son todasdistribuciones normales para la población de valores.
Técnica:
1. Dibujar un diagrama de dispersión, el cual permite una primera aproximación para averiguar si se cumplen algunos de los supuestos del modelo.
2. Calcular los valores de los parámetros en base a las fórmulas establecidas al ajustar el modelo por mínimos cuadrados.
3. Realizar los cálculos necesarios para efectuar las inferencias que sedeseen (estimación puntual, estimación por intervalos, prueba de hipótesis).
4. Evaluar lo adecuado del modelo para el problema analizado.
Al aplicarse esta técnica se debe tener mucho cuidado al elegir las variables, ya que la aparente dependencia que exista entre X y Y, se puede deber a que ambas son dependientes de una tercera variable que no se encuentre contenida en el análisis.
2.2Diagrama de dispersión
Al realizar la recolección de información al modificar intencionalmente a la variable independiente y registrar el valor observado de la variable dependiente, se contará con n pares de valores observados, que se graficarán en una diagrama simple X-Y. Esto permitirá evaluar a simple vista si la relación es o no lineal. Las formas típicas que se encontrarán son como se muestra enla siguiente figura:
En la primera gráfica se aprecia claramente una relación lineal positiva (a mayores valores de X, mayores valores de Y), en la segunda una relación lineal negativa (a mayores valores de X, menores valores de Y), y en la tercera se aprecia que la relación no es lineal (se puede ajustar más de una línea recta).
En este último caso se tiene que buscar...
Regístrate para leer el documento completo.