Causa- efecto
REGRESIÒN LINEAL
Con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe una relación inherente entre ellos.
A menudo se tiene una sola variable dependiente o respuesta (conocida como efecto) y la cual no se controla en el experimento. Esta variable tradicionalmente se denota como Y.
Esta respuestadepende de una o más variables independientes o de regresión (causas) que se denotan normalmente como X1, X2,...,XK. Estas variables causa se miden en general con un error despreciable y en realidad, en la generalidad de los casos, se controlan en el experimento.
Regresión lineal simple
La regresión lineal simple nos presenta el caso cuando sólo existe una variable de regresión (causa)independiente X y una sola variable aleatoria independiente Y.
El concepto de lineal surge dado que la relación entre estas variables puede interpretarse como aquella que tienen las variables en la ecuación de una recta.
Ecuaciones de regresión
Las ecuaciones de la regresión se van a obtener mediante el método de los mínimos cuadrados que básicamente lo que hacen es minimizar el error de fallaren el pronóstico.
La idea consiste en minimizar el valor del MSE y a partir de ahí escoger la mejor ecuación que represente los datos.
En general lo que sucede es que tenemos un conjunto de datos que al graficarlos en un diagrama de dispersión se presentarían de esta forma:
[pic]
La intención de este método es encontrar la recta que mejor se aproxime a este cada uno de los datos, o enotra palabras, que mejor representen la relación entre estos puntos.
Lo que vamos a hacer es encontrar la ecuación de la recta más representativa de estos datos.
Recordemos que la ecuación de una recta esta representada por:
[pic]
En el caso de la regresión vamos a tener información histórica de los valores de y a determinados valores de x.
Usaremos dichos valores para encontrar losvalores de a y b que minimizan el error y aproximan más cualquier recta al conjunto de datos. Esto valores son llamados los coeficientes de regresión y que es lo que estamos buscando.
Una vez encontrados estos valores se usa esta ecuación de regresión para pronosticar y a diferentes valores de x.
El método para encontrar a y b requiere del uso de derivadas parciales que no son el objetivode este curso, por lo que daremos la fórmula directa para encontrar a y b.
[pic]
Interpretación: La línea de Regresión es la línea que mejor se ajuste a un conjunto de puntos de datos X-Y, es aquella que minimiza la suma de las distancias al cuadrado de los puntos a la línea, medidas en dirección vertical o hacia Y. A esta línea se le conoce como la línea de regresión y su ecuación esdenominada ecuación de regresión.
Ejemplo
En un estudio médico se cree que el consumo de carne de puerco es una causa muy importante del sobre peso extremo antes de los 40 años. Se tomó una muestra de 15 pacientes menores de cuarenta años y se investigó su consumo en kilos de carne de puerco en los último cuarenta años, así como los kilos de sobre peso que tenían. Con estos datos encuentra laecuación de regresión para estos hombres y pronostique que sobre peso se espera que tenga un hombre mayor de 40 años que consumió 25 kilos de carne de puerco el año pasado.
Solución
Veamos la siguiente tabla dónde se muestra la información original.
[pic]
Tabla a la cual se le deben de agregar las siguientes columnas para poder obtener los valores de a, b y la ecuación de la línea recta.|Observación |Kilos |Kilos | | | |
| |consumidos |sobrepeso | | | |
| |X |Y |XY |X2 |Y2 |
|1 |14...
Regístrate para leer el documento completo.