Desarrolo sustentable
El objeto de un análisis de regresión es investigar la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes ([pic],...). Para poder realizar esta investigación, se debe postular una relación funcional entre las variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la práctica es la relaciónlineal. Cuando solo existe una variable independiente, esto se reduce a una línea recta:
[pic]
Donde los coeficientes b0 y b1 son parámetros que definen la posición e inclinación de la recta. (Nótese que hemos usado el símbolo especial [pic] para representar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo quees importante hacer esta distinción.)
El parámetro b0, conocido como la “ordenada en el origen,” nos indica cuánto es Y cuando X = 0. El parámetro b1, conocido como la “pendiente,” nos indica cuánto aumenta Y por cada aumento de una unidad en X. Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En elanálisis de regresión, estas estimaciones se obtienen por medio del método de mínimos cuadrados.
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
[pic]
Donde β0 es la intersección o término "constante", las [pic]son losparámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
[pic]
Ejemplo de una regresión lineal con una variable dependiente y una variable independiente.
Como ejemplo, consideremos las cifras del Cuadro 1, que muestra datos mensuales de producción ycostos de operación para una empresa británica de transporte de pasajeros por carretera durante los años 1949-52 (la producción se mide en términos de miles de millas-vehículo recorridas por mes, y los costos se miden en términos de miles de libras por mes). Para poder visualizar el grado de relación que existe entre las variables, como primer paso en el análisis es conveniente elaborar undiagrama de dispersión, que es una representación en un sistema de coordenadas cartesianas de los datos numéricos observados. En el diagrama resultante, en el eje X se miden las millas-vehículo recorridas, y en el eje Y se mide el costo de operación mensual. Cada punto en el diagrama muestra la pareja de datos (millas-vehículo y costos de operación) que corresponde a un mes determinado. Como era deesperarse, existe una relación positiva entre estas variables: una mayor cantidad de millas-vehículo recorridas corresponde un mayor nivel de costos de operación.
Cuadro 1.
Operaciones Mensuales en
una Empresa de Transporte de Pasajeros.
Costos Millas
Totales Vehículo
(miles) (miles)
Mes Nº Y X
[pic]
1 213.9 3147
2 212.6 3160
3 215.3 3197
4 215.3 3173
5 215.4 3292
6 228.2 3561
7 245.6 4013
8 259.9 4244
9 250.9 4159
10 234.5 3776
11 205.9 3232
12 202.7 3141
13 198.5 2928
14 195.6 3063
15 200.4 3096
16 200.1 3096
17 201.5 3158
18 213.2 3338
19 219.5 3492
20 ...
Regístrate para leer el documento completo.