Regreciòn Lineal
Método de cuadrados mínimos – Regresión lineal Hemos enfatizado sobre la importancia de las representaciones gráficas y hemos visto la utilidad de las versiones linealizadas de los gráficos (X, Y) junto a las distintas maneras de llevar a cabo la linealización. A menudo nos confrontamos con situaciones en las que existe o suponemos que existe unarelación lineal entre las variables X e Y. Surge de modo natural la pregunta: ¿cuál es la relación analítica que mejor se ajusta a nuestros datos? El método de cuadrados mínimos es un procedimiento general que nos permite responder esta pregunta. Cuando la relación entre las variables X e Y es lineal, el método de ajuste por cuadrados mínimos se denomina también método de regresión lineal. En estecapítulo discutiremos este último caso. El lector puede consultar en el Apéndice F de la Ref. [1] una discusión del caso general de cuadrados mínimos cuando el modelo es no lineal y los datos están afectados de errores.
La Fig. 1 ilustra el caso lineal. La dispersión de los valores está asociada a la fluctuación de los valores de cada variable. Observamos o suponemos una tendencia lineal entre lasvariables y nos preguntamos sobre cuál es la mejor recta:
y(x) = a x + b
(1)
que representa este caso de interés. Es útil definir la función χ2 (Chi-cuadrado)[1-3]:
χ 2 = ∑ i y − ( a ⋅ x + b) i i
2 (2)
que es una medida de la desviación total de los valores observados yi respecto de los predichos por el modelo lineal a x + b. Los mejores valores de la pendiente a y laordenada al origen b son aquellos que minimizan esta desviación total, o sea, son los valores que remplazados en la Ec.(1) minimizan la función χ2, Ec.(2). Los parámetros a y b pueden obtenerse usando técnicas matemáticas que hacen uso del cálculo
Red Creativa de Ciencia - 2002
1
diferencial. Aplicando estas técnicas, el problema de minimización se reduce al de resolver el par deecuaciones:
dχ 2 =0 da de donde resulta:[1-4]
y
dχ 2 =0 db
(3)
a=
N ∑ xi yi − ∑ xi ∑ yi N ∑ xi2 − (∑ xi )
2
(4)
b=
N ∑ x i2 ∑ y i − ∑ x i ∑ x i y i N ∑ x i2 − (∑ x i )
2
(5)
Actualmente, la mayoría de los programas de análisis de datos y planillas de cálculo, realizan el proceso de minimización en forma automática y dan los resultados de los mejores valores de a y b, o sealos valores indicado por la ecuaciones (4) y (5).
Figura 1 Gráfico de datos asociados a un modelo lineal. La cantidad yi - y(xi) representa la desviación de cada observación de yi respecto del valor predicho por el modelo y(x).
Red Creativa de Ciencia - 2002
2
El criterio de mínimos cuadrados reemplaza el juicio personal de quien mire los gráficos y defina cuál es la mejor recta. Enlos programas como Excel, Origin, etc., este cálculo se realiza usando la herramienta “regresión lineal” o “ajuste lineal”. Los resultados (4) y (5) se aplican en el caso lineal cuando todos los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable independiente se considera despreciable.
Una medida de la calidad o bondad del ajuste realizadoviene dado por el coeficiente de correlación R2 entre las variables X e Y, definido como:
R2 = donde
Cov ( x, y ) 2 Var ( x ) ⋅ Var ( y )
(6)
Cov ( x, y ) =
N
N ∑ xi ⋅ yi − ∑ xi ⋅ ∑ yi
i =1
N
N
N
N
2 2 i
i =1 2
i =1
(7)
N ∑ x ∑ xi Var( x ) = i =1 − i =1 N N
y
=< x 2 > − < x > 2
=< y 2 > − < y > 2
2
(8)
N ∑y ∑ yi − i =1 Var ( y ) = i =1 N N
N 2 i
(9)
El valor de R varía entre –1 y 1. Si R es ±1 o próximo a estos valores, decimos que el modelo lineal es adecuado para describir los datos experimentales. Cuando R se aparta de estos extremos decimos que una expresión lineal no es una buena descripción de los datos. En este caso, conviene analizar el gráfico y buscar una relación...
Regístrate para leer el documento completo.