Regreson lineal
300
f(x)=ax+b
R2=0.99
250
REGRESIÓN
200
150
0
100
50
0
5
10
15
20
25
X
Y
REGRESIÓN
“Es una forma de estudiar la asociación o relación, entre
una variable dependiente (Y) y la variable que es la base de
la predicción a la que se le denomina variable
independiente (X) ”
Y
X
El propósito del análisis de regresión es usar los datos
o valores observados de las variables, pararealizar
estimaciones, en base a una relación funcional.
Regresión Simple, cuando en el
análisis de regresión, se utiliza sólo
una variable independiente.
Regresión Múltiple. cuando se considera
dos o más variables independientes .
y=f(X1,X2)
y=f(x)
X
X2
X1
Donde:
y ………………………... es la variable dependiente,
x, x1, x2, . . . , xk, ………….son variables independientes.
También se clasifica enlineal y no lineal, según el comportamiento de las
variables.
Qué vamos a estudiar
En esta unidad estudiaremos la Regresión Lineal simple, es
decir, vamos a tratar diferentes formas de describir la relación
entre dos variables cuando estas son numéricas.
Ejemplo:
Estudiar si hay relación
entre la altura (X ) y el peso (Y ).
y=f(x)
X
El tiempo de estudio dedicado
a un curso (X) , estarelacionado
con la calificación obtenida (Y)
MODELO DE REGRESIÓN LINEAL SIMPLE
Se busca encontrar una función de X muy simple (lineal) que
nos permita aproximar Y mediante la siguiente formula:
Y
Y = b0 + b1 X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
X
Esta
determinado
por 2
variables:
Y e Y rara vez coincidirán
por muy bueno que sea el
modelo de regresión. A la
cantidade=Y-Y
se
le
denomina
residual.
residuo
o
error
Qué hacer para realizar una regresión
El paso inicial que
generalmente se realiza, es la
construcción del Diagrama De
Dispersión.
El 2º paso es, a través del
Método
de
los
Mínimos
Cuadrados,
estimar
los
Coeficientes de Regresión ( b0
y b1) para establecer la recta de
regresión.
Y
X
Y = b0 + b1 X
b0 (ordenada en el origen, constante)
b1(pendiente de la recta)
Finalmente, cuando se realiza una predicción estadística, siempre
será útil calcular una medida que indique que tan preciso es el
pronóstico de Y sobre X. A esta medida se le llama Error
Estándar de Estimación.
DIAGRAMA DE DISPERSION
Es la representación de los puntos o datos de cada una
de las variables en el plano cartesiano.
100
90
80
70
60
50
40
30
140
150
160
170
180190
200
Es recomendable en todo estudio de regresión pues
permite tener una idea, sobre la existencia o no de la
regresión.
Modelos de Diagrama de Dispersión
Ejemplo: Estudio del conjunto de dos variables
•
A la derecha tenemos una posible manera de recoger los
datos obtenidos, observando dos variables en varios
individuos de una muestra.
– En cada fila tenemos los datos de un individuo
–Cada columna representa los valores que toma una
variable sobre los mismos.
– Las individuos no se muestran en ningún orden
particular.
•
•
Dichas observaciones pueden ser representadas en un
diagrama de dispersión o nube de puntos.
En ellos, cada individuos es un punto cuyas coordenadas
son los valores de las variables.
Nuestro objetivo será intentar reconocer a partir del mismo
si hay relaciónentre las variables, de qué tipo, y si es
posible predecir el valor de una de ellas en función de la
otra.
Altura Peso
en cm. en Kg.
161
50
187
76
197
85
179
65
171
66
169
60
166
54
176
84
163
68
...
...
Diagramas de dispersión o nube de puntos
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersión. Observar datos del cuadro anterior
10090
Pesa 85 kg.
80
Pesa 76 kg.
Mide 187 cm.
60
Pesa 50 kg.
50
Mide
161 cm.
40
Mide 197cm
70
30
140
150
160
170
180
190
200
Relación entre las variables altura (X) y peso (Y) de los 30
individuos vistos en el ejemplo anterior.
Peso (Kg.)
100
90
80
70
60
50
40
30
140
150
160
170
180
190
200
Altura (cm)
METODO DE LOS MINIMOS CUADRADOS
• Este método consiste en hallar los...
Regístrate para leer el documento completo.