Regre_lineal_simple2
Páginas: 10 (2413 palabras)
Publicado: 22 de octubre de 2015
1/7
Técnicas de regresión: Regresión Lineal Simple
Pértega Díaz S., Pita Fernández S.
Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña.
Cad Aten Primaria 2000; 7: 91-94. Actualización 20/08/2001.
__________________________________
En múltiples ocasiones en la práctica clínica nos encontramos con situaciones en las que se requiereanalizar la relación entre dos variables cuantitativas. Los dos objetivos fundamentales de este análisis
serán, por un lado, determinar si dichas variables están asociadas y en qué sentido se da dicha asociación
(es decir, si los valores de una de las variables tienden a aumentar –o disminuir- al aumentar los valores
de la otra); y por otro, estudiar si los valores de una variable pueden serutilizados para predecir el valor
de la otra.
La forma correcta de abordar el primer problema es recurriendo a coeficientes de correlación(1). Sin
embargo, el estudio de la correlación es insuficiente para obtener una respuesta a la segunda cuestión: se
limita a indicar la fuerza de la asociación mediante un único número, tratando las variables de modo
simétrico, mientras que nosotros estaríamosinteresados en modelizar dicha relación y usar una de las
variables para explicar la otra. Para tal propósito se recurrirá a la técnica de regresión. Aquí analizaremos
el caso más sencillo en el que se considera únicamente la relación entre dos variables. Así mismo, nos
limitaremos al caso en el que la relación que se pretende modelizar es de tipo lineal(2).
La recta de regresión.
Consideremos una variablealeatoria respuesta (o dependiente) Y, que supondremos relacionada con otra
variable (no necesariamente aleatoria) que llamaremos explicativa, predictora o independiente y que se
denotará por X. A partir de una muestra de n individuos para los que se dispone de los valores de ambas
variables, {(Xi,Yi),i = 1,...n}, se puede visualizar gráficamente la relación existente entre ambas mediante
ungráfico de dispersión, en el que los valores de la variable X se disponen en el eje horizontal y los de Y
en el vertical. El problema que subyace a la metodología de la regresión lineal simple es el de encontrar
una recta que ajuste a la nube de puntos del diagrama así dibujado, y que pueda ser utilizada para predecir
los valores de Y a partir de los de X. La ecuación general de la recta de regresiónserá entonces de la
forma: Y = a + bX .
El problema radica en encontrar aquella recta que mejor ajuste a los datos. Tradicionalmente se ha
recurrido para ello al método de mínimos cuadrados, que elige como recta de regresión a aquella que
minimiza las distancias verticales de las observaciones a la recta. Más concretamente, se pretende
encontrar a y b tales que:
Resolviendo este problema medianteun sencillo cálculo de diferenciación, se obtienen los estimadores
mínimo cuadráticos de los coeficientes de la recta de regresión:
;
www.fisterra.com
Atención Primaria en la Red
Investigación:
2/7
Tabla 1. Tensión Arterial Sistólica y Edad de 69 pacientes
Nº Tensión Sistólica Edad Nº Tensión Sistólica
Edad
1
114
17
36
156
47
2
134
18
37
159
47
3
124
19
38
130
48
4
12819
39
157
48
5
116
20
40
142
50
6
120
21
41
144
50
7
138
21
42
160
51
8
130
22
43
174
51
9
139
23
44
156
52
10
125
25
45
158
53
11
132
26
46
174
55
12
130
29
47
150
56
13
140
33
48
154
56
14
144
33
49
165
56
15
110
34
50
164
57
16
148
35
51
168
57
17
124
36
52
140
59
18
136
36
53
170
59
19
150
38
54
18560
20
120
39
55
154
61
21
144
39
56
169
61
22
153
40
57
172
62
23
134
41
58
144
63
24
152
41
59
162
64
25
158
41
60
158
65
26
124
42
61
162
65
27
128
42
62
176
65
28
138
42
63
176
66
29
142
44
64
158
67
30
160
44
65
170
67
31
135
45
66
172
68
32
138
45
67
184
68
33
142
46
68
175
69
34
145
47
69
180
70
35...
Leer documento completo
Regístrate para leer el documento completo.