Regresion

Solo disponible en BuenasTareas
  • Páginas : 9 (2015 palabras )
  • Descarga(s) : 0
  • Publicado : 9 de agosto de 2010
Leer documento completo
Vista previa del texto
V.e.bidimensional: Diagrama de dispersión
Tenemos N pares de datos correspondientes a la observación de la variable estadística bidimensional (X, Y ) : (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ) La representación gráfica sobre unos ejes cartesianos de estos valores de la variable estadística bidimensional
´ (X, Y ) es el diagrama de dispersion o nube de puntos. Nos

Regresión

proporcionauna descripción gráfica de la relación entre las variables X e Y .

´ Regresion – p.1

´ Regresion – p.2

Diagramas de dispersión

Covarianza
La covarianza es una medida de asociación lineal que indica el grado de relación que existe entre dos variables estadísticas. Definición: Tenemos N individuos descritos según dos caracteres X,Y que presentan modalidades x1 , x2 , . . . , xN ; y1 , y2 ,. . . , yN respectivamente. Se define la covarianza de X eY :
N

Cov(X, Y ) = Se calcula:

i=1

(xi − x)(yi − y ) ¯ ¯ N
N

Cov(X, Y ) =
´ Regresion – p.3

i=1

xi y i − xy ¯¯
´ Regresion – p.4

N

Coeficiente de correlación lineal
´ Definición : Se define el coeficiente de correlacion lineal de X e Y como:

Ejemplo
Sea la variable Y : Estatura de la población española. Parahacer una predicción de la estatura de una persona elegida al azar, tomamos la media aritmética. Si conocemos el peso xi de la persona cuya estatura se quiere estimar, así como los datos de las variables peso y estatura en la población española: ¿cómo podemos mejorar nuestra estimación con esta nueva información?. Elegiremos la media de las estaturas de las persona que tienen ese peso xi .
´Regresion – p.6

r = r(X, Y ) = Propiedades: 1. Es adimensional.

Cov(X, Y ) DtX · DtY

2. Es una medida acotada: −1 ≤ r ≤ 1. Si r = −1 ó r = 1 estamos en uno de los casos extremos a los que hemos aludido, y la dependencia es funcional. 3. La relación lineal entre X e Y es mayor cuanto más cercano esté r(X, Y ) a −1 ó a 1. Cuanto más cercano esté r(X, Y ) a 0 la relación lineal es menor.

´Regresion – p.5

Ejemplo (Continuación)
Para cada valor de X = xi existe una distribución de Y . La curva que pasa por las medias de Y para un valor concreto de X = xi se llama : curva de regresión de Y sobre X. En la práctica se utilizan métodos para llegar a la ecuación de esta curva: Método de los mínimos cuadrados.

Método de los mínimos cuadrados
(X, Y ) v.e.bidimensional. Tenemos (xi , yi )i = 1, . . . , N Para la selección inicial de la curva, hacemos el diagrama de dispersión. Una vez seleccionada la línea (recta, parábola,...) que mejor se ajusta a la nube de puntos, calculamos los parámetros que intervienen en la ecuación que la representa, y = f (x).
´ Metodo de los m´nimos cuadrados: ı

consiste en encontrar

las estimaciones para los parámetros de la ecuaciónseleccionada mediante la minimización de la suma de los cuadrados de las diferencias entre los valores observados
´ Regresion – p.7

de la variable Y y de los ajustados.

´ Regresion – p.8

Regresión

Regresión lineal
(X , Y ) : variable estadística bidimensional. (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ) valores que toma la variable. Si al hacer el diagrama de dispersión la nube de puntos secondensa aproximadamente a lo largo de una recta vamos a ver como se obtienen las dos rectas de regresión, de Y sobre X y de X sobre Y .

(xi , yi ) : par observado.
∗ yi N

= f (xi ) : ordenada teórica (valor ajustado)
N

Cálculo de la recta de regresión de Y sobre X: Sea y = a + bx la ecuación de la recta buscada. Calculamos a y b para que el ajuste sea lo mejor posible
´ utilizando elmetodo de los m´nimos cuadrados. ı
´ Regresion – p.9 ´ Regresion – p.10

∗ ei = yi − yi : error cometido o residuo.

e2 i

=
i=1

∗ (yi − yi )2 expresión a minimizar.

i=1

Regresión lineal(II)

Ejemplo

Consideramos:
N

F (a, b) =
i=1

∗ (yi − yi )2 =

N i=1

(yi − (a + bxi ))2

Queremos estudiar que tipo de relación existe entre el número de líneas de un programa y...
tracking img