Analisis de dato escalamiento

Solo disponible en BuenasTareas
  • Páginas : 4 (794 palabras )
  • Descarga(s) : 0
  • Publicado : 7 de noviembre de 2011
Leer documento completo
Vista previa del texto
ICI-134 Análisis de Datos

22-09-2011

ICI-134 Análisis de Datos

Clase 5.2 Capítulo III .Escalamiento Unitario
Septiembre 23, 2011

III.3. Residuales Escalados / Coeficientes Estandarizadosde Regresión
• A veces es mejor trabajar con residuales escalados, los que son útiles para determinar observaciones que sean atípicas o valores extremos. Como MSRes es la varianza aproximada de unresidual, entonces un escalamiento lógico sería el de los residuales estandarizados.



di =


ei , MSRe s

i = 1,2, …, n

Los residuales estandarizados tienen media cero y varianzaaproximadamente unitaria. Luego, un residual estandarizado grande (por ejemplo di > 3) indica que se trata de un valor atípico potencial.

2

Dr. Nicolás Bronfman Depto. Ciencias de la Ingeniería

1 ICI-134 Análisis de Datos

22-09-2011

III.3. Coeficientes Estandarizados de Regresión
• • • En general es difícil comparar en forma directa coeficientes de regresión. Por lo general, lasunidades del coeficiente de regresión βj son y/unidades de xj. Ejemplo:

ˆ y = 5 + x1 + 1000 x2
ˆ Supongamos que y se mide en litros, x 1 en mililitros y x 2 en litros.

ˆ ˆ Aunque β1 es bastantemayor que β 2 , el efecto de ambos regresores ˆ sobre y es el mismo.

• •

En muchas ocasiones es mejor trabajar con regresores y variables de respuesta que produzcan coeficientes de regresiónadimensionales. A este tipo de regresores se les conoce como coeficientes estandarizados de regresión.
3

III.3.1. Escalamiento Normal Unitario
• Este método emplea el escalamiento normal unitario sobrelos regresores y la variables de respuesta para obtener coeficientes estandarizados de regresión regresión.

z ij = y i* =

x ij − x j sj yi − y sy

i = 1,… , n ; j = 1,… , k i = 1,… , ndonde s j2 =

∑ ( x ij i
=1

n

−xj ) −y )
2

2

n −1

es la varianza muestral del regresor x j

y

sy =
2

∑ (y i i
=1

n

n −1

es la varianza muestral de la respuesta.
4...
tracking img