Variables Dicotomicas

VARIABLES DICOTOMICAS

VARIABLES DICOTOMICAS
En un análisis de regresión, la variable dependiente está influenciada frecuentemente por variables cuantitativas (por ejemplo: ingreso, precios, costos, etc.). Sin embargo, también puede estarlo por variables cualitativas (por ejemplo: género, raza, nacionalidad, etc.). A estas variables generalmente se les conoce como Variables Cualitativas,Dicotómicas o Variables Dummy. Ej: Al estimar la demanda por un producto puede ser relevante si el consumidor es hombre o mujer.

VARIABLES DICOTOMICAS
Puesto que la variable usualmente indica la presencia o ausencia de una “cualidad” o atributo, tal como femenino/masculino, negro/blanco, católico/no católico, etc., podríamos “cuantificar” tales atributos mediante la elaboración de variablesartificiales que tomen el valor 0 y 1. Así, podemos dividir la muestra en 2 partes, una que contenga todas las observaciones que presenten el atributo de interés y la otra parte contiene a los que no lo presentan. Es un recurso para clasificar datos en categorías mutuamente excluyentes (femenino/masculino).

VARIABLES DICOTOMICAS
Definimos la variable dicotómica como:

1 Si el in dividuopresenta el atributo D  0 en otro caso
Estas variables pueden utilizarse en los modelos de regresión de la misma forma que las variables cuantitativas.

ILUSTRACION MODELO
Se desea averiguar si el salario promedio anual de los profesores de escuelas públicas difieren entre las 51 estados de EEUU en el año 1985. Para ello los 51 estados se clasifican dentro de 3 áreas geográficas (Norte, Sur yOeste) . Al analizar los salarios promedio por región encontramos: • $24.424 (Norte), •$22.894 (Sur), y •$26.158 (Oeste). Los valores claramente difieren entre sí, pero ¿son estadísticamente distintos entre sí?

ILUSTRACION MODELO

Yi  1   2 D2i   3 D3i  ui
donde: Yi = salario promedio de profesores de escuelas públicas en el estado i. D2i = 1 si el estado está en el área Norte 0para otra área. D3i = 1 si el estado está en el área Sur 0 para otra área

ILUSTRACION MODELO
Si el error cumple los supuestos clásicos, entonces al tomar esperanza tenemos: * El salario promedio de los profesores en el área Norte:

E (Yi D2i  1, D3i  0)  1   2
* El salario promedio de los profesores en el área Sur:

E (Yi D2i  0, D3i  1)  1   3 E (Yi D2i  0, D3i  0)  1* El salario promedio de los profesores en el área Oeste:

ILUSTRACION MODELO
Estimando el modelo por MCO tenemos:

ˆ Yi  26158,62  1734,473D2i  3264,615 D3i (t ) (23,18) (1, 21) (2,18)

En los resultados vemos que el salario promedio de los profesores del Oeste es casi $26.158, el de los profesores del Norte es menor en casi $1.734 y respecto a los del Sur es menor por casi $3.265.Los salarios medios de los profesores del Norte y Sur están dados por $24.424 y $22.894, respectivamente. ¿Y cómo sabemos si son estadísticamente diferentes a los salarios promedios de los profesores del Oeste?

ILUSTRACION MODELO
Para ello analizamos si los parámetros de pendiente son estadísticamente significativos. En la regresión vemos que el coeficiente asociado al área Norte no esestadísticamente significativo, en tanto el sur sí lo es. En conclusión, estadísticamente, los salarios promedios de los profesores del oeste y del norte son casi iguales, pero el salario medio de los profesores del sur es estadísticamente más bajo que los del oeste.

PRECAUCIONES AL USAR VARIABLES DICOTOMICAS
1.- Si una variable cualitativa tiene m categorías, sólo hay que agregar (m-1) variablesdicotómicas. ¿ Por qué?, porque si agregamos m variables dicotómicas caemos en lo que se conoce como “trampa de la variable dicotómica”, o sea, se tendrá un problema de multicolinealidad perfecta. En el ejemplo, si hubiésemos agregado una tercera dummy para el área Oeste, al sumar horizontalmente las 3 columnas de dummy tendríamos una columna de 1’s, pero ya teníamos una columna de 1’s para el...
tracking img