Regresion Lineal ESTADISTICA
CAPITULO
9
´
ESTADISTICA
DESCRIPTIVA BIDIMENSIONAL
´
1. INTERROGANTES CENTRALES DEL CAPITULO
a) Cuando sobre cada individuo se observan simult´aneamente dos caracter´ısticas cuantitativas ¿c´omo se organizan y representan gr´aficamente esos datos bidimensionales?
b) ¿C´omo se puede saber si dos variables estad´ısticas est´an relacionadas de forma lineal, exponencial, potencial
o parab´olica?c) ¿Se puede predecir el valor de una variable sabiendo el valor de otra variable que est´a relacionada con ella
de forma lineal, exponencial, potencial o parab´olica?
´
2. CONTENIDOS FUNDAMENTALES DEL CAPITULO
2.1. Tabulaci´on de los datos
Cuando sobre cada individuo de una poblaci´on se observan simult´aneamente dos caracter´ısticas cuantitativas, que
unidimensionalmente podr´ıamos representarseparadamente por las variables X e Y , entonces se dice que se est´a
observando una variable estad´ıstica bidimensional y se representa por (X, Y ).
El conjunto de valores bidimensionales de la variable junto con sus frecuencias asociadas dar´a lugar a la correspondiente distribuci´on bidimensional de frecuencias.
En el caso de variables bidimensionales podemos distinguir dos tipos principales detablas:
a) Tabulaci´on en dos columnas (o en dos filas)
Si el n´umero de datos bidimensionales es peque˜no, los datos se disponen en dos columnas (o en dos filas)
sobre las que se emparejan los correspondientes valores unidimensionales de una misma realizaci´on de la
variable bidimensional, como se expresa en la tabla siguiente:
variable X
x1
x2
..
.
xn
variable Y
y1
y2
..
.
yn
ESTAD´I STICADESCRIPTIVA BIDIMENSIONAL
X
Y
A1
A2
..
.
Ai
..
.
Ar
suma
B1
f11
f21
..
.
fi1
..
.
fr1
f∗1
B2
f12
f22
..
.
fi2
..
.
fr2
f∗2
257
···
···
···
···
···
···
Bj
f1j
f2j
..
.
fij
..
.
frj
f∗j
···
···
···
···
···
···
Bk
f1k
f2k
..
.
fik
..
.
frk
f∗k
suma
f1∗
f2∗
..
.
fi∗
..
.
fr∗
n
Tabla 9.1: Tabla de doble entrada o de contingencia
b) Tabla de doble entrada o de contingencia
Si el n´umero deobservaciones bidimensionales es grande, clasificamos los n individuos de la muestra en
r clases (A1 , . . . , Ar ) respecto de la variable X, y en k clases (B1 , . . . , Bk ) respecto de la variable Y .
Entonces los datos suelen organizarse en una tabla como la Tabla 9.1, que se denomina tabla de doble
entrada o de contingencia.
En la Tabla 9.1, fij es el n´umero de individuos que pertenecen a laclase Ai de la variable X y a la clase Bj
de la variable Y y se llama frecuencia absoluta conjunta de la clase Ai × Bj de la variable bidimensional
(X, Y ).
La frecuencia relativa conjunta de la clase bidimensional Ai × Bj es igual a:
hij =
fij
.
n
(9.1)
2.2. Distribuciones marginales y condicionadas. Independencia de variables
Supongamos que tenemos los datos bidimensionales organizados en unatabla de doble entrada como la Tabla 9.1.
La suma de las frecuencias absolutas conjuntas de la fila i−´esima, fi∗ , es igual al n´umero de individuos en la clase
Ai de la variable X, independientemente del valor de Y , y se llama frecuencia absoluta marginal de la clase Ai
de la variable X:
fi∗ = fi1 + fi2 + · · · + fik .
La frecuencia relativa marginal de la clase unidimensional Ai es igual a:hi∗ =
fi∗
.
n
(9.2)
An´alogamente, la suma de las frecuencias absolutas conjuntas de la columna j−´esima, f∗j , es igual al n´umero
de individuos en la categor´ıa Bj de la variable Y , y se llama frecuencia absoluta marginal de la clase Bj de la
variable Y :
f∗j = f1j + f2j + · · · + frj .
La frecuencia relativa marginal de la clase unidimensional Bj es igual a:
h∗j =
f∗j
.
n
(9.3)
´
MATEMATICAS
258
Si de la Tabla 9.1 consideramos la primera y la u´ ltima columna obtenemos la distribuci´on marginal de frecuencias
absolutas de la variable X:
X
fi∗
A1
..
.
Ai
..
.
Ar
f1∗
..
.
fi∗
..
.
fr∗
suma
n
An´alogamente, si consideramos la primera y la u´ ltima fila de la Tabla 9.1, obtenemos la distribuci´on marginal de
frecuencias absolutas de la variable Y :
Y
f∗j
B1
..
.
Bj
.....
Regístrate para leer el documento completo.