estadistica
Tema 2. Variables estadísticas bidimensionales
En el tema anterior se ha estudiado sobre cada individuo de la muestra sólo el valor que presenta un
carácter o una única variable. En este tema se medirá sobre cada individuo dos caracteres (por ejemplo:
salario y edad), estos dos caracteres los notaremos como X e Y. A la variable que representadicho
estudio se denomina variable estadística bidimensional.
Con lo desarrollado en el tema 1 se puede estudiar separadamente la variable X o la variable Y,
calculando sus medidas de posición, dispersión, … Pero lo más importante que se introduce en el
estudio de variables estadísticas bidimensionales es el análisis conjunto de ambas variables para
conocer la relación entre ellas.
2.1Representaciones numéricas en dos columnas y en tablas de
contingencia.
Dos columnas.
La tabla más sencilla para representar los valores de una variable estadística bidimensional consiste en
colocar en dos columnas los pares de valores observados. Es la forma habitual de representarlos en
hojas de cálculo y programas de estadística
xi
yi
x1
x2
...
xn
y1
y2
...
yn
Tablas decontingencia.
También llamada tabla de correlación, es una tabla de doble entrada en la que se recogen ordenadas y
clasificadas las observaciones presentadas por una variable estadística bidimensional.
Para ilustrar su forma nos apoyamos en el ejemplo siguiente:
TÉCNICAS CUANTITATIVAS 1– TEMA 2
1
GRADO MARKETING E INVESTIGACIÓN DE MERCADOS
►EJEMPLO 2.1.
La distribución segúnsalarios (Y) y edades (X) de un grupo de 100 jóvenes es
X Y
500-1.000
10
5
2
0
17
20
21
22
23
n j
1.000-1.500
3
15
20
13
51
1.500-2.000
2
5
15
10
32
ni
15
25
37
23
n=100
◄
En general la notación para este tipo de tablas es la siguiente
Bj
B1
* L*0 L*1
X Y
L*j 1 L*j
...
y1
* A1
L0 L1
Ai
...
Li 1 Li
Ak
...
Lk1 Lk
x1
xi
xk
n j
Bp
L*p 1 L*p
...
yj
n11
...
ni1
...
nk 1
...
...
...
...
...
n1 j
n1
...
ni
yp
n1 p
...
nkj
...
...
...
...
...
...
nkp
n1
...
ni
...
nk
n j
...
n p
n
...
nij
...
nip
* Pueden utilizarse para atributos, variables continuas o discretas.
El número de veces que se haobservado el par de valores xi , y j lo notamos como nij y se denomina
k
frecuencia absoluta conjunta de dicho par,
p
n
i 1 j 1
ij
n
La frecuencia relativa conjunta se define a partir de la frecuencia absoluta como fij
k
es el número total de observaciones,
p
f
i 1 j 1
ij
nij
n
, donde n
1.
Se denomina distribución bidimensional defrecuencias al conjunto de valores que representamos en
la tabla de contingencia,
x , y , n ,
i
j
ij
i 1,..., k ,
TÉCNICAS CUANTITATIVAS 1– TEMA 2
j 1,..., p .
2
GRADO MARKETING E INVESTIGACIÓN DE MERCADOS
2.2
Distribuciones marginales y condicionadas. Independencia.
Distribuciones marginales.
Otros
importantes
ni , i 1,..., k , n j ,
valoresque
aparecen
en
la
tabla
de
contingencia
son
j 1,..., p ,
p
ni xnij
j 1
k
n j xnij
k
p
i 1
j 1
xni xn j n
i 1
conocidos como frecuencias absolutas marginales.
Las frecuencias relativas marginales se define a partir de las frecuencias absolutas como
n
fi i
n
f j
n j
k
xf
n
i 1i
p
xf j 1
j 1
Para estudiar separadamente una variable de la otra, utilizaremos estas frecuencias que aparecen en la
última fila y columna de la tabla de contingencia. A estas distribuciones de frecuencias se les
denominan distribuciones marginales.
Para estudiar separadamente una variable de la otra cuando tenemos los datos en dos columnas basta
con quedarnos sólo con...
Regístrate para leer el documento completo.