Practica estadistica
Práctica 6
Práctica 6 de Estadística
El problema de la dependencia
variables medibles.
6.1
entre
Variables bidimensionales
El problema de la dependencia consiste en el estudio de la relación existente entre
dos o más características de los elementos de una población. Nos vamos a ocupar sólo
del estudio de la relación entre dos características que puedan serrepresentadas
mediante variables medibles, suponiendo que de cada elemento de la población
podemos obtener un valor para cada una de las variables, es decir consideraremos
distribuciones estadísticas bidimensionales.
•
Distribución bidimensional: Intervienen dos conjuntos diferentes de datos,
variando ambos a la vez.
Por ejemplo supongamos que queremos comparar la velocidad de ejecución de
dosprocesadores. Para ello ejecutamos, con cada uno, 8 programas y medimos
el tiempo empleado en cada ejecución. Consideremos las variables X e Y como
el tiempo (en milisegundos) empleado. Estamos entonces ante una distribución
bidimensional.
Al par de variables (X, Y), en donde para cada elemento de la población observamos
conjuntamente el valor de las dos variables, lo llamamos variableestadística
bidimensional. La variable la podemos representar mediante una tabla de dos filas (o
dos columnas):
X 201 210 220 199 206 203 220 220
Y 102 105 108 101 104 103 109 110
También podemos representar la variable gráficamente, obteniendo su diagrama de
dispersión o nube de puntos.
Departamento de Ciencia de la Computación
e Inteligencia Artificial
Curso 2013/2014
1
EstadísticaPráctica 6
Nube de puntos
112
110
108
106
Procesador Y
104
102
100
190
200
210
220
230
Procesador X
SPSS: Nube de puntos
Con el comando Gráficos/Cuadro de diálogos antiguos/Dispersión... obtenemos
el cuadro de diálogo correspondiente en el que marcamos la opción Simple y
pulsamos Definir. En el cuadro de diálogo obtenido seleccionamos lasvariables
para los ejes, el tipo de gráfico y pulsamos Aceptar.
6.2 Dependencia funcional y dependencia estadística.
Decimos que una variable Y depende funcionalmente de otra X cuando podemos
establecer una aplicación f que nos transforme los elementos de X en elementos de Y, es
decir Y = f(X). Es el caso, por ejemplo, de la relación existente entre el espacio, s,
recorrido por un móvil y suvelocidad v para un tiempo dado t0:
s = v·t0
Pero hay muchas otras variables como estatura y peso, consumo y renta, temperatura
y consumo de agua, etc, en las que es evidente que existe relación pero ésta no puede ser
expresada mediante una función. Este tipo de relación no expresable de forma funcional
se conoce mediante el nombre de dependencia estadística, y admite distintos grados,
según quela relación entre las variables sea más fuerte o más débil.
Departamento de Ciencia de la Computación
e Inteligencia Artificial
Curso 2013/2014
2
Estadística
Práctica 6
•
Dependencia funcional: Al determinar una variable, la otra queda determinada
de forma unívoca.
•
Dependencia estadística: Al determinar una variable, la otra
queda
determinada sólo en términosprobabilísticos. En este caso se habla de
correlación entre las variables.
La teoría de la regresión se ocupa de ajustar una función f que represente la relación
estadística entre dos variables. Una de las dos se considera coma variable independiente,
X, y la otra coma variable dependiente Y, de forma que mediante la función ajustada,
para cada valor de X se obtenga un valor f (X) que puedaservir como predicción del
valor de la variable Y.
Nos vamos a ocupar sólo del caso en que la función ajustada es una recta. La bondad
o calidad del ajuste realizado será medido por un estadígrafo muestral.
6.3 Covarianza. Correlación lineal.
Consideremos una muestra bidimensional de tamaño n
{( x1, y1 ), ( x2 , y2 ),K , ( xn , yn )}
La medida de relación lineal más simple entre las dos...
Regístrate para leer el documento completo.