Estadígrafos

Páginas: 5 (1088 palabras) Publicado: 31 de octubre de 2015
UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE INGENIERIA CIENCIAS FISICAS Y MATEMATICAS
ESCUELA DE CIENCIAS

Análisis de Datos
Tema:
Estadígrafos
Integrantes:
Cóndor Mariela
Quinga Francisco
Octubre 2015
DETECCIÓN DE DATOS ATÍPICOS
Una forma adecuada para detectar datos atípicos cuando se tiene una variable unidimensional es utilizar un diagrama de cajas o boxplot. Para elloutilizamos la función boxplot, que en su forma más simple (tiene varias versiones):

Los extremos del diagrama son el valor máximo y el mínimo. Los valores atípicos o outliers (valores mayores que 3/2*RIQ por encima de Q3 o menores que 3/2*RIQ por debajo de Q1), si los hay, vienen señalados por un pequeño círculo y, entonces, los extremos que aparecen son el máximo y el mínimo de los valores quequedan al eliminar esos valores. Como se ve en la figura, en este caso no hay datos atípicos. Sin embargo, si al conjunto de datos tenrot le añadimos los valores 6.25 y 10.03 el gráfico boxplot cambiaría obteniendo un diagrama de cajas en horizontal.

AIC
En vez de obtener la distancia entre dos modelos, se obtiene una estima de la distancia relativa esperada entre el modelo estimado ylos verdaderos mecanismos (posiblemente de una dimensionalidad muy alta) que realmente han generado los datos observados.
AIC sirve para seleccionar el mejor modelo dentro de un conjunto de estos obtenidos con los mismos datos. Debemos hacer un esfuerzo por asegurarnos de que el conjunto de modelos de trabajo es sólido y está bien apoyado.
En el caso de modelos GLM, AIC se calcula del siguiente modo: n·[ln(2·π)+1] + n·ln(VAR) + 2·(k+2)
donde:
n=tamaño muestral,
VAR es la varianza residual = SSerror/n y
k es el número de predictores utilizados.
Lo importante no es el valor absoluto de AIC, sino las diferencias entre los valores AICi.
Log Verosimilitud
Supongamos que se desea estimar la prevalencia en España de personas de más de 50 años con cifras de tensión igual o superior a 160/100mmHg. Vamos a llamar a esa prevalencia p y si se calcula en tanto por 1 será 0< p <1. Para ello se obtiene una muestra aleatoria y representativa de esa población de tamaño N. Supongamos que denotamos con la letra X el número de sujetos que presentan cifras tensionales iguales o superiores a los límites fijados en nuestra muestra. El valor concreto que observaremos para X puede ser 0 (ningúnsujeto), 1, 2, hasta como máximo N(todos los sujetos).
En este ejemplo es razonable suponer que la variable aleatoria X, número de sujetos con cifras altas de tensión, que observaremos en nuestro estudio (es aleatoria porque si repetimos el trabajo con otra muestra diferente del mismo tamaño es poco probable que el valor observado sea exactamente el mismo) siga una distribución de probabilidadbinomial, cuya fórmula es la siguiente:
[1]  
donde CX,N es el número combinatorio que se calcula como N!/X!(N-X)!
Para simplificar la exposición, supongamos que se utiliza una muestra de N=200 sujetos. Una vez que efectuamos el estudio conocemos el valor de X y podemos calcular la probabilidad de observar exactamente ese valor para diferentes prevalencias posibles en la población. Esaprobabilidad que hemos llamado P(X) es función de N, X y p; luego conocidas las dos primeras variables podemos probar con distintos valores de prevalencia p y determinar qué valor de prevalencia en la población nos conduce a una mayor P(X), o lo que es lo mismo para qué valor real de la prevalencia en la población es más probable que observemos ese valor concreto de X en una muestra aleatoriade N sujetos.
Supongamos que el número X de pacientes con cifras de tensión iguales o superiores al límite prefijado es de 60. Podemos plantear cuál es la probabilidad de obtener 60 sujetos hipertensos en una muestra de 200 personas si la prevalencia real fuera de p=0.2. Substituyendo esos valores en la ecuación [1] obtenemos P(X)=0.00022. Si la prevalencia real fuera p=0.3 el valor de P(X) calculado...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • estadigrafos
  • Estadigrafos
  • estadigrafo
  • Estadigrafos
  • Estadígrafos
  • Estadigrafos
  • QUE ES UN ESTADIGRAFO
  • estadigrafos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS