Estadistica

Solo disponible en BuenasTareas
  • Páginas : 20 (4764 palabras )
  • Descarga(s) : 0
  • Publicado : 13 de enero de 2011
Leer documento completo
Vista previa del texto
MANIPULACIÓN DE VALORES PERDIDOS EN DATOS LONGITUDINALES
POR ARLINGTON LLERENA MARTÍNEZ

Universidad Nacional Departamento de Estadística

El siguiente material proporciona una descripción de las diferentes metodologías aplicadas en la manipulación de valores perdidos en un estudio que involucra datos longitudinales y brinda una descripción sobre las ventajas y supuesto de talesprocedimientos en el análisis. En primera instancia se describe las deficiencias de la imputación por la media de las distintas variables estudiadas y los patrones de valores perdidos a partir de las definiciones de los MCAR, MAC y NMAR, luego de las características de estos conceptos en un conjunto de datos se procede a la utilización de métodos estadísticos basados en el algoritmo EM para imputar los datosen función de los patrones que describen las perdidas y las ausencias.

Introducción En algunas ocasiones encontramos valores perdidos para una o más variables dentro del vector de observaciones. Para un número pequeño de entradas perdidas en la matriz de datos , puede ser fácil manejar el problema de pérdidas de información a partir de la eliminación de aquellos renglones que contengan valoresperdidos. Sin embargo para un número grande de valores perdidos este enfoque podría producir una eliminación excesiva de información. Presentamos a continuación varias metodologías para el tratamiento de valores perdidos en una matriz de información procedente de un estudio longitudinal. Apoyamos tales procedimientos por estadísticas multivariadas y por los patrones que reflejas los valoresperdidos en un conjunto de datos. Aun que en algunas ocasiones se asume que tales valores están dispersos de manera aleatoria en toda la matriz de datos tal aseveración debe ser evaluada en vista de que tales valores pueden depender de alguna manera de las variables tratadas o inclusive de los valores ausentes en el estudio

Patrones de pérdida. Rao (1983) argumenta que el método de máximaverosimilitud para estimar valores perdidos debe ser reevaluado en vista de los supuestos de aleatoriedad que requiere, él afirmo que el principal problema de los valores perdidos es que ocurren de manera no aleatoria. Hoy día los estudios que tratan de imputación de datos en una matriz de información brindan en primara instancia una metodología sobre cómo tratar el patrón de perdida que manifiestan losdatos obtenidos en experimentos. De manera general actualmente se manejan tres definiciones concernientes a patrones de perdida. Rubin " (1976) distingue entre ( )" y " " ( )". ( )" ,

Un patrón de valores perdidos es cuando estos no dependen de las observaciones perdidas ni de las observaciones obtenidas. En el patrón los valores perdidos no dependen de los datos perdidos pero quizás observadas.exista alguna dependencia con las Para el caso valores perdidos. los valores perdidos pueden depender de los observados y de los

Entre los distintos métodos utilizados para el tratamiento de valores perdidos se destacan muchos enfoques, los cuales son: El primer enfoque algunas veces denominado eliminación por lista, usa solo los vectores de información completos. Esta es una buena solución solosi hay pocos vectores incompletos pero no es satisfactoria cuando hay muchos vectores afectados. Note que si los valores perdidos no ocurren de manera aleatoria entonces la exclusión de los vectores de datos asociados dan una muestra no aleatoria que no es representativa de la población. Una variación de este procedimiento es eliminar variables (columnas) de la matriz de datos Hamel (1987)propone los pasos para lograr esta eliminación. La otra opción a menudo llamada eliminación por pareja. Esta usa todas las observaciones disponibles cuando calcula el vector y todas las pareja de valores disponible para el cálculo de ó . Para ilustra consideremos la siguiente matriz de datos − −

Para calcular contamos con 5 observaciones, para y contamos con 4 observaciones disponibles. Para...
tracking img