Análisis exploratorio de datos
Santiago García Álvarez
1. Concepto y alcances
La finalidad del Análisis Exploratorio de Datos (AED) es examinar los datos previamente a la aplicación decualquier técnica estadística, con el objetivo de obtener un entendimiento básico de los datos y de las relaciones existentes entre las variables analizadas.
El AED proporciona métodos sencillos paraorganizar y preparar los datos, detectar fallos en el diseño y recogida de datos, tratamiento y evaluación de datos ausentes e identificación de casos atípicos. Aunque con un enfoque más complicado,el AED también permite la comprobación de los supuestos subyacentes en la mayor parte de las técnicas multivariantes.
En síntesis, el AED es un conjunto de herramientas gráficas y descriptivas quesirven tanto para encontrar algún sentido en los datos como también para contrastar una hipótesis de trabajo o para confirmar un tipo de comportamiento económico previamente establecido.
Estasherramientas se basan en los siguientes aspectos:
1. Estadística básica (descriptivos, correlaciones)
2. Estadística con gran número de datos (tablas de frecuencias)
3. Correlación cruzadacon análisis multivariante avanzado, especialmente diseñado para identificar formas en grandes bases de datos: análisis cluster, escalas multidimensionales, análisis logit, correlación canónica,análisis de correspondencias, árboles de clasificación, etc.).
4. Técnicas de visualización gráfica para identificar conexiones, tendencias o sesgos presentes en bases de datos ( “cepillado” o“brushing”) y representación gráfica de funciones, alisado de datos, superposición o fusión de múltiples “vistas” (“views”).
2. Análisis de pequeños conjuntos de datos
Para grupo de datos con 30 o menos,los principales estadísticos que se puede calcular son: i) de tendencia central y ii) de dispersión
1. Medidas de tendencia central
Media: determina el promedio de los datos....
Regístrate para leer el documento completo.