analis exploratorio de datos
Es un conjunto de estrategias para el análisis de datos, cuya esencia es “permitir que los datos hablen y la búsqueda de patrones en los datos”, enmuchas situaciones, el análisis exploratorio de los datos puede preceder a una situación de inferencia formal, mientras que en otras, el análisis exploratorio puede sugerir preguntas y conclusiones que sepodrían confirmar con un estudio adicional. De acuerdo con lo anterior, el análisis exploratorio de datos puede ser una herramienta de utilidad en la generación de hipótesis, conjeturas y preguntas deinvestigación acerca de los fenómenos de donde los datos fueron Obtenidos.
Objetivos
Evaluar la calidad y la consistencia de los datos
Determinar la distribución de las variables en estudioAplicar el tratamiento de datos ausentes
Detectar datos atípicos ( outliers )
Comprobar supuestos: normalidad, linealidad, homocedasticidad.
Resumir los datos mediante el uso conjunto de medidasde resumen y sus gráficos.
Explorar formas de categorizar variables a través de búsqueda de puntos de corte.
Tipos
Univariado: estatura, peso, pulso, temperatura, etc.
Bivariado: estatura y peso,frecuencia cardiaca y nivel de colesterol.
Multivariado: se quiere medir la relación entre la presión arterial, edad, peso y estrés.
Forma de realizar
Forma de gráficos
Prueba de contrasteAnálisis Exploratorio Univariado:
Histograma:
Muestra la forma de distribución de los datos.
Revela la presencia o no de simetría
Proporciona información respecto a la variabilidad de los datos.Ejemplo
Edades de un grupo de pacientes que participaron en un trabajo de investigación
.
Asimetría
Identifica datos externosSe observa simetría
Normalidad
Ausencia de datos externos
Diagrama De Tallo Y Hojas
Permite observar al conjunto de datos como un todo y destacar alginas características, tales como:
La...
Regístrate para leer el documento completo.