Ninguno
1. Definición del problema real.
En algunas situaciones, existen objetivos determinados desde el comienzo.
Existen casos donde la investigación es másgeneralizada.
Análisis Exploratorios.
Análisis reactivo.
Análisis proactivo.
2. Acceso a la información
Acceso a los datos
Extracción y tests
Corte Proactivo
Corte reactivo
Transferencia de datos
3. Integración de múltiples fuentes de datos
Los datos no necesariamente provienen de la misma fuente.
Almacén de datos
Se extraen los datos en:
- Texto Libre
-Tablas
- Otros formatos
Normalización de los datos
- Unidades de medida en la misma escala
- Terminología consistente
- Información duplicada
- Tipos de datos similares
Limpieza de los datos
- Valores perdidos
- Valores erróneos
- Información de tipo texto
4. Análisis de los datos
Métodos de Visualización
- Permiten descubrir tendencias y patronesque no sería detectados por análisis no visuales.
- Los patrones se detectan en función de violaciones de límites, frecuencia de ocurrencia.
- La representación gráfica de los datos soportainspeccionar grandes cantidades de
- Información al mismo tiempo.
Métodos Analíticos
- Requieren saber previamente qué se espera encontrar, permitiendo formular hipótesis previas.
- Los resultadosobtenidos son más bien, grupos de tendencias y deferencias generales.
- Pruebas Estadísticas, Árboles de Decisión, Asociación de Reglas, Redes Neuronales y Algoritmos Genéticos.
5. Presentación deresultados
Es preferible presentar poca cantidad de información, pero importante.
Debe estar enfocada a los intereses de las personas que conforman la audiencia.
Los resultados obtenidosdeben estar justificados con documentación.
DATA WAREHOUSE
¿Qué entendemos por data warehouse?
Data Warehouse es una colección de datos orientado a temas, integrado, no volátil, de tiempo...
Regístrate para leer el documento completo.