Tablas resumen de weka
Diseño e implementación de un data warehouse
Marta Millan
millan@eisc.univalle.edu.co
www.eisc.univalle.edu.co/materias
Estrategia de división • ¿Por qué dividir lastablas?: • Facilidad de manejo • Mejora en el rendimiento • Dos estrategias: • Horizontal • Vertical
División horizontal • Dividir tablas horizontalmente acelera las consultas minimizando el conjunto dedatos • Formas de dividir: • Segmentos de tiempo iguales • Segmentos de tiempo diferentes • Dividir por una dimensión diferente al tiempo
Segmentos de tiempo iguales
•
Forma más común dedivisión Se divide la tabla de hechos usando el tiempo como medida, usando periodos de tiempo significativos para la empresa (mes, trimestre, año) Algunas divisiones tendrán muchos datos, mientras queotras tendrán muy pocos
•
•
Segmentos de tiempo diferentes
Cuando datos antiguos no se utilizan: dividir la tabla de hechos en segmentos de tamaño diferente: Divisiones pequeñas para losdatos recientes Divisiones algo más grandes para datos mas antiguos Las divisiones mayores para los datos más antiguos
Dividir por una dimensión diferente al tiempo
•
División por tiempo máscomún. En ocasiones dividir por producto, región, proveedor o cualquier otra dimensión No dividir nunca usando una dimensión que pueda cambiar durante la vida del data warehouse
•
División verticalSe dividen los datos verticalmente. Dos formas: Normalización División por columnas
División vertical (ii)
División vertical: normalización
Normalizar los datos dentro de un data warehousepuede producir “joins” muy grandes y muy ineficientes, evitar
División vertical: división por columnas
•
La división por columnas acelera el acceso a las tablas más grandes reduciendo sutamaño Hacerlo si se sabe con seguridad que algunas columnas generalmente no se acceden
•
Agregaciones Aceleran consultas más comunes Costo de crear y de gestionarlas vs. beneficios de hacerlo...
Regístrate para leer el documento completo.