Tablas resumen de weka

Solo disponible en BuenasTareas
  • Páginas : 3 (566 palabras )
  • Descarga(s) : 0
  • Publicado : 13 de noviembre de 2011
Leer documento completo
Vista previa del texto
Data Warehousing
Diseño e implementación de un data warehouse
Marta Millan
millan@eisc.univalle.edu.co

www.eisc.univalle.edu.co/materias

Estrategia de división • ¿Por qué dividir lastablas?: • Facilidad de manejo • Mejora en el rendimiento • Dos estrategias: • Horizontal • Vertical

División horizontal • Dividir tablas horizontalmente acelera las consultas minimizando el conjunto dedatos • Formas de dividir: • Segmentos de tiempo iguales • Segmentos de tiempo diferentes • Dividir por una dimensión diferente al tiempo

Segmentos de tiempo iguales


Forma más común dedivisión Se divide la tabla de hechos usando el tiempo como medida, usando periodos de tiempo significativos para la empresa (mes, trimestre, año) Algunas divisiones tendrán muchos datos, mientras queotras tendrán muy pocos





Segmentos de tiempo diferentes

Cuando datos antiguos no se utilizan: dividir la tabla de hechos en segmentos de tamaño diferente: Divisiones pequeñas para losdatos recientes Divisiones algo más grandes para datos mas antiguos Las divisiones mayores para los datos más antiguos

Dividir por una dimensión diferente al tiempo


División por tiempo máscomún. En ocasiones dividir por producto, región, proveedor o cualquier otra dimensión No dividir nunca usando una dimensión que pueda cambiar durante la vida del data warehouse



División verticalSe dividen los datos verticalmente. Dos formas: Normalización División por columnas

División vertical (ii)

División vertical: normalización

Normalizar los datos dentro de un data warehousepuede producir “joins” muy grandes y muy ineficientes, evitar

División vertical: división por columnas


La división por columnas acelera el acceso a las tablas más grandes reduciendo sutamaño Hacerlo si se sabe con seguridad que algunas columnas generalmente no se acceden



Agregaciones Aceleran consultas más comunes Costo de crear y de gestionarlas vs. beneficios de hacerlo...
tracking img