Almacenes de Datos, OLAP y Minería de Datos

Páginas: 22 (5393 palabras) Publicado: 18 de octubre de 2013
Conceptos de almacenes de datos (Data Warehousing)
Un almacén de datos es una tecnología de gestión y análisis de los datos. Puede definirse como una colección de datos clasificados por temas, integrada, variable en el tiempo y no volátil que se utiliza como ayuda al proceso de toma de decisiones por parte de quienes dirigen una organización.
Los almacenes Web de datos son almacenes de datosdistribuidos que se implementan sobre la Web, no existiendo ningún repositorio centralizado.
Ventajas:
Alto retorno de inversión
Ventajas competitivas derivadas de su utilización
Mayor productividad de los responsables de la toma de decisiones
Comparación entre OLTP y almacenes de datos:
Proceso de Transacciones en Línea (OLTP)
Almacenes de datos
Almacena datos actuales.
Almacena datoshistóricos.
Almacena datos detallados.
Almacena datos resumidos en poca ó gran medida.
Los datos son dinámicos.
Los datos son principalmente estáticos.
Procesamiento repetitivo.
Procesamiento ad hoc, no estructurado y heurístico.
Alta tasa de transacciones.
Tasa media ó baja de transacciones.
Patrón de uso predecible.
Patrón de uso impredecible.
Dirigido por transacciones.
Dirigido poranálisis.
Orientado a la aplicación.
Orientado a los temas.
Soporta las decisiones cotidianas.
Soporta las decisiones estratégicas.
Sirve a un gran número de usuarios administrativos / operacionales.
Sirve a un número relativamente bajo de usuarios de tipo gerencial.
Problemas de los almacenes de datos
Subestimación de los recursos necesarios para la carga de datos.
Problemas ocultos delos sistemas de origen.
No se capturan los datos requeridos.
Incremento de la demanda por parte de los usuarios finales.
Homogeneización de los datos.
Alta demanda de recursos.
Propiedad de los datos.
Altos costes de mantenimiento.
Proyectos de larga duración.
Complejidad de la integración.
Arquitectura de un almacén de datos

Las principales componentes de un almacén de datos son:
1.Fuentes de Datos operacionales: todos los datos operacionales previamente almacenados en BDs, archivos propietarios, estaciones primarias de trabajo e incluso en sistemas externos como Internet, bases de datos comerciales ó bases de datos dependientes de los proveedores ó clientes de la organización.
2. Repositorio de datos operacionales (Operacional Data Store - ODS): es un almacén de datosoperacionales actuales e integrados que se utilizan para el análisis.
3. Gestor de carga (ó componente de interfaz): realiza todas las operaciones asociadas con la extracción y carga de los datos en el almacén. Se incluyen transformaciones simples.
4. Gestor del almacén de datos: realiza las operaciones asociadas con la gestión de datos dentro del almacén. Incluye el análisis de los datos paragarantizar su coherencia, transformación y combinación de datos de origen, creación de índices y vistas, generalización de agregaciones y desnormalizaciones, y el archivado y copia de seguridad de los datos.
5. Gestor de consultas (ó componente de servicio): realiza todas las operaciones asociadas con la gestión de las consultas de los usuarios: dirigir consultas hacia tablas apropiadas y planificar suejecución.
6. Datos detallados: área del almacén que guarda todos los datos detallados contenidos en el esquema de la BD.
7. Datos poco resumidos y muy resumidos: guarda todos los datos, poco ó muy resumidos (agregados), que hayan sido establecidos por el gestor de datos como resúmenes predefinidos.
8. Datos de archivo / copia de seguridad: guarda los datos detallado y resumidos con elpropósito de mantener un archivo y disponer de copias de seguridad.
9. Metadatos: guarda todas las definiciones de metadatos (datos acerca de los datos) utilizadas por todos los procesos del almacén. Se utilizan para propósitos tales como:
los procesos de extracción y carga: los metadatos “mapean” las fuentes de datos sobre una vista común de los datos utilizada dentro del almacén
el proceso de...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Almacenes de datos y minería de datos
  • Base Datos Mineria Datos
  • Base de datos
  • Almacenamiento de datos
  • Almacenamiento De Datos
  • Almacenamiento de los Datos
  • ALMACENAMIENTO DE DATOS
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS