Bases de datos para la toma de desiciones

Solo disponible en BuenasTareas
  • Páginas : 14 (3480 palabras )
  • Descarga(s) : 0
  • Publicado : 2 de octubre de 2010
Leer documento completo
Vista previa del texto
Unidad 2: Base de datos para la toma de decisiones 2.1 Almacenes de Datos (Data Warehouse) Generalmente, la información que se quiere investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas. Muchas de estas fuentes son las que se utilizan para el trabajo diario (bases de datos operacionales). Sobre estasmismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional). Uso de la base de datos transaccional para varios cometidos: Se mantiene el trabajo transaccional diario de los sistemas de información originales (conocido como OLTP, On-Line Transactional Processing). Se hace análisis de los datos en tiempo real sobre la misma base de datos (conocido como OLAP, On-Line AnalyticalProcessing).

Almacenes de datos Base de Datos diseñada con un objetivo de explotación distinto que el de las bases de datos de los sistemas operacionales. Es una colección de datos diseñada para dar apoyo a los procesos de toma de decisiones

2.1.1 Características Orientada hacia la información* relevante de la organización: se diseña para consultar eficientemente información relativa a lasactividades (ventas, compras, producción) básicas de la organización, no para soportar los procesos que se realizan en ella (gestión de pedidos, facturación, etc.). Integrada: integra datos recogidos de diferentes sistemas operacionales de la organización (y/o fuentes externas). Variable en el tiempo: los datos son relativos a un periodo de tiempo y deben ser incrementados periódicamente. Losdatos son almacenados como fotos (snapshots) correspondientes a periodos de tiempo. No volátil: los datos almacenados no son actualizados, sólo son incrementados.

-

2.1.2 Arquitectura La Arquitectura de un AD viene determinada por su situación central como fuente de información para las herramientas de análisis.  Componentes:  Sistema ETL (Extraction, Transformation, Load): realiza lasfunciones de extracción de las fuentes de datos (transaccionales o externas), transformación (limpieza, consolidación, ...) y la carga del AD, realizando:        extracción de los datos. filtrado de los datos: limpieza, consolidación, etc. carga inicial del almacén: ordenación, agregaciones, etc. refresco del almacén: operación periódica que propaga los cambios de las fuentes externas al almacénde datos

Repositorio Propio de Datos: información relevante, metadatos. Interfaces y Gestores de Consulta: permiten acceder a los datos ys sobre ellos se conectan herramientas más sofisticadas (OLAP, EIS, minería de datos). Sistemas de Integridad y Seguridad: se encargan de un mantenimiento global, copias de seguridad

Organización (Externa) de Los Datos Las herramientas de explotación de losalmacenes de datos han adoptado un modelo multidimensional de datos: Se ofrece al usuario una visión multidimensional de los datos que son objeto de análisis. Modelo multidimensional:  en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones).

 la información relevante sobre el hecho (actividad)se representa por un conjunto de indicadores (medidas o atributos de hecho).  la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).

El almacén de datos puede estar formado por varios datamarts y, opcionalmente, por tablas adicionales.

 se definen para satisfacer las necesidades de un departamento o sección de la organización. contiene menos información de detalle y más información agregada. 2.1.3 Diseño

Modelado multidimensional:  en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones).  la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho)....
tracking img