Almacenes de datos y minería de datos

Solo disponible en BuenasTareas
  • Páginas : 22 (5288 palabras )
  • Descarga(s) : 8
  • Publicado : 20 de agosto de 2010
Leer documento completo
Vista previa del texto
LIC. EN SISTEMAS DE INFORMACIÓN
ALMACENES DE DATOS Y MINERÍA DE DATOS
  Trabajo monográfico de adscripción realizado por Griselda E. Bressán.  
Julio - 2003
Contenido
 
¿Qué es Data Warehousing?
Data Warehouse
Objetivos del Data Warehouse
¿Cómo trabaja el Data Warehouse?
¿En qué se lo puede usar?
OLAP Procesamiento analítico on-line
Sistemas de Data Warehouse y Oltp
Diferencias delData Warehouse vs. OLTP
El descubrimiento del conocimiento (KDD)
Metas de KDD
Técnicas de KDD
Data Marts
Minería de datos (md)
Aplicaciones de MD
Técnicas de MD
Algoritmos de minería de datos
Retos de la minería de datos
Etapas principales del proceso de data mining

Extensiones del Data Mining

¿Por qué usar Data Mining?
Conclusiones

¿Qué es Data Warehousing?
Es un proceso, noun producto. Es una técnica para consolidar y administrar datos de variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones, de una forma que no era posible hasta ahora.
Consolidar datos desde una variedad de fuentes, dentro del marco conceptual de Data Warehousing es el proceso de Transformación de Datos.
Manejar grandes volúmenes de datos de una forma que no eraposible, o no era costo efectiva, a estos medios se agrupan en Procesamiento y Administración de Datos.
Acceder a los datos de una forma más directa, en "el lenguaje del negocio", y analizarlos para obtener relaciones complejas entre los mismos. Estos procesos se engloban en dos categorías: Acceso a los Datos y Descubrimiento o Data Mining.
Estos desarrollos tecnológicos, correctamenteorganizados e interrelacionados, constituyen lo que se ha dado en llamar un Data Warehouse o Bodega de Datos.
La definición más conocida para el DW, fue propuesta por Inmon [MicroSt96] (considerado el padre de las Bases de Datos) en 1992: “Un DW es una colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo, organizados para soportar necesidades empresariales”.  

 

 Características

Según, Bill Inmon, existen generalmente cuatro características que describen un almacén de datos:
1.orientado al sujeto: los datos se organizan de acuerdo al sujeto en vez de la aplicación, por ejemplo, una compañía de seguros usando un almacén de datos podría organizar sus datos por cliente, premios, y reclamaciones, en lugar de por diferentes productos (automóviles, vida,etc.). Los datos organizados por sujetos contienen solo la información necesaria para los procesos de soporte para la toma de decisiones.
2.integrados: cuando los datos residen en muchas aplicaciones separados por los distintos entornos operacionales, la descodificación de los datos es a menudo inconsistente. Por ejemplo, en una aplicación, la palabra gender podría codificarse como "m" y "f" enotra como "0" y "1". Cuando los datos fluyen de un entorno operacional a un entorno de almacén de datos o de data warehouse, ellos asumen una codificación consistente, por ejemplo gender siempre se transformaría a "m" y "f".
3.variación-temporal: el almacén de datos contiene un lugar para guardar datos con una antigüedad de 5 a diez años, o incluso más antiguos, para poder ser usados encomparaciones, tendencias y previsiones. Estos datos no se modificarán.
4. no son inestables: los datos no serán modificados o cambiados de ninguna manera una vez ellos han sido introducidos en el almacén de datos, solamente podrán ser cargados, leídos y/o accedidos.          
En 1993, Susan Osterfeldt [MicroSt96] publica una definición que sin duda acierta en la clave del DW: “Yo considero al DW como algoque provee dos beneficios empresariales reales: Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico”.            
  
Data Warehouse
Es el sistema para el almacenamiento y distribución de cantidades masivas de datos. El Data Warehouse analítico resultante puede ser aplicado para...
tracking img