Mineria De Datos
(Universidad del Perú, Decana de América)
Facultad de Ingeniería Electrónica y Eléctrica Unidad De Post Grado
Minería de datos
Minería de datos
Proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos Encontrar modelos inteligibles a partir de los datos Laminería de datos tiene como objetivo analizar los datos para extraer conocimiento
Minería de datos
El proceso de MD debe ser automático o semiautomático(asistido) y el uso de los patrones descubiertos debe ayudar a tomar decisiones mas seguras que reporten, por tanto algún beneficio a la organización
En forma sencilla se puede decir que el objetivo de la MD es convertir datos eninformación
Proceso de KDD
Extracción o descubrimiento de conocimiento (Knowledge Discovery in Databases)
Definición :
Proceso no trivial de identificar patrones validos, novedosos, potencialmente útiles y, en ultima instancia, comprensibles a partir de los datos Características de conocimiento extraído • • • • Validos Novedoso Potencialmente Útil Comprensible
Augusto Cortez Vásquez
4Sistema de información
Preparación de los datos
Minería de datos
Patrones
Proceso de KDD
Evaluación / interpretación / visualizacion
Conocimiento Augusto Cortez Vásquez 5
Como se extrae el conocimiento
A partir de datos se genera conocimiento que puede ser presentado de forma: Relaciones Patrones Reglas inferidas de los datos (previamente)desconocidos Descripción concisa(resumen)
Modelos
Los modelos pueden ser de dos tipo
Modelos predictivos Pueden estimar valores futuros o desconocidos de variables de interés, que denominamos variables objetivo o dependientes, usando otras variables o campos de las bases de datos Ejemplos Clasificación y regresión Modelos descriptivos: identifican patrones que explican o resumen los datos , es decir sirven para explorar laspropiedades de los datos examinados Ejemplos : Agrupamiento
Proceso de KDD
Validos : los patrones deben seguir siendo precisos para datos nuevos Novedoso : debe aportar algo desconocido Potencialmente Útil: la información debe conducir a acciones que reporten algún tipo de beneficio para el usuario Comprensible: debe posibilitar la interpretación, revisión, validación y uso en la toma dedecisiones
Augusto Cortez Vásquez
8
Minería de datos
.
Augusto Cortez Vásquez
9
•
Base de datos: Puede ser de tipo base de datos normal, data warehouse, hoja de cálculo u
otra clasede repositorio. A estos datos se le aplican técnicas de limpieza e integración.
•
Servidor de bases de datos : Utilizado para obtener la información relevante según el
proceso de minería dedatos Base de conocimiento: Conocimiento del dominio para guiar la búsqueda y evaluar los patrones. Se tienen en cuenta las creencias de los datos. Los umbrales de evaluación y el conocimiento previo.
•
Algoritmo de minería de datos: Modular para realizar distintos tipos de análisis:
Caracterización, Asociación, Clasificación, Análisis de grupos, Evolución (en espacio o tiempo) y Análisis dedesviaciones.
•
Módulo de evaluación: Mide que tan interesante es un patrón. Interactúa con el algoritmo de
Minería de Datos para guiar la búsqueda hacia patrones interesantes.
•
Interfaz gráfica: Interacción con el usuario. Elección de la tarea de minería de datos. Provee
información para enfocar la búsqueda. Ayuda a evaluar los patrones. Explora los patrones encontrados y la base dedatos original. Visualiza los patrones en distintas formas.
Augusto Cortez Vásquez
10
Datawarehouse
• Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La creación de un datawarehouse...
Regístrate para leer el documento completo.