Mineriadatosv5 100706184113 Phpapp01
Minería de Datos
Integrantes del Equipo:
Cerón Reyes María de los Ángeles
Gómez Díaz Haydeé
Junio 2010
Introducción
Día a día generamos información y esto nos lleva a tener
una gran cantidad de esta, lo cual implica que el generar
información, nos puede ayudar a controlar, optimizar,
administrar, examinar, investigar, planificar, predecir,
someter, negociar o tomar decisionesde cualquier
ámbito según el dominio en que nos desarrollemos.
¿Qué es Minería de Datos?
- La extracción no trivial de información implícita,
previamente desconocida y potencialmente útil, a
partir de datos. (1)
- La integración de un conjunto de áreas que tienen
como propósito la identificación de un
conocimiento obtenido a partir de las bases de
datos que aporten un sesgo hacia la toma dedecisión(2)
Proceso de Minería de Datos
Los pasos a seguir para la realización de un proyecto de minería de
datos son:
1. La Determinación de los Objetivos. Trata sobre la delimitación de
los objetivos que el cliente desea
2. Pre procesamiento de los Datos. Se refiere a la selección, la
limpieza, el enriquecimiento, la reducción y transformación de las
bases de datos.
Proceso de Minería deDatos
3.
Determinación del Modelo. Se comienza realizando unos análisis
estadísticos de los datos y después se lleva a cabo una visualización
gráfica de los mismos para tener una primera aproximación. Según
los objetivos planteados y la tarea que debe llevarse a cabo son los
algoritmos a utilizarse.
4.
Análisis de los Resultados. Verifica si los resultados obtenidos son
coherentes con losobtenidos por el análisis y la visualización gráfica.
Y el cliente determina si le aporta nuevos conocimientos que le
permita la toma de decisiones.
Principales Características de MD
•Explorar los datos que se encuentran en las profundidades de
las bases de datos, o almacenes de datos, que algunas veces
contienen información almacenada durante varios años.
• El entorno de la minería de datos sueletener una arquitectura
cliente-servidor.
• Las herramientas de la minería de datos ayudan a extraer el
mineral de la información enterrado en archivos corporativos o
en registros públicos archivados.
• Las herramientas de la minería de datos se combinan
fácilmente y pueden analizarse y procesarse rápidamente.
• La minería de datos produce cinco tipos de información:
— Asociaciones.
— Secuencias.
—Clasificaciones.
— Agrupamientos.
— Pronósticos.
Aplicaciones de Minería de Datos
¿Qué es el proceso de KDD?
Extracción de Conocimiento en Bases de Datos
- Es la extracción automatizada de conocimiento o patrones
interesantes,
no
triviales,
implícitos,
previamente
desconocidos, potencialmente útiles y predictivos de la
información de grandes Bases de Datos.(3)
- El proceso de KDD consiste enusar métodos de minería de
datos(algoritmos) para extraer (identificar) lo que se
considera como conocimiento de acuerdo a la especificación
de ciertos parámetros usando una base de datos junto con
preprocesamientos y post-procesamientos.
Fases del KDD
Fases del KDD
•Determinar las fuentes de información.
•Diseñar el esquema de un almacén de datos (Data
Warehouse): que consiga unificar demanera operativa toda la
información recogida.
•Implantación del almacén de datos: que permita la navegación
y visualización previa de sus datos, para decidir qué aspectos
puede interesar que sean estudiados.
• Selección, limpieza y transformación de los datos que se van
a analizar: la selección incluye tanto una división o fusión
horizontal (filas) como vertical (atributos).La limpieza yprepocesamiento de datos se logra diseñando una estrategia
adecuada para manejar errores, valores incompletos,
secuencias de tiempo, etc.
•Seleccionar y aplicar el método de minería de datos apropiado:
esto incluye la selección de la tarea de descubrimiento a
realizar, por ejemplo, clasificación, agrupamiento o clustering,
regresión, etc. La transformación de los datos al formato
requerido por el algoritmo...
Regístrate para leer el documento completo.