INGENIERO
Integrantes :
Solange Bunster Berríos
Susana Donoso Jorquera
Keber Flores Bustos
Asignatura : Complejidad de Algoritmos
Profesor
: Mladen Nanidic
Fecha
: 03/07/2007
Introducción
La revolución digital ha permitido que la captura de
datos sea fácil, y su almacenamiento tenga un costo
casi nulo.
Enormes cantidades de datos son recogidas yalmacenadas en BD en la vida diaria.
Resultado: Para analizar estas enormes cantidades de
datos, las herramientas tradicionales de gestión de datos
y las herramientas estadísticas no son adecuadas.
Introducción
Los
datos por sí solos no producen beneficio
directo. Su verdadero valor consiste en poder
extraer información útil para la toma de
decisiones.
Tradicionalmente
seanalizaban datos con la
ayuda de técnicas estadísticas (resumiendo y
generando informes) o validando modelos
sugeridos manualmente por los expertos.
Introducción
Estos
procesos son irrealizables a medida
que aumenta el tamaño de los datos.
Bases
de datos con un nº de registros del
orden de 109 y 103 de dimensión, son
fenómenos relativamente comunes.
La
tecnologíainformática puede automatizar
este proceso. Minería de datos
¿Qué es la Minería de Datos?
Es
un mecanismo de explotación que
consiste en la búsqueda de información
valiosa en grandes volúmenes de datos.
Ligada
a las bodegas de datos (información
histórica) con la cual los algoritmos de
minería de datos obtienen información
necesaria para la toma de decisiones.
¿Qué es laMinería de Datos?
La minería de datos se puede dividir en:
Minería
de datos predictiva (mdp): usa
primordialmente técnicas estadísticas.
Minería
de datos para descubrimiento de
conocimiento (mddc): usa principalmente
técnicas de inteligencia artificial.
¿Qué es la Minería de Datos?
Definiciones necesarias:
Datos: hechos o medidas que describen características deobjetos,
eventos o personas, es la materia prima de la que se obtendrá la
información.
Información: Datos analizados y presentados en forma adecuada,
de interés para un observador en un momento determinado.
Conocimiento: información procesada para emitir juicios que
llevan a conclusiones.
Meta Conocimiento: Reglas que permiten obtener conocimiento.
¿Qué es laMinería de Datos?
Una definición de Minería de datos es:
“Un proceso no trivial de identificación válida, novedosa,
potencialmente útil y entendible de obtención de patrones de
los datos”
Un proceso más general es KDD (Knowledge Discovery on
Databases/ Descubrimiento de conocimiento en Bases de
Datos).
KDD es empleado para describir el proceso de extracción de
conocimientode los datos.
Definición: “La extracción no-trivial de conocimiento implícito
en los datos que resulte ser previamente desconocido y
potencialmente útil”.
El conocimiento debe ser nuevo, no obvio y debe estar
disponible para el uso.
¿Qué es la Minería de Datos?
La
minería de datos tiene como propósito la
identificación de un conocimiento obtenido a
partir de las bases dedatos que aporten
hacia la toma de decisión.
Principales etapas en el
proceso de Minería de Datos
Los
pasos a seguir para la realización de un
proyecto de minería de datos son siempre los
mismos, independientemente de la técnica
específica de extracción de conocimiento
usada.
El proceso parece secuencial con desarrollo
lineal, pero en la práctica, en cualquier etapa
sedetiene y vuelve atrás.
Filtro de Datos
El formato de los datos contenidos en la fuente de
datos (base de datos, Data Warehouse) nunca es el
idóneo, y la mayoría de las veces no es posible ni
siquiera utilizar ningún algoritmo de minería sobre
los datos "en bruto".
Mediante el preprocesado, se filtran los datos (de
forma que se eliminan valores incorrectos, no
válidos, desconocidos),...
Regístrate para leer el documento completo.