Mineria de datos
MINERÍA DE DATOS
MINERÍA DE DATOS
DEFINICIÓN
• Proceso de extraer conocimiento útil y
comprensible, previamente desconocido,
desde grandes
cantidades
de datos
MINERÍA DE
DATOS
almacenados en distintos formatos [Witten &
Frank 2000].
• Proceso para encontrar información nueva,
valiosa y no trivial en grandes volúmenes de
datos [Mehmed Kantardzic].
MINERÍA DE DATOS
DEFINICIÓN
• Enotras palabras, la Minería de Datos permite
extraer conocimiento
útilDATOS
y desconocido que
MINERÍA DE
se encuentra oculto en los datos.
MINERÍA DE DATOS
ANÁLISIS DE DATOS
1. Uso de consultas SQL sobre una base de
datos OLTP. Genera información resumida
(informes)de
una DEmanera
MINERÍA
DATOS previamente
establecida, poco flexible y poco escalable a
grandes volúmenes de datos.
2. Uso de OLAPsobre almacenes de datos,
permitiendo el resumen, la consolidación o la
agregación, así como la posibilidad de ver la
información desde distintas perspectivas.
MINERÍA DE DATOS
ANÁLISIS DE DATOS
3. Uso de Minería de datos que genera reglas,
patrones, pautas, árboles de decisión, redes
neuronales,
entreDE DATOS
otros,
que
son
MINERÍA
conocimiento y que puede ser aplicado a
otros datos.
MINERÍA DEDATOS
ANÁLISIS DE DATOS
Los datos por sí solos tienen un valor relativo. Lo
que de verdad
es interesante
es el conocimiento
MINERÍA
DE DATOS
que puede inferirse a partir de los datos y, más
aún, la capacidad de poder usar este
conocimiento.
MINERÍA DE DATOS
ANÁLISIS DE DATOS
Ejemplo:
Se puede saber estadísticamente que el 10% de
los ancianos padecen
MINERÍAAlzhaimer.
DE DATOS Sin embargo es
másútil tener un conjunto de reglas que a partir
de los antecedentes, los hábitos y otras
características del individuo nos digan si un
paciente tendrá o no Alzheimer.
MINERÍA DE DATOS
LA ESTADÍSTICA
La estadística es una disciplina que proporciona
muchos de los conceptos, algoritmos y técnicas
que son baseMINERÍA
en la Minería
de Datos, como por
DE DATOS
ejemplo: la media, la varianza, lasdistribuciones,
el análisis univariante y multivariante, la
regresión lineal y no lineal, la teoría del
muestreo, la validación cruzada, la modelización
paramétrica y no paramétrica, las técnicas
bayesianas, etc..
MINERÍA DE DATOS
DIFERENCIA CON LA ESTADÍSTICA
• La estadística generalmente analiza muestras
de datos para
luego hacer
inferencia a toda la
MINERÍA
DE DATOS
población, mientras que la mineríade datos
pretende buscar información útil usando toda
la base datos.
MINERÍA DE DATOS
RELACIÓN CON OTRAS DISCIPLINAS
Bases de datos
Recuperación de
información
Visualización
MINERÍA DE DATOS
Sistemas de toma
de decisiones
Minería
de
Datos
Estadística
Computación
paralela
Otras
Aprendizaje
automático
MINERÍA DE DATOS
TIPOS DE DATOS
El Aprendizaje Automático es un área de la
InteligenciaArtificial que se ocupa de desarrollar
algoritmos capaces
MINERÍAdeDEaprender,
DATOS y constituye
junto con la Estadística, el corazón del análisis
inteligente de datos.
El aprendizaje puede ser supervisado (la
máquina aprende un modelo a partir de
ejemplos y lo usa para resolver el problema) y
no supervisado.
MINERÍA DE DATOS
TIPOS DE DATOS
La minería de datos puede aplicarse a diferentes
tiposde datos:
MINERÍA DE DATOS
• Datos estructurados (provenientes de bases
de datos relacionales, espaciales, temporales,
textuales y multimedia)
• Datos no estructurados (provenientes de la
Web o de repositorios de documentos)
MINERÍA DE DATOS
TIPOS DE MODELOS O PATRONES
• La minería de datos tiene como objetivo
analizar los datos para extraer conocimiento.
• Este conocimiento
ser en forma deMINERÍA puede
DE DATOS
relaciones, patrones o reglas inferidos de los
datos, (previamente) desconocidos, o bien en
forma de una descripción más concisa
(resumen).
• Estas relaciones o resúmenes constituyen el
modelo de los datos analizados.
MINERÍA DE DATOS
TIPOS DE MODELOS O PATRONES
• Existen muchas formas diferentes de
representar los modelos y cada una de ellas
determina el
tipo de DE...
Regístrate para leer el documento completo.