Conceptos básicos de minería de datos

Solo disponible en BuenasTareas
  • Páginas : 10 (2321 palabras )
  • Descarga(s) : 0
  • Publicado : 1 de marzo de 2012
Leer documento completo
Vista previa del texto
EIA-434-Optativo Minería de Datos I
Dr. Oldemar Rodríguez R. Escuela de Informática Universidad Nacional

Conceptos Básicos y Herramientas OLAP

Introducción ¿Qué es Minería de Datos?
– Extracción de información o de patrones (no trivial, implícita, previamente desconocida y potencialmente útil) de grandes bases de datos.

Introducción ¿Qué es Minería de Datos?
– Es analizar datospara encontrar patrones ocultos usando medios automatizados.

Introducción ¿Qué es Minería de Datos?
– La Minería de Datos es un proceso no elemental de búsqueda de relaciones, correlaciones, dependencias, asociaciones, modelos, estructuras, tendencias, clases (clusters), segmentos, los cuales que se obtienen de grandes juegos de datos, los cuales generalmente están almacenados en bases de datos(relacionales o no). Esta búsqueda se lleva a cabo utilizando métodos matemáticos, estadísticos o algorítmicos.



Introducción ¿Qué es Minería de Datos?
– Se considera la Minería de Datos como un el proceso, lo más automatizado posible, qué va de los datos elementales disponibles en una Bodega de Datos a la decisión. El objetivo principal de la Minería de Datos es crear un procesoautomatizado que toma como punto de partida los datos y cuya meta es la ayuda a la toma de decisiones.



Introducción
Minería de Datos versus KDD (Knowledge Discovery in Databases) – Usualmente ambos términos son intercambiables. KDD (Knowledge Discovery in Databases): Es el proceso de encontrar información y/o patrones útiles en los datos. Minería de Datos: es el uso de algoritmos para extraerinformación y/o patrones derivados del proceso KDD.

Minería de Datos: A KDD Process
• La Minería de Datos: Es el centro del proceso de descubrimiento del conocimiento (KDD Process = Knowledge Discovery in Data Bases Process).

Introducción
Minería de Datos versus Estadística
La estadística generalmente analiza muestras de datos para luego hacer inferencia a toda la población, mientras quela minería de datos pretende buscar información útil usando toda la base datos. La estadística en la mayoría de los casos supone que los datos se comportan de acuerdo a ciertas distribuciones de probabilidad (normal, binomial, geométrica, Poisson, etc), mientras que la minería de datos usa técnicas mucho más exploratorias que vienen de la IA, o del “Analyse des Données”.

Introducción
Mineríade Datos versus Análisis de Datos
Con el advenimiento de las computadoras, aproximadamente en 1960, un nuevo concepto surgió del “matrimonio” entre la informática y la estadística: El Análisis de Datos (conocido en como: Analyse des Données - Exploratory Data Analysis). Esta nueva manera de analizar los datos con un objetivo decisional usa mucho más la informática y los métodos analíticos (elanálisis de factorial, la clasificación automática, la discriminación, etc.) que los métodos estadísticos clásicos, las pruebas de hipótesis, que parten de supuestos matemáticos muy difíciles de verificar en la práctica. (Ej. no se supone que los datos siguen cierta distribución de probabilidad – los datos se muestran por si mismos). A diferencia de la minería de datos, el análisis de datos usualmenteno es automatizado, ni trata con volúmenes de datos tan grandes.

Introducción
Minería de Datos versus Bodegas de Datos
Una Bodega de Datos es un almacén de datos de una compañía que contiene algunos datos operacionales, datos agregados (sumarizaciones), datos del históricos, datos evolutivos y posiblemente aquellos datos externos a la compañía pero que tienen una posible relación con lasactividades de esta. Estos datos se depositan en una o más bases de datos relacionales y son accesibles a todas las aplicaciones orientadas a la toma de decisiones. Evidentemente bodegas de datos y minería de datos son cosas muy diferentes. Una bodega de datos es usualmente apenas el punto de partida de la minería de datos. Podría decirse que ambos, las bodegas de datos y la minería de datos son...
tracking img