Etapas De Mineria De Datos

Páginas: 6 (1485 palabras) Publicado: 10 de febrero de 2013
Etapas de la Minería
de Datos

Minería de Datos
Víctor Hugo Lozano Carrillo
24/01/2012

Se puede considerar que la MD tiene varias etapas, cada una con sus actividades
propias.

Fase 1: Extracción, Transformación y Limpieza de Datos.
El objetivo de esta fase es el de leer las bases de datos disponibles y generar lo que
se llamará una vista minable. La primera actividad a realizar esla extracción. Se sabe
que el objetivo de la MD es el descubrimiento de conocimiento a partir de una Base de
Datos. Para ello se debe leer primero la información conveniente a partir de las BD
disponibles. Las BD pueden ser de cualquier tipo. Una vez se han extraído los datos,
se realiza un proceso de integración de valores de las diferentes tablas y de las
diferentes bases de datos. Estorequiere un proceso de transformación inicial, en el
cual los datos de cada columna deben estar en un formato común. Esto constituye lo
que se llama un Almacén de Datos (Data WareHouse). En general, los datos en un
Almacén de Datos serán de alguno de los siguientes tipos:

1. Datos tipo Real, esto es, representan valores de tipo continuo.
2. Datos de tipo Entero, representando valores de tipodiscreto
3. Datos de tipo Nominal o Categórico, representando valores que se identifican por
un nombre llamado etiqueta. El tipo de dato es importante en el momento de realizar la
preparación de los datos. El paso siguiente en esta fase consiste en la selección de los
atributos de interés para el problema. En esta selección realmente lo que se hace es
eliminar los atributos (columnas de labase de datos o variables) que no afectan el
valor de la variable que se desea predecir. Una vez se conocen los atributos que
posiblemente permiten predecir la variable, se realiza el proceso de limpieza de los
datos. En este proceso se examinan los datos que se disponen buscando:
a. Valores faltantes (missing values), esto es, valores que aparecen como nulos
en la base de datos o simplemente notienen ningún valor ingresado, sea por
error o porque en el momento de llenar la base de datos se desconocía este
valor.
b. Valores duplicados (duplicate values), ya que como los datos se pueden
tomar a partir de la integración de diferentes bases de datos, es posible que
aparezca la misma entrada más de una vez. Ocasionalmente este problema
puede ser difícil de detectar, ya que las tablasoriginales pueden tener
diferentes índices, lo que hace que al integrar los datos no sea fácil observarla
duplicidad.
c. Valores inconsistentes, esto es, valores fuera de los rangos posibles, con
tipo de datos equivocado o que son contradictorios con otra información que
posee la BD. Decidir qué se hace con las entradas que tienen valores faltantes
o inconsistentes no es una cuestióntrivial, para lo cual los investigadores han
tomado diferentes aproximaciones, cada una con sus ventajas y desventajas.
Por ejemplo: Eliminar los valores faltantes o inconsistentes. Esta aproximación

tiene problemas cuando se dispone de poca cantidad de datos para un
determinado problema. Reemplazar el valor faltante o inconsistente por el valor
medio de los datos. Si un valor se excedenuméricamente del valor máximo
usual, se reemplaza por el valor máximo (recorte).

Fase 2: Obtención del Modelo.
Es la fase central del proceso de minería de datos. Un modelo es una expresión o un
programa que permite expresar relaciones, proposiciones sustantivas de hechos,
variables, parámetros, entidades y relaciones entre variables y/o entidades u
operaciones, con el fin de estudiar, comprender osimular el comportamiento de
sistemas complejos. Los modelos pueden ser de diferente tipo:
1. Modelos Predictivos. Son modelos cuyo objetivo es la determinación de valores
desconocidos o futuros de las variables objetivo, a partir de las variables
predictivas. Dentro de los modelos predictivos se encuentran:


Modelos de Clasificación. En los modelos de clasificación se considera que...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • etapas de la mineria
  • Mineria de datos
  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS