Mineria de datos relacional

Solo disponible en BuenasTareas
  • Páginas : 4 (768 palabras )
  • Descarga(s) : 0
  • Publicado : 1 de marzo de 2012
Leer documento completo
Vista previa del texto
4 Minado de datos relacionales
Data Mining es la extracción de información oculta y predecible de grandes bases de datos, es una poderosa tecnología nueva con gran potencial para ayudar a lascompañías a concentrarse en la información más importante de sus Bases de Información (Data Warehouse). Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en losnegocios tomar decisiones proactivas y conducidas por un conocimiento acabado de la información (knowledge-driven). Los análisis prospectivos automatizados ofrecidos por un producto así van más allá de loseventos pasados provistos por herramientas retrospectivas típicas de sistemas de soporte de decisión. Las herramientas de Data Mining pueden responder a preguntas de negocios que tradicionalmenteconsumen demasiado tiempo para poder ser resueltas y a los cuales los usuarios de esta información casi no están dispuestos a aceptar. Estas herramientas exploran las bases de datos en busca de patronesocultos, encontrando información predecible que un experto no puede llegar a encontrar porque se encuentra fuera de sus expectativas.
4.1-Preprocesamiento
El pre procesamiento de datos tiene comotransformar los datos y la información que contiene el conjunto de datos de tal manera que pueda ser expuesta o ser manejada de una forma fácil. El pre procesamiento comprende las siguientes etapas:1. Limpieza y selección de datos: Se deben eliminar el mayor número de datos erróneos e inconsistentes (limpieza) o inconsistentes(criba)
2. Transformación de los datos: Los datos sontransformados o consolidados de forma apropiada para la extracción de información.
3. Reducción de datos: Selecciona datos relevantes para la tarea de la minería de datos/extracción de información y seeliminan los datos no importantes.
4. Selección de Instancias: La selección de instancias nos permite obtener conjuntos de reglas más interpretables y con aporte de mayor información.
5....
tracking img