Data Minning

Páginas: 5 (1174 palabras) Publicado: 26 de enero de 2013
Ingeniería de Sistemas Computacionales |
Data Mining
|
Base de Datos I |

5 de noviembre de 2012


Introducción:

Minería de datos es una poderosa tecnología con un gran potencial para ayudar a las empresas a enfocarse a la información y datos más importantes; que coleccionan sobre el comportamiento y potencial de sus clientes.
La minería de datos (Data Mining) consiste en laextracción no trivial de información que reside de manera implícita en los datos. Dicha información es previamente desconocida y se espera que resulte útil para algún proceso. En resumen, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.
Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción deconocimiento procesable, implícito en las bases de datos.

Definición:
La minería de datos o descubrimiento de conocimiento, es el proceso de ayuda de computadora de la excavación y el análisis a través de los conjuntos enormes de datos y luego extraer el significado de los datos. Herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo a las empresas a hacer proactivas,impulsadas por los conocimientos decisiones. Herramientas de minería de datos pueden responder a preguntas de negocios que tradicionalmente eran demasiado tiempo para resolver. Ellos recorren las bases de datos de patrones ocultos, encontrando información predecible que los expertos pueden pasar por alto ya que se encuentra fuera de sus expectativas.
La minería de datos se deriva su nombre de lassimilitudes entre buscar valiosa información en una gran base de datos o extracción minera de una montaña por una veta de mineral valioso. Ambos procesos requieren ya sea tamizado a través de una inmensa cantidad de material, o de forma inteligente sondeo para encontrar que el valor reside.

Ciclo de un Proyecto de Minería de Datos

PASO 1. RECOLECCIÓN DE DATOS

* El primer paso en unproyecto de minería de datos es la recolección de datos. Los datos de una organización habitualmente están almacenados en muchos sitios: base de datos de un ERP, de un CRM, hojas de cálculo de los comerciales y/o de los contables, una pequeña aplicación para controlar el stock en el almacén, etc. Por este motivo, la primera tarea que debemos emprender es determinar cuáles son los datos más relevantesy almacenarlos de modo adecuado en un almacén de datos o datawarehouse

PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS
* Este es el paso más importante en un proyecto de minería de datos. La depuración y transformación de los datos tiene como objetivo eliminar el ruido y la información irrelevante. El proceso de transformación consiste en modificar los datos originales en diferentesformatos en términos de tipos de datos y valores

PASO 3. GENEAR EL MODELO DE MINERIA DE DATOS.

* Una vez que hemos limpiado y transformado los datos, podemos comenzar la tarea de crear los modelos de minería de datos. Antes de generar cualquier tipo de modelo, es fundamental entender cuál es la meta del proyecto de minería de datos. ¿Vamos a crear un proyecto para clasificar, para generar unaasociación, para establecer una segmentación, o para pronosticar y planificar las ventas del próximo año?
El modelo es el corazón de cualquier proyecto de minería de datos. No obstante, una vez que uno tiene claro cuál es el objetivo del proyecto, seleccionar el algoritmo que genere el modelo es una tarea relativamente sencilla

PASO 4. EVALUACIÓN DEL MODELO

* Existen unas pocasherramientas para evaluar la calidad de un modelo de minería de datos. La más conocida es el gráfico de rendimiento Esta herramienta utiliza los datos de un modelo entrenado para predecir los valores de una conjunto de datos de evaluación.
* No sólo se evalúa la precisión del modelo sino que se trata de comprender el significado de los patrones de comportamiento que los algoritmos han generado.
En...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data Minning The Insurance Company (Tic) 2000
  • Ebel Minning
  • Minning analisismexico vs chile
  • Datos
  • Datos
  • Datos
  • Datos
  • Datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS