Data Mining

Páginas: 9 (2223 palabras) Publicado: 22 de mayo de 2013

Prefacio

Antes que nada:
Debemos hacer una distinción entre los conceptos datos, información y conocimiento.
Para esto cabe hacerse la pregunta:
¿Qué diferencia existe entre el conocimiento, los datos y la información?

Datos:
Es un conjunto discreto de valores que por sí solos no son relevantes como apoyo para la toma de decisiones.
Los mismos son abundantes y se pueden ver comola materia prima para la generación de información.
Por ejemplo un número telefónico o un nombre son datos que sin un propósito o un contexto no sirven como base para apoyar la toma de una decisión.
Por lo general los datos poseen un alto volumen pero un escaso valor por si solos.

Información:
Se puede definir información como un conjunto de datos procesados a partir de un criterio dado.
Elcriterio de procesamiento es lo que le da un contexto a la información entendiéndose por contexto al propósito a partir del cual se genera dicha información.
El propósito es lo que le otorga a la información una especial utilidad para quién debe tomar decisiones.
Un ejemplo de información podrían ser los listados o reportes que agrupan y resumen datos por un criterio dado (Sumariado, promedio,máximos, mínimos, etc.).

En síntesis → Información = Datos + Contexto + Utilidad

Conocimiento:
En forma sucinta se puede definir como conocimiento al resultado de elaboran un modelo a partir de la interpretación de la información.
Del mismo modo que la información se deriva de los datos, el conocimiento se deriva de la información.
Para que la información se convierta en conocimiento esnecesario realizar acciones como:
Comparación con otros elementos.
Predicción de consecuencias.
Búsqueda de conexiones.
Conversación con otros portadores de conocimiento.
Por último podemos mencionar que a diferencia de los datos, el conocimiento es de bajo volumen pero posee un alto valor en sí mismo.







Esto último se puede visualizar mejor en el siguiente gráfico:¿Qué es Data Mining?

Se puede definir Data Mining como un conjunto de técnicas automáticas o más generalmente semiautomáticas orientadas a encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto (información).

Este conjunto de técnicas provee una metodología sistemática para la exploración de información.
Tarea que en líneasgenerales demandaría demasiado tiempo, aun para un analista experto; si se realiza en forma completamente manual.

Las herramientas de Data Mining exploran una o varias Bases de Datos en busca de patrones ocultos, permitiendo a partir de éstos predecir las futuras tendencias y comportamientos de información nueva.

Como es de esperar, los patrones descubiertos deben ser significativos en elsentido que conduzcan a alguna ventaja, la cual generalmente es económica.


Fase estándar en el proceso de Data Mining

A pesar de que cada proyecto de Data Mining sea radicalmente distinto a los demás, existe un procedimiento común a todos los proyectos que divide al mismo en cuatro etapas:

1. Determinación de los objetivos: En esta fase se delimitan los objetivos que el cliente persiguebajo la supervisión y orientación del especialista en data mining. En algunas situaciones, existen objetivos determinados desde el comienzo y esto permite conocer previamente que puede ser importante descubrir y establecer límites al problema. Los casos donde la investigación es más generalizada, y sin objetivos específicos desde el inicio, no constituyen un inconveniente, sino, todo lo contrario,porque Data Mining es un proceso iterativo donde la búsqueda se hace cada vez más refinada. Estos tipos de pruebas se conocen como Análisis Exploratorios, en los cuales se espera simplemente hallar un resultado interesante y es donde se refleja la mayor utilidad de Data Mining. Para estos casos, existen guías propuestas que ayudan a enfocar el objetivo del problema, siendo generalmente, una...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data Mining
  • Data Mining
  • data mining
  • Data mining
  • Data Mining
  • DATA MINING
  • Data Mining
  • Data Mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS