Data mining

Solo disponible en BuenasTareas
  • Páginas : 7 (1710 palabras )
  • Descarga(s) : 0
  • Publicado : 28 de febrero de 2011
Leer documento completo
Vista previa del texto
Data Mining “Confesando a los datos”
Hace 50 años se podía ser competitivo si se producía en masa, si se tenía la última tecnología, mano de obra barata, entre otras cosas, pero ahora con el desarrollo de sistemas digitales, redes de comunicación, procesos industriales y el uso y transferencia de información, el mundo se ha revolucionado completamente pero lo que más ha cambiado el modo decompetir entre las empresas así como la creación de estrategias competitivas y la gran diferencia entre las empresas es el conocimiento.
Pero ahora hay que preguntarnos ¿de dónde surge dicho conocimiento? Como sabemos cualquier conocimiento surge de una investigación o un análisis. En dicho análisis se produjo información pero para que se llegara a obtener información primero se tuvo que recopilaruna serie de datos que simplemente existen y carecen de un significado útil o no. La información surge de dar un significado a dicho conjunto de datos recopilados, en donde ya se tiene una esencia y próposito y es en este punto donde entra el Data Mining o Minería de Datos.
La Minería de Datos o Data Mining se considera una etapa de un proceso llamado extracción de conocimiento en bases de datos.Algunos libros definen Data Mining como un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos.
Y desde un punto empresarial se define como la integración de un conjunto de áreas que tienen como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten unsesgo hacia la toma de decisiones. Si analizamos las dos definiciones, las dos se pueden resumir como un proceso de extracción de conocimiento comprensible, útil y con la característica de ser transferible.
El término de data mining no es nuevo, ya que desde hace varios años se usaban términos como data fishing, con la idea de encontrar un patrón sin una hipótesis previa en bases de datos.Actualmente se suele hablar y usar indistintamente los términos Data Mining y Knowledge Discovery from Data (KDD) a pesar de que si existe una diferencia entre ellos y la diferencia es que Data Mining es la etapa de descubrimiento en el proceso KDD, es un paso consistente en el uso de algoritmos concretos que generan una enumeración de patrones a partir de datos procesados.
Pero ahora viene unapregunta crucial y que es de mucha importancia y que puede afectar la toma de decisiones, dicha pregunta es ¿qué datos debemos usar y cómo debo usarlos?
Existen tres factores que influyen en la elección de datos:
* La frecuencia con la que se generan los datos.
* Qué influencia tiene esta frecuencia en las decisiones a tomar.
* Qué cantidad de datos estamos recogiendo, lo que condicionalos sistemas de análisis, potencia y por tanto el Data Mining.
Las técnicas de Data Mining son resultado de un largo procesos de investigación y desarrollo de productos. Dicho proceso se origino cuando los datos de las empresas y negocios fueron almacenados por primera vez en computadoras y continúo con mejoras en el acceso a dichos datos y después con métodos generados para permitir a losusuarios navegar a través de dichos datos.
Dentro de las características y objetivos de Data Mining se encuentran:
* Explorar datos que se encuentran abandonados en las bases de datos y que algunas veces dichas bases contienen información almacenada durante varios años.
* El Data Mining produce cinco tipos de información:
* Asociaciones
* Secuencias
* Clasificaciones* Agrupamientos
* Pronósticos
* El Data Mining es un proceso que invierte la dinámica del método científico en el siguiente sentido: en el método científico primero se formula la hipótesis y luego se diseña el experimento para generar datos que confirmen o contradigan la hipótesis, si esto se hace correctamente se obtiene un nuevo conocimiento. En el Data Mining se recogen datos y...
tracking img