Análisis de datos

Solo disponible en BuenasTareas
  • Páginas : 23 (5623 palabras )
  • Descarga(s) : 0
  • Publicado : 16 de septiembre de 2010
Leer documento completo
Vista previa del texto
Data mining: torturando a los datos hasta que confiesen http://www.uoc.edu/molina1102/esp/art/molina1102/molina1102.html

Data mining: torturando a los datos hasta que confiesen
[*]

Luis Carlos Molina Félix
Coordinador del programa de Data mining (UOC) lmolinaf@uoc.edu

Resumen: El título de este artículo es una explicación informal de la actividad que realiza una tecnología denominadadata mining (minería de datos). Lo que se pretende con esta tecnología es descubrir conocimiento oculto a partir de grandes volúmenes de datos. Desde la década pasada, debido a los grandes avances computacionales, se ha ido incorporando a las organizaciones para constituirse en un apoyo esencial al momento de tomar decisiones. Organizaciones tales como empresas, clubes profesionales deportivos,universidades y gobiernos, entre otros, hacen uso de esta tecnología como ayuda en la toma de sus decisiones. Algunos de estos ejemplos serán citados en el presente trabajo.

1. Introducción Cada día generamos una gran cantidad de información, algunas veces conscientes de que lo hacemos y otras veces inconscientes de ello porque lo desconocemos. Nos damos cuenta de que generamos información cuandoregistramos nuestra entrada en el trabajo, cuando entramos en un servidor para ver nuestro correo, cuando pagamos con una tarjeta de crédito o cuando reservamos un billete de avión. Otras veces no nos damos cuenta de que generamos información, como cuando conducimos por una vía donde están contabilizando el número de automóviles que pasan por minuto, cuando se sigue nuestra navegación por Interneto cuando nos sacan una fotografía del rostro al haber pasado cerca de una oficina gubernamental. ¿Con qué finalidad queremos generar información? Son muchos los motivos que nos llevan a generar información, ya que nos pueden ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier ámbito según el dominio en que nosdesarrollemos. La información por sí misma está considerada un bien patrimonial. De esta forma, si una empresa tiene una pérdida total o parcial de información provoca bastantes perjuicios. Es evidente que la información debe ser protegida, pero también explotada. ¿Qué nos ha permitido poder generar tanta información? En los últimos años, debido al desarrollo tecnológico a niveles exponencialestanto en el área de cómputo como en la de transmisión de datos, ha sido posible que se gestionen de una mejor manera el manejo y almacenamiento de la información. Sin duda existen cuatro factores importantes que nos han llevado a este suceso: 1. El abaratamiento de los sistemas de almacenamiento tanto temporal como permanente.
* Las transparencias de este artículo se pueden obtener en:http://www.lsi.upc.es/~lcmolina/about.htm[url1].

© Luis Carlos Molina Félix, 2002 © de esta edición: FUOC, 2002

-1-

Data mining: torturando a los datos hasta que confiesen http://www.uoc.edu/molina1102/esp/art/molina1102/molina1102.html

2. El incremento de las velocidades de cómputo en los procesadores. 3. Las mejoras en la confiabilidad y aumento de la velocidad en la transmisión de datos. 4. Eldesarrollo de sistemas administradores de bases de datos más poderosos. Actualmente todas estas ventajas nos han llevado a abusar del almacenamiento de la información en las bases de datos. Podemos decir que algunas empresas almacenan un cierto tipo de datos al que hemos denominado dato-escritura, ya que sólo se guarda (o escribe) en el disco duro, pero nunca se hace uso de él. Generalmente, todaslas empresas usan un dato llamado dato-escritura-lectura, que utilizan para hacer consultas dirigidas. Un nuevo tipo de dato al cual hemos denominado dato-escritura-lectura-análisis es el que proporciona en conjunto un verdadero conocimiento y nos apoya en las tomas de decisiones. Es necesario contar con tecnologías que nos ayuden a explotar el potencial de este tipo de datos. La cantidad de...
tracking img