Mineria de datos

Solo disponible en BuenasTareas
  • Páginas : 11 (2617 palabras )
  • Descarga(s) : 9
  • Publicado : 22 de agosto de 2010
Leer documento completo
Vista previa del texto
MINERÍA DE DATOS (DATA MINING) | | | |

Escrito por Administrator    |
Miércoles 24 de Febrero de 2010 00:36 |
 MINERIA DE DATOS (DATA MINING)   Iván Tercero Talavera  En el proceso de transformación de datos en información y luego en conocimiento, la Minería de Datos o Data Mining es una herramienta de vital importancia. Los datos, por sí solos, no nos ayudan mucho en la toma dedecisiones, ni son explicativos, ni orientadores para la acción, pero ya convertidos en conocimiento el valor que adquieren se potencia de manera sustantiva.business intelligence  Para iniciar la incursión en este tema, presento a continuación información extraída de la Lección Introductoria sobre Data Mining, and Knowledge Discovery, del Curso sobre Minería de Datos, de Kdnuggets y del ArtículoMinería de Datos: Conceptos y Tendencias, de José C. Riquelme, Roberto Ruiz y Karina Gilbert, de la Universidad de Sevilla, Universidad Pablo de Olavide y Universidad Técnica de Cataluña, España, respectivamente. kdnuggetsMinería de Datos: Conceptos y Tendencias “Las tendencias tecnológicas actuales conducen inexorablemente a una inundación de datos. Se generan muchos datos de la banca,telecomunicaciones y otras transacciones de negocios. Más datos son generados de experimentos científicos en astronomía, exploraciones del espacio, biología, física de alta energía, etc. Más datos son creados en la Web, especialmente en textos, imágenes y otros formatos de multimedia. Por ejemplo, la Iterferometría de Muy Larga Base de Europa (VLBI) tiene 16 telescopios, cada uno de los cuáles produce 1Gigabyte/segundo (sí, por segundo!) de datos astronómicos por sesion de observación de 25 días. Esto, verdaderamente, genera una cantidad “astronómica” de datos. AT&T maneja tantas llamadas por día que no puede almacenar todos los datos – y el análisis de datos tiene que hacerse “al vuelo”. Un análisis de la UC Berkely hecho por los Profesores Peter Lyman y Hal R. Varian estimó que 5 exabytes (5millones de terabytes) de datos nuevos se crearon en 2002. El doble de información se creó en el 2002 que en 1999 (~30% de tasa de crecimiento). Los EUA producen ~40% de datos nuevos almacenados en el mundo. Al 2003, de acuerdo a Winter Corp. Survey, Telecom de Francia tenía la base datos de apoyo a decisiones más grande,  ~30 TB (terabytes); AT&T estaba en segundo lugar con una base datos de 26TB. Algunas de las bases de datos más grandes en la Web, al 2003, incluían: * Alexa  archivos de internet: 7 años de datos, 500 TB * Archivo de Internet ,~ 300 TB * Google, más de 4 mil millones de páginas, muchos, muchos TBEstas cantidades de datos crecen muy rápidamente y muy poco de ellas será alguna vez vista por un humano. Se necesita Descubrimiento del Conocimiento para hacer sentido yutilizar esos datos. ”  data mining course ¿A QUE SE LE LLAMA MINERÍA DE DATOS? “Minería de datos es el proceso de extraer patrones de los datos. La Minería de Datos está convirtiéndose en una cada vez más importante herramienta para transformar estos datos en información. Comúnmente se utiliza en un amplio rango de perfiles de prácticas, tales como mercadeo, vigilancia, detección de fraudes ydescubrimientos científicos.wikipedia La Minería de Datos es uno de los campos más activos en las Ciencias de la Computación. A lo largo de esta era de la computación, los datos se han ido acumulando en muchas formas que incluyen sistemas de bases de datos, hojas de cálculo, archivos de texto y recientemente páginas Web. Estos datos se han almacenado en discos duros y en medios temporales dealmacenamiento. Los programas de bases de datos pueden hacer búsquedas de información específica tales como “cuántos pacientes hay de edad mayor de 70,” pero hay potencialmente mucho más en los datos que tal información específica. El tesoro real podría ser algunos patrones nuevos e interesantes de los que incluso no sabemos qué deberíamos preguntar, por ejemplo, “el mejor predictor de la enfermedad de...
tracking img