Metodologia crisp-dm

Solo disponible en BuenasTareas
  • Páginas : 9 (2128 palabras )
  • Descarga(s) : 0
  • Publicado : 2 de marzo de 2011
Leer documento completo
Vista previa del texto
Resumen

Este trabajo pretende abordar una de las metodologías mas utilizada por los analistas para realizar proyectos de Minería de Datos. Introducirnos en ella nos facilitara la manera de reaprovechar la experiencia y ayuda de sus creadores a la hora de planificar y ejecutar un proyecto que nos permita procesar y analizar datos para proporcionar un verdadero conocimiento que ayude en la tomade decisiones.
.

Introducción

La cantidad de datos y la capacidad de almacenamiento de los mismos han crecido exponencialmente en los últimos años en las organizaciones. No ha ocurrido así con la capacidad de procesamiento de estos volúmenes de datos para utilizarlos eficazmente. Lo antes planteado, unido al gran desarrollo tecnológico de las computadoras, ha propiciado la aparición denuevas posibilidades, agrupadas bajo el término generalmente conocido como “Minería de Datos”. El aprovechamiento de estos volúmenes de datos requiere el desarrollo de proyectos con características específicas.

Los proyectos de Minería de Datos tienen por objetivo extraer información útil, mediante la exploración y el análisis de grandes volúmenes de datos y son aplicables a todos los campos ysectores. Así existen proyectos de este tipo en sectores tan disimiles como el comercio, la banca, las industrias o la salud publica. La extracción de esta información útil es un proceso complejo, que requiere la aplicación de una metodología estructurada para la utilización ordenada y eficiente de las técnicas y herramientas disponibles.

Existen varias metodologías, y dentro de las más usadas seencuentran: CRISP-DM, My own, SEMMA, entre otras, por lo que el conocimiento de las fortalezas y debilidades de cada una de ellas hará posible la selección de una técnica de desarrollo apropiada para un proyecto determinado de cada organización.

En este trabajo se presenta una de las metodologías más utilizadas por los analistas a nivel mundial para la realización de proyectos de Minería deDatos, aunque no es la más actual, ni la mejor según el criterio de algunos analistas, no cabe duda que es un método muy efectivo: CRISP-DM, diseñada para guiar a inexpertos en DM y proveer un modelo genérico que se puede especializar de acuerdo con las necesidades de cualquier compañía o sector particular, lo que permitirá a los analistas tener una razonable seguridad de que sus esfuerzos seránútiles y válidos

La esencia de esta metodología consiste en estructurar el proyecto de minería en fases que se encuentran interrelacionadas entre sí, convirtiéndolo en un proceso iterativo e interactivo. La presentación de las diferentes fases y tareas de esta metodología proporciona una idea más amplia respecto a la realización de proyectos de Minería de Datos.

Esta metodología fue creada afinales de 1996 por Daimler Chrysler (en aquel momento Daimler-Benz), SPSS (EE. UU) (en aquel momento ISL) y NCR, su nombre es un acrónimo: CRISP-DM (CRoss-Industry Standard Process for Data Mining). El interés generado por esta metodología, así como el desarrollo que iba alcanzando, dio lugar a la creación de un consorcio. Actualmente existen alrededor de 200 miembros del CRISP-DM Special InterestGroup (SIG), y este agrupa a proveedores de DM, consultores y usuarios finales. Esta metodología fue planeada para ser una herramienta industrial, y de aplicación neutral,

Metodología CRISP-DM

La metodología CRISP-DM consta de cuatro niveles de abstracción, organizados de forma jerárquica en tareas que van desde el nivel más general hasta los casos más específicos: fase, tarea genérica,tarea especializada, e instancia de procesos.

A nivel más general, el proceso está organizado en seis fases, estando cada fase a su vez estructurada en varias tareas generales de segundo nivel. Este segundo nivel lo llaman genérico porque esta destinado a ser bastante general para cubrir todas las situaciones posibles de minería de datos. Las tareas generales se proyectan a tareas específicas,...
tracking img