Casos de estudio minera de datos

Solo disponible en BuenasTareas
  • Páginas : 8 (1786 palabras )
  • Descarga(s) : 0
  • Publicado : 19 de febrero de 2012
Leer documento completo
Vista previa del texto
Cross-industry standard process: CRISP-DM

Es un estándar aplicable a cualquier tipo de investigación o empresa que necesite la minería de datos. Este es un proceso con 6 etapas y es adaptativo; lo que significa que las fases siguientes son dependientes de los resultados de las anteriores, el proceso también es iterativo, por el hecho de que en una empresa surgen problemas una vez se tenga unasolución que revela otras problemáticas. El proceso permite devolverse para mejorar el proceso de la fase anterior y obtener los resultados esperados. A continuación se hace una descripción general de cada una de las fases:

Investigación en la empresa o comprendiendo el negocio:
Denominada fase de entendimiento de la investigación, es la primera fase del estándar y se hacen las siguientestareas:
a. Se enuncian los objetivos del proyecto y los requerimientos en términos del negocio.
b. Se traducen estos objetivos y restricciones en formulaciones de un problema de datamining.
c. Se prepara una estrategia preliminar para lograr los objetivos.

Fase para entender los datos:
a. Se recolectan los datos.
b. Se hace un análisis exploratorio de los datos parafamiliarizarse con los mismos y sacar algunos puntos de vista iniciales
c. Se evalúa la calidad de los datos
d. Si se desea, se seleccionan subconjuntos que puedan contener patrones para tomar acciones concretas.


Fase de preparación de los datos:
a. De los datos crudos (raw data) anteriores, se prepara un conjunto de datos que va a ser necesario para todas las fases siguientes. Esta faserequiere mucho esfuerzo.
b. Se seleccionan los casos y las variables que se quieren analizar, estos deben ser los apropiados para el análisis.
c. Se realiza una transformación en ciertas variables, si se necesita.
d. Se purgan los datos en crudo o se limpian de manera que quedara listo para las herramientas de modelado.

Fase de modelado:

a. Se selecciona y aplica una técnica apropiada demodelamiento.
b. Se calibran características del modelo para optimizar resultados.
c. Recuerde que a menudo, diferentes técnicas pueden ser usadas en el mismo problema de minera de datos.
d. Si es necesario, se retrocede a la fase de preparación de los datos para conseguir la forma adecuada para trabajar con los requerimientos específicos de una técnica de datamining en particular.
Fasede evaluación:
a. Se evalúa uno de o mas modelos entregados por la fase de modelado para conseguir efectividad y calidad antes de implementar y usar.
b. Se determina si en realidad el modelo es capaz de alcanzar los objetivos propuestos en la primera fase.
c. Se establece si en alguna faceta importante del negocio no ha sido tenida en cuenta por que es suficiente
d. Se toma unadecisión teniendo en cuenta el uso de los resultados del data mining

Fase de implementación:
a. Se hace uso del modelo creado: La creación del modelo no significa la terminación del proyecto.
b. Ejemplo de una simple entrega(implementación): Generar un reporte
c. Ejemplo de una entrega más compleja: Se implementa un proceso paralelo de datamining en otro departamentol.
d. Paranegocios, el cliente a menudo se encarga de hacer el despliegue necesario en la empresa basado en el modelo realizado.

Primer caso de estudio:
El estudiante Jochen Hipp de la universidade de Tubien, Alemania y guido lindner de La empresa estudiada (Daimler Chrysler), Alemania, investigaron los patrones que generaban los reclamos de garantías en la empresa.


Estos personajes decidieron usar elproceso CRISP-DM que les exige llevar 6 pasos a cabo:

Primero tienen que identificar las necesidades del negocio y terminar generando una estrategia para lograr los objetivos.

Las personas involucradas en la investigación definieron que la necesidad de la empresa era lograr una reducción de costos en el reclamo de garantías para a su vez ofrecer un mejor servicio.
Para identificar los...
tracking img