Mineria

Solo disponible en BuenasTareas
  • Páginas : 52 (12991 palabras )
  • Descarga(s) : 0
  • Publicado : 7 de noviembre de 2011
Leer documento completo
Vista previa del texto
   

    Minería de Reglas de Asociación sobre Datos Mezclados  
Ansel Yoan Rodríguez González, José Francisco Martínez Trinidad, Jesús Ariel Carrasco Ochoa, José Ruiz Shulcloper

 
Reporte Técnico No. CCC-09-001 31 de Marzo de 2009

 
         
       

  © Coordinación de Ciencias Computacionales
INAOE

Luis Enrique Erro 1 Sta. Ma. Tonantzintla, 72840, Puebla, México.   

       

Minería de Reglas de Asociación sobre Datos Mezclados 
Ansel Yoan Rodríguez González 1,2, José Francisco Martínez Trinidad 1, Jesús Ariel Carrasco Ochoa 1, José Ruiz Shulcloper 2  
Coordinación de Ciencias Computacionales Instituto Nacional de Astrofísica, Óptica y Electrónica Luis Enrique Erro # 1, Santa María Tonantzintla, Puebla, 72840, México {ansel,fmartine,Ariel}@ccc.inaoep.mx
21

Centro de Aplicaciones de Tecnologías de Avanzada. Ave. 7ma, # 21812 %218 y 222, Rpto. Siboney, Municipio Playa, Ciudad de la Habana, Cuba {arodriguez,jshulcloper}@cenatav.co.cu Resumen. La mayoría de los algoritmos existentes para el minado de reglas de asociación asumen que dos subdescripciones de objetos son similares si y solo si ellas son iguales, sin embargo en problemas reales sonusadas otras medidas de semejanzas. Esta propuesta de tesis doctoral aborda el problema de minería de reglas de asociación usando funciones de semejanza en colecciones de datos que contienen Datos Mezclados, es decir, que combinan diferentes tipos de datos (numéricos y no numéricos) en las descripciones de los objetos que la forman. Como resultado preliminar se proponen dos algoritmos para el minadode patrones similares frecuentes para funciones de semejanza binarias. Los resultados obtenidos muestran que el comportamiento de los algoritmos propuestos es superior al del único algoritmo existente para el minado reglas de asociación usando funciones de semejanza diferentes de la igualdad.  Palabras clave. Minería de datos, patrón frecuente, regla de asociación, datos mezclados, funciones desemejanza.

1

Introducción

La Minería de Reglas de Asociación es una técnica importante en la Minería de Datos y consiste en encontrar las asociaciones interesantes en forma de relaciones de implicación entre los valores de los atributos de los objetos de un conjunto de datos. Numerosos y recientes estudios [1-7] avalan su actualidad e importancia y su aplicación en áreas como mercadeo,bioinformática, medicina y seguridad de redes entre otras. Esta técnica emergió en la década de los 90 con una aplicación práctica, el análisis de información de ventas para el mercadeo [8, 9]. Mediante ella se descubrían las relaciones entre los datos recopilados a gran escala por los sistemas de terminales de punto de venta de supermercados. Los datos consistían en colecciones de transacciones,también conocidas como bases de datos transaccionales, donde cada transacción expresa qué productos compró un cliente. Un ejemplo de este tipo de colecciones se muestra en la Tabla 1. 

1   

   
Tabla 1. Ejemplo de colección de transacciones.
No. 1 2 3 4 5 6 Transacciones Productos comprados Leche, Pan Pan, Mantequilla Cerveza Leche, Pan, Mantequilla Pan Leche, Pan, Mantequilla

En estecontexto una regla de asociación podría ser "Si un cliente compra pan y leche, entonces también compra mantequilla", formalmente     El interés de una regla de asociación está dado por su soporte y su confianza, entendiéndose por soporte la frecuencia de aparición en la colección de la combinación de productos involucrados en la regla. Por ejemplo para la colección mostrada en la Tabla 1 se tiene que:2   6 Por confianza de una regla entendemos cuánto representa el soporte de la regla, del soporte del antecedente de la regla. Por ejemplo para la colección mostrada en la Tabla 1 se tiene que:    2   3 Se considera que una regla es interesante si su soporte y su confianza son mayores o iguales que ciertos umbrales de mínimo soporte y mínima confianza especificados. Este tipo de reglas fue...
tracking img