Reglas de asociación y dependencia

Solo disponible en BuenasTareas
  • Páginas : 13 (3065 palabras )
  • Descarga(s) : 0
  • Publicado : 14 de noviembre de 2011
Leer documento completo
Vista previa del texto
Capítulo 9
REGLAS DE ASOCIACIÓN Y DEPENDENCIA

Contesti Pablo, Fernandez Mauro, Trevignani Germán.-

9.1 – Introducción

Las reglas de asociación y dependencia expresan patrones de comportamiento entre los datos en función de la aparición conjunta de valores de dos o más atributos. Normalmente, llevan asociadas gran volumen de datos por lo que la eficiencia es un factor clave en elaprendizaje de reglas de asociación.

Son una manera muy popular de expresar patrones de datos de una base de datos, que a diferencia de los estudios correlacionales, que tratan atributos numéricos, estas reglas tratan con atributos nominales.

Las reglas de asociación surgieron para afrontar el análisis de las cestas de la compra de los comercios, para saber los productos que suelen comprarseconjuntamente y así mejorar la distribución de los productos en estanterías.

Una regla de asociación es una proposición probabilística sobre la ocurrencia de ciertos estados en una base de datos.

Dada una regla de asociación, se suele trabajar con 2 medidas para conocer la calidad de la regla:

• Cobertura: número de instancias que la regla preside correctamente.

• Confianza: mide elporcentaje de veces que la regla se cumple cuando se puede aplicar.

Las reglas de asociación pueden clasificarse en familias según los siguientes criterios:

1) Tipos de valores utilizados en las reglas: podemos tener reglas que trabajan con atributos binarios o de más de dos valores.

2) Dimensiones de Datos: las reglas pueden tomar una o más dimensiones (multidimensionales), como ser elsimple hecho de suceder o incluir espacio y/o temporalidad.

3) Nivel de Abstracción: algunos algoritmos permiten incluir diferentes niveles de abstracción a las reglas, representados por conceptos que abarcan otros conceptos.

4) Instantáneas o Secuenciales: depende de si se consideran relaciones en un instante de tiempo o en una secuencia o serie.

Por lo general, las reglas de asociaciónse caracterizan por expresarse de la siguiente manera: “SI… ENTONCES…” y porque los algoritmos tienen como objetivo primordial la eficiencia.

9.2 Reglas de asociación

El aprendizaje de reglas de asociación se basa en su confianza y cobertura. Los algoritmos de aprendizaje trabajan en la búsqueda de reglas que cumplan unos requisitos mínimos en estas medidas.

Un algoritmo de aprendizaje dereglas de asociación muy simple y popular es el algoritmo Apriori. Este algoritmo se basa en la búsqueda de los conjuntos de ítems con determinada cobertura. Para ello, en primer lugar se construyen simplemente los conjuntos formados por sólo un ítem que superan la cobertura mínima. Este conjunto de conjuntos se utiliza para construir el conjunto de conjuntos de dos ítems, y así sucesivamentehasta que se llegue a un tamaño en el cual no existan conjuntos de ítems con la cobertura requerida.

Una vez que se han seleccionado los conjuntos de ítems que cumplen con la cobertura mínima, el siguiente paso consiste en extraer de estos conjuntos de reglas las que tengan un nivel de confianza mínimo.

El aprendizaje de reglas de asociación se divide normalmente en dos fases: la extracción delos conjuntos de ítems que cumplan con la cobertura requerida de datos, y la generación de reglas a partir de estos conjuntos.

Para la búsqueda de los conjuntos de ítems se emplea una propiedad que permite acelerar de manera considerable su búsqueda: un conjunto de ítems formado por X ítems es frecuente si y solo si cada uno de los X ítems es frecuente por si solo. Esto permite crear ítemsfrecuentes de una manera incremental.

La siguiente fase consiste en la creación de reglas a partir de los conjuntos de ítems frecuentes.

9.2.1 Mejoras y extensiones

Con el objetivo de mejorar la búsqueda de reglas de asociación, así como ampliar el campo de aplicación de estas estrategias se han definido diferentes variantes del algoritmo básico de aprendizaje de reglas de asociación. Estas...
tracking img