Mineria de Datos

Páginas: 6 (1385 palabras) Publicado: 19 de febrero de 2015
Naive Bayes
Definición: El clasificador bayesiano Naive se basa en el teorema de Bayes con los supuestos de independencia entre los predictores. Un modelo bayesiano Naive es fácil de construir, sin complicar la estimación de parámetros iterativos que hacen que sea especialmente útil para grandes bases de datos. A pesar de su simplicidad, el clasificador bayesiano Naive hace a menudo su trabajosorprendentemente bien y es ampliamente utilizado, ya que a menudo supera a los métodos de clasificación más sofisticados.
Características: El Teorema de Bayes proporciona una manera de calcular la probabilidad posterior, P(c|x), from P(c), P(x), and P(x|c). Clasificador de Bayes ingenuo es asumir que el efecto del valor de un predictor (x) en una clase dada (c) es independiente de los valores deotros predictores. Este supuesto se llama clase de independencia condicional.
Example:
El problema de frecuencia cero
Añadir 1 a la cuenta para cada combinación de clase de valor de atributo (Laplace estimador) cuando un valor de atributo (Outlook = Claro) no se produce con cada valor de la clase (Play Golf = no).
Los predictores numéricos
Las variables numéricas deben ser transformadas asus homólogos categóricas (binning) antes de construir sus tablas de frecuencias. La otra opción que tenemos está utilizando la distribución de la variable numérica para tener una buena suposición de la frecuencia. Por ejemplo, una práctica común es asumir la distribución normal de las variables numéricas.
 

Redes neuronales
Las Redes Neuronales se utilizan para clasificación y parareconocimiento de patrones. Son, en muchos casos, el método de aprendizaje preferido porque inducen hipótesis que generalizan mejor que los otros algoritmos. Varios estudios indican que en algunos dominios las Redes Neuronales proveen mayor precisión predictiva que los algoritmos de aprendizaje simbúlicos comúnmente utilizados (por ejemplo: arboles de decisión). Aun así, las Redes Neuronales no son muyutilizadas para Data Mining. Hay dos razones principales: los métodos de clasificación de las Redes Neuronales ya entrenadas no son explicables, y los tiempos de aprendizaje son lentos, imprácticos para grandes volúmenes de datos.
Las Redes Neuronales son colecciones de nodos conectados, con entradas, salidas, y procesamiento en cada nodo. Entre las entradas y las salidas de la red existe un númerode capas ocultas de procesamiento. La Red Neuronal debe ser entrenada con un conjunto de patrones de entrenamiento (aprendizaje supervisado). Una vez entrenada es utilizada para hacer predicciones.
Las hipótesis representadas por una Red Neuronal entrenada dependen de la topología de la red, de las funciones de transferencia utilizadas para las neuronas ocultas y de salida, y de los parámetrosasociados con las conexiones en la red (p.e. los pesos) y las neuronas (p.e. el valor umbral). Estas hipótesis son difíciles de explicar por varias razones: las Redes Neuronales típicamente utilizadas tienen cientos o miles de parámetros. Estos parámetros codifican la relación entre los atributos de entrada, x, y el valor a determinar y. Además, en redes multi-capa, los parámetros pueden representarrelaciones no lineales o no monótonas entre los atributos de entrada y el valor a determinar. Esto hace que no sea posible determinar, en forma aislada, el efecto de un atributo dado en el valor de salida obtenido.

Características: Una forma de entender las hipótesis representadas por una Red Neuronal entrenada es traducir estas hipótesis en lenguajes más comprensibles. Esta estrategia es laExtracción de Reglas (Craven et al., [3]). Existen varios motivos por los que es deseable poder extraer reglas a partir de una Red Neuronal (Boz, [1]):
Las reglas extraídas de la red entrenada pueden utilizarse en otros sistemas, por ejemplo, en
Sistemas Expertos.
Las reglas pueden usarse para descubrir características previamente desconocidas en los
datos (Data Mining).
Las reglas explican...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de dato
  • Mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS