Trabajo Investigación Procesos de data mining o minería de datos

Páginas: 7 (1735 palabras) Publicado: 23 de noviembre de 2013
“Trabajo Investigación Procesos de data mining o minería de datos”

Asignatura: Inteligencia de Negocios
Profesor: Gabriel Icarte


Índice:
 Introducción.……………………………………………………………………………. pág.3
 Desarrollo………………………………………………………………………………… pág.4
 Caso de estudio tarea predicción …………………….………….… pág.4
 Caso de estudio tarea descripción……………………………….… pág.7
Conclusión………………………………………………………………………………… pág. 14
 Anexos……………………………………………………………………………………… pág. 15


I Introducción:
Antes de empezar es bueno señalar que el data mining es el proceso por el cual se analizan los bienes o datos acumulados en una empresa para extraer una cierta inteligencia o conocimiento de ellos, en el sentido más amplio, es un proceso para realizar inteligencia de negocios (business Intelligence). En el sentido más específicopodemos utilizar la siguiente definición.
“La minería de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD), es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. Elobjetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y gestión de datos, procesamiento de datos, el modelo y las consideraciones de inferencia, métricas de Intereses, consideraciones de la Teoría de lacomplejidad computacional, post-procesamiento de las estructuras descubiertas, la visualización y actualización en línea.”
Ahora en el siguiente informe, veremos partes de la minera de datos por medio del estudio de casos que son:
 La predicción: por medio de los datos analizados se busca crear una serie de reglas o patrones que permitan predecir sucesos futuros.
 La Descripción: por mediode los datos analizados se busca agrupar, asociar o igualar sucesos pasados. 
II Desarrollo:
1. Caso de estudio de la tarea: predicción
Antecedentes del caso
Empresa: n/a, Agustín José Calleja Gómez (ninguna empresa, trabajo personal para titulación)
Problema: Predicción precio de automóviles de segunda mano
Fecha del caso: Diciembre 2010
Universidad: Universidad Politécnica de valencia.Dirección web del caso
http://riunet.upv.es/bitstream/handle/10251/10097/PFC_DSIC-80_Agust%C3%ADnCalleja.pdf
Objetivo de la tarea
El objetivo consiste en que ante una marca y un modelo de coche dados o elegidos por el usuario de la aplicación, seamos capaces de predecir qué precio tendría ese vehículo en el mercado. Es evidente, que cuanto más específico seamos, la predicción será mejor.Técnica utilizada
Árbol de decisión
Regresión lineal
Algoritmo utilizado
M5P.
Este algoritmo es una reconstrucción del algoritmo de Quinlan M5. Este algoritmo combina un árbol de decisión normal con funciones de regresión lineal en los nodos. Primero, utiliza un algoritmo de árbol de decisión para construir un árbol, sin embargo, en vez de maximizar la información ganada en cada nodo interno, seutiliza un criterio de división que minimiza la variación interna de los subconjuntos para los valores de clase de cada rama. EL proceso de división del M5P se detiene si los valores de clase de todas las instancias que alcanzan un nodo varían ligeramente, o tan solo permanecen algunas instancias.
En segundo lugar, el árbol es recortado de nuevo desde cada hoja. Al recortar un nodo interno, seconvierte en una hoja con un plano de regresión.
Después, para evitar discontinuidades entre los sub-arboles, se aplica un procedimiento que combina el modelo de predicción de hojas con cada nodo por todo el trayecto de vuelta a la raíz, haciendo más preciso cada uno de estos nodos al combinarlo con el valor predicho por el modelo lineal para dicho nodo.
En...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data Mining, Mineria De Datos
  • Minería de Dato
  • Trabajo Mineria De Datos
  • En Qué Consiste El Procesamiento De Datos En La Investigación
  • Data mining
  • Data Mining
  • Data Mining
  • data mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS