Mineria

Solo disponible en BuenasTareas
  • Páginas : 2 (462 palabras )
  • Descarga(s) : 0
  • Publicado : 6 de junio de 2011
Leer documento completo
Vista previa del texto
La minería de datos (Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información es previamente desconocida y puede resultar útilpara algún proceso. Es una poderosa tecnología nueva con gran potencial para ayudar a las compañías a concentrarse en la información más importante de sus Bases de Información. En otras palabras, laminería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.

Exploran los datos que se encuentran en las profundidades de las bases de datos, como los almacenes dedatos, que algunas veces contienen información almacenada durante varios años. Suele tener una arquitectura cliente-servidor.

La Minería de Datos puede ser dividida en:
 Minería de datospredictiva (mdp): usa primordialmente técnicas estadísticas.
 Minería de datos para el descubrimiento de conocimiento (mddc): usa principalmente técnicas de inteligencia artificial.

Una vez recogidoslos datos de interés, un explorador puede decidir qué tipo de patrón quiere descubrir. El tipo de conocimiento que se desea extraer va a marcar claramente la técnica de minería de datos a utilizar.Según como sea la búsqueda del conocimiento se puede distinguir entre:
 Directed data mining: se sabe claramente lo que se busca, generalmente predecir unos ciertos datos o clases.
 Undirecteddata mining: no se sabe lo que se busca, se trabaja con los datos (¡hasta que confiesen!).

En el primer caso, algunos sistemas de minería de datos se encargan generalmente de elegir el algoritmo másidóneo entre los disponibles para un determinado tipo de patrón a buscar.

Evaluación y Validación:

La fase anterior produce una o más hipótesis de modelos. Para seleccionar y validar estosmodelos es necesario el uso de criterios de evaluación de hipótesis.

1ª Fase: Comprobación de la precisión del modelo en un banco de ejemplos independiente del que se ha utilizado para aprender el...
tracking img