Mineria De Datos

Páginas: 28 (6828 palabras) Publicado: 16 de diciembre de 2012
Introducción a Data Mining
Data Mining como un conjunto de técnicas estadísticas
No existe una única definición del término Data Mining (DM). Se puede decir que DM se refiere a un conjunto de métodos estadísticos que proporcionan información (correlaciones o patrones) cuando se dispone de muchos datos (de aquí viene el nombre Minería de Datos). Esta idea de DM lleva a la siguiente estructura deconocimiento: Datos + Estadística → Información El símbolo → tiene el siguiente sentido: los datos están bien recogidos y la estadística bien aplicada. Según algunos autores, el Data Mining es aquella parte de la estadística (principalmente estadística no paramétrica) que se usa para problemas que se presentan actualmente en Análisis de Datos. Los problemas actuales se diferencian de los clásicosen que el número de datos a analizar es mucho mayor y, como consecuencia, las técnicas estadísticas clásicas no pueden ser aplicadas. Generalmente, el Data Mining es el proceso de analizar datos desde diferentes perspectivas con el objetivo de resumir los datos en segmentos de información útiles. Esta información que puede ser usada para incrementar réditos o beneficios, reducir costos, etc. El DMpermite a los usuarios analizar datos desde diferentes dimensiones o ángulos, categorizándolos y resumiendo las relaciones identificadas. Con estas técnicas es posible, a veces, hacer evidente las relaciones ocultas entre sucesos. Un ejemplo simple sería averiguar la relación entre la compra de pañales y de cerveza el sábado por la tarde en los supermercados. Este ejemplo ilustra muy bien lanecesidad de 1

conocer el campo de trabajo para aplicar el Data Mining: sólo un especialista que conozca a su clientela es capaz de interpretar una correlación bruta que permita realizar el retrato típico de una pareja haciendo sus compras. Encontrar las relaciones causales que llevan a correlaciones como la anterior puede ser más rápido y sencillo con el Data Mining. Además el DM permite trabajarcon grandes cantidades de observaciones (varios millones) sin ningún inconveniente. También permite tratar una gran cantidad de variables predictivas (hasta varios millares). Esto último es de gran utilidad para seleccionar variables (determinar las más útiles dentro de una gran masa).

Algunas cosas que se puede hacer con el DM
El usuario del DM usualmente busca los siguientes cuatro tipos derelaciones: (i ) Clases: las observaciones se asignan a grupos predeterminados. El proceso de clasificación consiste en asignar un conjunto de datos a grupos fijados de manera que se minimice la probabilidad de una clasificación errónea. Por ejemplo, un problema típico de clasificación es el de dividir una base de datos de bancos en grupos que sean lo más homogéneos posibles con respecto a variablescomo posibilidades de crédito en términos de valores tales como bueno o malo. (ii) Clusters: se construyen grupos de observaciones similares según un criterio prefijado. El proceso de clustering (agrupamiento) consiste en subdividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo más cercano posible a otro elemento, y grupos diferentes estén lomás lejos posible entre sí, de modo que la distancia está medida respecto a todas las variables disponibles. Un típico ejemplo de aplicación de clustering es la clasificación de segmentos de mercado. Por ejemplo, una empresa quiere introducirse en el mercado de bebidas alcohólicas, pero antes hace una encuesta de mercado para averiguar si existen grupos de clientes con costumbres particulares en elconsumo de bebidas. La empresa quiere introducirse en el grupo (si existe) que esté menos servido por la 2

competencia. En este ejemplo no existen grupos de clientes predeterminados (iii) Asociaciones: las observaciones son usadas para identificar asociaciones entre variables. La búsqueda de asociaciones es diferente a la búsqueda de relaciones causales. Las relaciones causales son mucho más...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de dato
  • Mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS