Proceso KDD

Páginas: 11 (2740 palabras) Publicado: 7 de julio de 2015
DIPLOMADO EN BUSINESS INTELLIGENCE
Extracción de información y conocimiento útil para nuestra empresa

JAIME MIRANDA P.
(jmirandap@fen.uchile.cl)
Departamento de Control de Gestión y Sistemas de Información
Facultad de Economía y Negocios
Universidad de Chile

¿En qué consiste el
Business Intelligence?
BUSINESS INTELLIGENCE (BI)

→La
La Inteligencia del Negocio (BI) representa las herramientas
ysistemas que juegan un papel clave en el proceso estratégico
de la planificación de una compañía. Estos sistemas permiten
reunir, almacenar, y analizar los datos corporativos siendo una
importante ayuda en la toma de decisiones.

Generalmente estos sistemas ilustrarán los perfiles de los clientes, estudios
de mercado, segmentación de clientes, predicción de comportamientos.

El Vértigo de laInteligencia de Negocios

Centro del Análisis = Cliente
F id e liz a c ió n y
R e te n c ió n

O f e rta s
F o c a liz a d a s

S e g m e n ta c ió n

C L IE N TE

M ix d e
P ro d u c to s

A d m in is tra c ió n
d e l R ie s g o

C a lid a d d e l
S e rv ic io

Motivación …
Discutamos las siguientes interrogantes:
Institución Financiera
»
»

¿Qué clientes cerraran sus productos en los próximosmeses?
¿De qué segmentos se compone mi cartera?

Supermercado
»
»

¿Cómo defino un cliente?
¿Cuál es el mejor mix de producto?

Empresa de Seguros
»
»

¿Cuál es el riesgo de mi cartera?
¿Qué clientes son los más rentables?

Grandes Tiendas
»

¿Qué clientes son más propensos a aceptar una oferta tecnológica?

Proceso KDD:
Knowledge Discovery in Databases
Una metodología para la construcción de unSistema BI

Pasos Preliminares
ORGANIZACIÓN BD
» Las bases de datos no concibieron en principio para hacer Data Mining
sobre ellas.
» Es necesario normalizar la base de datos.
» Es necesario que la información sea estructurada. Por ejemplo que las
filas sean los clientes y las columnas las variables.
» Se estima que el proceso de extracción puede ir desde las semanas a los
meses.

PasosPreliminares
MUESTREO DE LA BD
» Uno por lo general no trabaja con toda la muestra de datos.
» Los métodos de Data Mining tienen varias limitaciones en términos del
número de registros y variables.
» Algunas limitantes se relacionan con el poder computacional y
limitaciones de los programas o software.
» Algunos algoritmos solamente funcionan rápido con bases de datos
pequeñas.

Pasos Preliminares
EVENTOS“EXTRAÑOS” Y DESBALANCE ENTRE CLASES
» Uno por lo general trata de entender el comportamiento de una pequeña
porción de una muestra. Por ejemplo, clientes que respondieron a la
compra por un email que les envié.
» Este problema se le conoce con el nombre de desbalance entre clases.
»

El desbalance ocasiona que los algoritmos entreguen como predicción
que todos los objetos pertenecen a la clase de“mayor” tamaño.

» Se busca encontrar modelos que sean capaces de discriminar entre las
distintas clases.

Pasos Preliminares
MATRIZ DE COSTOS Y ERRORES
» Un aspecto importante es definir el costos de las malas clasificaciones o
predicciones.
» Uno por lo general desea encontrar los casos más “raros” por lo que el
no encontrarlos se hace más costoso.
» Sin embargo el costo depende directamente de laproblemática de
negocios que estemos tratando.
» Por ejemplo en una problemática de fraude en tarjeta de crédito:
• ¿Cuál error de clasificación es más costoso?

Pasos Preliminares
TIPOS DE VARIABLES A UTILIZAR
» Existen muchas formas de clasificar una variable.
» Las variables pueden ser:
• Continuas.
• Enteras.
• Categóricas
» Dentro de las variables categóricas estas pueden ser:
• Numéricas /Texto
• Nominal: América-Europa-Asia.
• Ordinal: Alto – Medio – Bajo.

Pasos Preliminares
TRABAJO CON VARIABLES CATEGORICAS
» Este tipo de variable merece un trato especial al no representar un
número sino que una clase.
» Uno puede transforma una variable continua en una variable categórica
definiendo rangos.
• Edad.
• Renta.
» Las variable categóricas no pueden utilizarse directamente.
»...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Minería de Datos Mediante Procesos KDD
  • Kdd Valencia
  • Kdd y mineria de datos
  • Descubrimiento de conocimiento en bases de datos (kdd)
  • Proceso y procesadores
  • proceso y procesador
  • Proceso Y Procesamiento
  • Procesadores

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS