ingeniero
Modelos de Minería de Datos
Contenido
1 Introducción 2
2 Necesidades de información. 2
2.1 Interesados 2
2.2 Fuentes de datos 3
2.3 Desafíos 4
3 Modelos de aprendizaje. 4
3.1 Aprendizaje Supervisado 4
3.1.1 Aprendizaje Supervisado Aplicado a InTec. 4
Conclusión del Algoritmo 8
3.2 Aprendizaje No Supervisado 8
4 Conclusiones. 11
1 Introducción
La información es unbien vital, las empresas que cuentan con activos intangibles como información de calidad, son igual o en algunos ocasiones más valoradas que empresas que solo manejan bienes tangibles, por esto, el proceso de obtención y manejo de información de calidad hoy es una necesidad creciente en todo tipo de empresas para mejorar su gestión, información que es un pilar vital y bien crítico para lasproyecciones y crecimiento de las instituciones en todo nivel.
2 Necesidades de información.
Los socios de InTec S.A. se encuentran con las siguientes incertidumbres en relación a la estrategia de la empresa, ya que tienen poco espacio de acción debido a la situación en la que se encuentran y, por lo tanto, requieren mejorar el conocimiento tanto de sus clientes como de los productos que ellospodrían preferir. Es en este contexto que el Gerente ha declarado tener necesidades de información.
2.1 Interesados
De acuerdo a las necesidades de información obtenidas de las diversas áreas que plantean los requerimientos, y que son necesarios para obtener información en forma eficiente y oportuna dentro de la empresa, se encuentran demandantes como:
Ejecutivos de Crédito
Departamento deMarketing.
Jefe de Ventas.
Jefe de Créditos.
Departamento de Crédito.
2.2 Fuentes de datos
Instancias de entrenamiento para los datos de permanencia.
Atributos:
Crédito
Deuda
Tarjeta InTec
Tarjeta visa
Ciudad
Permanencia
Instancias de entrenamiento para los datos de crédito.
Atributos:
Compras
Deuda
Edad
Antigüedad
Reclamos
Crédito
Instancias de entrenamiento para losdatos de fidelidad.
Atributos:
Compras
Deuda
Edad
Antigüedad
Reclamos
Fidelidad
Instancias de entrenamiento para los datos de clientes.
Atributos:
Cliente
Imagen
Audio
Almacenamiento
Telefonía
Video
2.3 Desafíos
Identificar de manera anticipada si la persona que se encuentra solicitando el crédito pertenece a un grupo de clientes que permanecerán como tal durante un períodode tiempo al menos medio.
Identificar y clasificar en grupos a los clientes de acuerdo a su fidelidad para enviarles campañas publicitarias personalizadas.
Identificar a los clientes que por sus características se les debe rechazar solicitudes de crédito que solicitan.
Identificar las preferencias de compras de los clientes de acuerdo a grupos de productos para enviar a los clientes similaresofertas de estos grupos.
3 Modelos de aprendizaje.
3.1 Aprendizaje Supervisado
3.1.1 Aprendizaje Supervisado Aplicado a InTec.
El aprendizaje supervisado es una técnica para concluir una función en base a datos de entrenamiento, los datos de entrenamiento están ideados por expertos que en el caso de InTec han clasificado la información con que se cuenta en la base de datos para definirprimero la permanencia de los clientes de InTec y la posibilidad de que estos clientes puedan adquirir crédito con la empresa, para esto se han aplicado dos técnicas de aprendizaje supervisado llamadas Arboles de Decisión y la Matriz de NaiveBayes.
3.1.1.1 Arboles de Decisión
1.1.1.1.1 Datos de Entrenamiento
1.1.1.1.2 Algoritmo Aplicado
El algoritmo aplicado se verá en el Excel que seencuentra adjunto en el documento para evitar la sobrecarga de este.
1.1.1.1.3 Instancias de Prueba
1.1.1.1.4 Conclusiones del Algoritmo
Como se puede ver el algoritmo responde bastante bien a las instancias de prueba, esto significa que sus datos de entrenamiento son efectivos, a continuación se muestra un esquema del diagrama del árbol aplicado a las instancias de prueba.
3.1.1.2...
Regístrate para leer el documento completo.