Modelo Y Procedimiento Para Segmentar Direcciones
En este trabajo se propone un procedimiento basado en HMM (Hidden Markov Models) en unión de otras técnicas y del conocimiento adquiridoen elestudio de un conjunto de direcciones postales de la base de datos de una organización empresarial, para segmentarlas automáticamente, dando un paso importante para su estandarización y mejorutilización de la información que llevan en ellas. De la misma manera se propone un Modelo general con el mismo fin.
Palabras clave: Limpieza de datos, Modelos Ocultos de Markov, HMM.
1. Unacaracterización previa de las direcciones postales de la base de datos de los clientes de una organización empresarial, permitió conocer unagran parte de los problemas existentes en dichas direcciones. Deese estudio se derivó una estructura para las direcciones postales que contiene los elementos necesarios para posibilitar una segmentación más ajustada a los intereses de la organización estudiada.También se construyó un Modelo Oculto de Markov externo para las direcciones postales de esa organización, así como los Modelos Ocultos de Markov internos para cada uno de los elementos que componen laestructura de una dirección postal. La totalidad del estudio realizado previo altrabajo que aquí se presenta, es un avance en la configuración de un procedimiento para segmentar correctamente lasdirecciones, como paso previo para conformar con estas un Almacén de Datos eficiente y eficaz.
2. Introducción.
3. Procedimiento basado en HMM
El procedimiento que se propone en este trabajo parasegmentar y normalizar las direcciones en la organización empresarial que es motivo de estudio, es el siguiente:
1. Analizar direcciones.
2. Proponer estructura de las direcciones.
3.Definir modelo general basado en HMM.
4. Definir sustituciones.
5. Seleccionar un conjunto de entrenamiento y de prueba.
6. Hacer sustituciones en el conjunto de entrenamiento.
7....
Regístrate para leer el documento completo.