Gobernabilidad De Datos Iv N Am N Colombia
Gobernando sobre los datos
MSc Iván Amón Uribe
Coordinador Especialización en Inteligencia de Negocios
Universidad Pontificia Bolivariana
ivan.amon@upb.edu.co
¿Qué es Gobernar?
¿Qué es Gobernar?
¿Qué es Gobernar?
Gobernabilidad de datos (GD)
«Orquestación formal de personas,
procesos
y tecnología
para permitir a una organización aprovechar los datos
como unactivo empresarial».
[The MDM Institute]
Gobernabilidad de datos (GD)
Data Management Association (DAMA) Data Governance Framework
¿Requiere mi empresa GD?
Responda estas tres preguntas:
Pregunta
¿Se Mide el costo (incluyendo “costo de
oportunidad”) de los datos, inconsistentes,
inexactos o poco confiables?
¿Comprende la dirección ejecutiva el impacto
de los datos de baja calidad en laorganización?
¿Los sistemas de su empresa entregan una
versión única de la verdad?
Y N ?
Respuesta
Puntos
Y
1
N
0
No sé
-1
¿Requiere mi empresa GD?
Total
Pts
2-3
0-1
Situación Empresa
Consciente del impacto de buenos datos.
Está tomando decisiones importantes en relación con
los datos a través de la empresa.
Todavía puede necesitar algo de ayuda en GD.
Puede identificar fácilmente áreas demejoramiento.
Puede comenzar rápidamente el camino de la GD.
Tiene trabajo por hacer para lograr alto nivel en GD.
<0
Tranquilo, acá
empresas.
están
la
mayoría
de
[Fisher, 2009]
¿Cómo la GD puede hacer mi
empresa más exitosa?
Reduciendo
Costos
Incrementando
Utilidades
Reduciendo
Riesgos
¿La mala calidad de los datos
cuesta?
“Los problemas con la mala calidad
de
los
datos
puedencostar
alrededor del 10% de los beneficios
de una compañía”.
[Beg y Mussain, 2008]
¿La mala calidad de los datos
cuesta?
“Las organizaciones pierden al año
25%
del
tiempo
manejando
reclamaciones de los clientes por
datos erróneos”.
[Beg y Mussain, 2008]
¿La mala calidad de los datos
cuesta?
“Los problemas de calidad de los
datos representan alrededor del 6%
de pérdida de productividaden E.E.
U.U, lo que es aproximadamente el
P.I.B. de España. “
[Beg y Mussain, 2008]
¿La mala calidad de los datos
cuesta?
“Las fallas en los procesos y los
retrabajos
causados
por
información defectuosa, le han
costado $1.2 trillones a 122
organizaciones
Unidos”.
de
Estados
[English, 2009]
Algunos ejemplos:
Información errónea que llega al cliente (facturas,
estados de cuentas, cobrosindebidos, estado de la
producción, …)
dan lugar a quejas y reclamos
producen insatisfacción en los clientes
pueden ocasionar la pérdida de clientes
pueden ahuyentar a posibles nuevos clientes.
Algunos ejemplos:
Envío de correspondencia que no llega
a su destino por errores en las
direcciones.
Sobrecostos
en
campañas
publicitarias por datos de
personas duplicados.
Algunos ejemplos:Excesos o faltantes de inventarios.
Malas decisiones por por
información errónea.
Algunos ejemplos:
Informes
defectuosos
pueden
ocasionar exposición jurídica, dando
lugar a:
sanciones
demandas
pérdida de permiso de
operación.
Elementos de calidad de datos:
[Batini & Scannapieco, 2006]
Dimensiones
Exactitud
Conformidad
Oportunidad
Duplicación
Completitud
ConsistenciaMetodologías
IBM Data Governance Unified Process
Metodologías
Anomalías de los datos
Duplicados
Valores faltantes
Violación valor único
Violación de intervalo
Violación Integridad Referencial
Sinónimos
Valores atípicos
Valores inconsistentes
[Oliveira et. al. , 2005]
Técnicas para detección de anomalías
Distancia de edición
Q-grams
…
Prueba de Tukey
Regresión
…
Imputaciónusando estadísticos descriptivos
Imputación Hot Deck
…
Tipos de Herramientas
Perfilamiento de datos
Limpieza de datos
Gestión de metadatos
Gestión del glosario de negocio
Gestión de datos maestros
Algunos proveedores
¿Algunas consideraciones sobre GD?
Los Datos NO son un problema del
área de TI. Son un problema de cada
empleado y cada ejecutivo.
GD nunca debe ser...
Regístrate para leer el documento completo.