BI componentes
“Las organizaciones actúan bajo la suposición de que la información de la
que disponen es precisa y válida. Si la información no es válida, entonces no
pueden responder de las decisiones basadas en ella.”
Business Intelligence Network
Si en el DW hay errores, éstos se propagarán a lo largo de la
organización (y será muy difícil localizarlos).Pueden ocasionar que se tomen decisiones erróneas y afecten el
resultado de la organización.
Los costes por mala calidad de datos pueden llegar a ser muy
elevados.
Los errores en los datos pueden provenir de los sistemas
transaccionales de los que se recuperan los datos, del proceso
ETL, o del propio datawarehouse.
El proyecto de BI puede desprestigiarse y dejar de ser confiable
para losusuarios.
Ing. Mario R. Morales, MBA
Fuentes de Información – Calidad de datos
“A lo largo de 2007, más del 50% de los proyectos de datawarehouse
experimentarán una aprobación limitada, si no un pleno fracaso, ya que no
habrán actuado proactivamente sobre la calidad de los datos.”
Ted Friedman, Gartner Group
Se deben establecer procesos de control o conjunto de controles
(manuales oautomatizados) que localice los errores en datos y
no permita la carga en el DW.
Muchos errores pueden haberse originado en los mismos
sistemas transaccionales. No es una buena opción corregirlos en
el proceso ETL y no modificar las aplicaciones origen. Esta
alternativa es mucho más rápida inicialmente, pero mucho más
costosa a largo plazo.
También se pueden producir errores en el proceso de ETLo al
integrarlos en el DW.
Ing. Mario R. Morales, MBA
Ing. Mario R. Morales, MBA
5
31/05/2014
ETL
Contenido:
Resumen de Procesos del ETL
Actualización
Extracción
Limpieza
Factores incidentes
Eapas para la limpieza
Transformación
Integración
Actualización
Características de las Herramientas ETL
Ing. Mario R. Morales, MBA
Fuentes de Información – Calidad de datosPuntos de control: en la
carga, la auditoría y
reconciliación, y por los
usuarios de BI.
Este proceso nos puede
ayudar a mejorar nuestros
sistemas transaccionales,
corregir errores en el DW,
• Se debe entender que la
mejorar el proceso ETL o
problemática de la calidad de
incluso mejorar los modelos
datos no es un problema de
de negocio por parte de los
los departamentos de TI, sinousuarios de BI.
uno estratégico al que se debe
asignar objetivos, recursos y
planificación.
Ing. Mario R. Morales, MBA
Ing. Mario R. Morales, MBA
6
31/05/2014
Fuentes de Información – Calidad de datos
Qué problemas puede
generar la mala calidad de
datos?:
Tiempo extra para reconciliar
los datos (87%).
Perdida de credibilidad en el
sistema (81%).
Costes extra, por ejemploduplicidades en mailing
(72%).
Insatisfacción de clientes
(67%).
Retrasos en el desarrollo de
nuevos sistemas (64%).
Pérdidas de ingresos (54%).
Problemas de conformidad
(38%).
Otros (5%).
Qué beneficios puede aportar
la calidad de datos?
Simple versión de la verdad
(19%).
Incrementos en la
satisfacción de los clientes
(19%).
Mayor confianza en los
sistemas de análisis (17%).Reducción de costes (13%).
Menor tiempo para
reconciliar los datos (12%).
Incremento de ingresos
(9%).
Otros (12%).
TDWI, Report Series: “Data Quality and the Bottom Line”, por Wayne W. Eckerson, 2002. Mario R. Morales, MBA
Ing.
Fuentes de Información – Calidad de datos
Características que deberían tener los datos para cumplir
una buena calidad:
1.
2.
3.
4.
5.
6.
7.Precisión: ¿Representan los datos con precisión una
realidad o una fuente de datos que se pueda verificar?
Integridad: ¿Se mantienen constantemente la estructura
de los datos y las relaciones a través de las entidades y los
atributos?
Coherencia: ¿Son los elementos de datos constantemente
definidos y comprendidos?
Totalidad: ¿Están todos los datos necesarios?
Validez: ¿Son los valores aceptables...
Regístrate para leer el documento completo.