Ingeniero
Actividad de Investigación
Actividad 2: Investigar los siguientes conceptos y responder a los planteamientos solicitados.
1) Indique por favor el nombre de 3 reportes que usted como Director de área de negocio requiere para su gestión dentro de la organización. Dado que usted conoce el potencial de la plataforma BI, solicitará estos reportes identificando almenos 3 dimensiones, mencione cuáles (10%)
Para el desarrollo de las respuestas 1 y 2, me centro en las mejoras que generaría en la compañía en la cual trabajo, estas se enfoca desde el punto de vista de información hacia el core de la compañía (Cliente externos), bajo la premisa de revisar y analizar los niveles de retorno de las inversiones (Billings).
Objetivo:
Presentar unaespecificación y diseño de alto nivel para la construcción de un Datawarehouse que permita obtener la información de la gestión operativa de la compañía.
Los reportes que se deberán crear, están asociados a la gestión operativa de la compañía, específicamente es necesario identificar los Billings a nivel de:
1. Agencia del grupo.
2. Clientes.
3. Medios / Soportes.
Las dimensiones que seconsiderarán en el modelo corresponden a:
1. Tiempo.
2. Agencia.
3. Medio.
4. Cliente.
Con esta información se coordina una reunión de trabajo para presentar a los diferentes departamentos involucrados en el desarrollo de la plataforma, buscando un sponsor del proyecto (Gerente de operaciones) logrando un acuerdo en el desarrollo de la plataforma bajo los siguientes supuestos (Respuesta 2).2) El departamento de BI le ha solicitado la justificación de cada uno de estos reportes. Identifique qué información requiere y cuál será su utilidad y/o valor agregado para el negocio y su gestión.
A.- Proceso a modelar:
Gestión Operativa de los Billings de clientes considerando (Reportes)
1. Agencia.
2. Valor Real y Proyectado.
3. Mix de Medios.
4. Ratios Claves.5. Medios ON y OFF.
6. Campañas (activas y cerradas).
Requerimientos a Satisfacer:
1. Billings x Agencia real y proyectado acumulado y por mes. Todos los meses o un mes en particular.
2. Billings x Mix de Medio real y proyectado acumulado y por mes.
3. Ratios claves (cumplimiento de billing x agencia, mix de medios, on y off). Acumulado y por mes.
4. Billings x cliente real y proyectado.Acumulado y por mes.
5. Billings x cliente x campaña.
Ejemplo:
B.- Granularidad de la Información:
La información a obtener deberá tener la granularidad de:
1. Año
Ej: Billing totales al año por Agencia.
2. Mes
Ej: Billings reales y proyectado mensuales por cliente.
C.- Dimensiones:
Las dimensiones que se considerarán en el modelo corresponden a:
1. Tiempo.
2.Agencia.
3. Medio.
4. Cliente.
D.- Datos de cálculo y pre cálculo:
Los datos que se deben considerar en la tabla de hechos son:
1. Monto total de Billings reales.
2. Monto total de Billings proyectado.
3. Ratios Claves.
E.- Estructura de Datos:
F.- Duración histórica y dimensiones cambiantes:
Duración Histórica:
1. La duración de los datos deberá ser de 2 año de manera de poderrealizar análisis sobre el año anterior.
Dimensiones cambiantes
1. Cliente: puede cambiar de agencia.
3) Completar la siguiente tabla con una breve definición/descripción de los siguientes términos: Ver ejemplo.
Término
Definición/Descripción
Hadoop
Apache Hadoop es un framework que permite el procesamiento de grandes volúmenes de datos a través de clusters, usando un modelo simplede programación. Además su diseño permite pasar de pocos nodos a miles de nodos de forma ágil. Hadoop es un sistema distribuido usando una arquitectura Master-Slave, usando para almacenar su Hadoop Distributed File System (HDFS) y algoritmos de MapReduce para hacer cálculos.
Map Reduce
MapReduce es un proceso batch, creado para el proceso distribuido de los datos. Permite de una forma simple,...
Regístrate para leer el documento completo.