Big Data UCuenca
Avances recientes y oportunidades
Cristina L. Abad
Grupo de Investigación en Big Data
ESPOL
Big Data en la ciencia
● Primer paradigma
○
Hace miles de años: investigación empírica
●Segundo paradigma
○
Hace unos cientos de años: investigación
teorética usando modelos y generalizaciones
● Tercer paradigma
○
En las últimas décadas: ciencia computacional
simula fenómenos complejos
●Cuarto paradigma
○
Actualmente: exploración de datos (e-ciencia)
Fuente: Jim Gray, Microsoft Research, 2007
¿Qué es Big Data?
Las 3 Vs:
●
●
●
●
Volumen
Velocidad
Variedad
(Veracidad)
Situaciónactual
Situación actual
¿Cuánta información se genera y
almacena a nivel mundial?
Diferencias con Business Intelligence
Fuente: Storage Networking Industry Association (SNIA), 2012
Tendenciasglobales
Obteniendo valor de los datos
Pasado
Futuro
¿Qué pasó?
Reportes, dashboards
¿Qué está pasando?
Análisis en tiempo real
¿Por qué?
Análisis forense,
minería de datos
¿Por qué?
Minería dedatos en
tiempo real
Fuente: Storage Networking Industry Association (SNIA), 2012
¿Qué sucederá
(posiblemente)?
Análisis predictivo
¿Qué debo hacer al
respecto?
Análisis predictivoInfraestructura
Adopción rápida
...
Usos
●
●
●
●
●
●
Entender y llegar al público (clientes, votantes, etc.)
○ Ej.: Target, campañas de elección popular
Entender y optimizar los procesos de negocios
○ Ej.:mensajería
Mejorar servicios de salud pública
○ Ej.: Google flu trends
Mejorar ciencia e investigación
○ Ej.: bioinformática
Mejorar la seguridad ciudadana y servicios jurídicos
○ Ej.: atraparcriminales, detectar fraude bancario
Mejorar ciudades y países
○ Ej.: ciudades inteligentes
Desafío: Un diluvio de datos
Desafíos
Algunos desafíos:
Las 3 Vs:
●
Escalabilidad elástica
●¿Infraestructura compartida o
personalizada?
● Volumen
● Velocidad
● Variedad
●
Manejo de metadatos
●
¿Infraestructura propia o alquilada?
●
Implementaciones in-house
●
¿Dónde almacenar los datos?
●...
Regístrate para leer el documento completo.