Google Flu y el rey desnudo
Desde la perspectiva del Big Data la Estadística es
mayores a los efectivamente registrados en la epidemia
invisible. Esto es al menos lo que piensan dospresidentes
de 2012-2013. Finalmente, dichos errores muestran una
sucesivos de ASA (
fortísma autocorrelación positiva. Empezando en Agosto
American Statistical Association):
Althoughstatistics is mentioned in passing statisticians are nearly invisible N. Schenker, M. Davidian y
R. Rodríguez, AMSTAT News, June 2013
La industria de la información tiene un gran interés
de 2011, en100 de 108 semanas GFT sobreestimó la cifra
de casos de gripe de CDC (D. Lazer, R. Kennedy, G.
The Parable of Google Flu: Traps
King y A. Vespignani:
in Big Data Analysis.
Science, vol.343, 14 March 2014).
en defender la idea de que los datos, sólo los datos, son
La comunidad estadística y otros autores han empezado
sucientes. Tal como dijera Chris Anderson:
a darsecuenta de que, en realidad, el rey estaba desnudo,
The sheer
volume of data would obviate the need of theory and even
the scientic method
Este tipo de armación no es una extrapolación exageradade un individuo.
John Batelle en su libro de
The Search: How Google and Its Rivals Rewrote
the Rules of Business and Transformed Our Culture , ya
2005
que la arrogancia casi innita delnadie tiene los datos,
la potencia de cálculo y los estadísticos que tiene Google
no son nada más que un traje inexistente si no se coloca
estadística por medio.
Recomiendo el artículo de TimHarford en el Financial Times del domingo 28 de Marzo
de 2014:
Big Data: Are We Making a Big Mistake?
defendía que la información procedente de las búsquedas
La completa desnudez de GFTpone de maniesto el
proporcionaba una visión exacta de las necesidades de la
peligro de las correlaciones sin atender al signicado de
gente.
las búsquedas.
Hace tan sólo unos meses...
Regístrate para leer el documento completo.