investigacion
INSTITUTO TECNOLOGICO SUPERIOR DE SAN LUIS POTOSI, CAPITAL
MINERIA DE DATOS Y BIG DATA
ROGELIO MENDIOLA EVANGELISTA
materia
Base de Datos Distribuidas.
MINERÍA DE DATOS:
El análisis deinformación que ya se hacía en la antigüedad, en nuestros días tiene hoy un nombre Minería de Datos. Se define como “el proceso que trata de encontrar información útil o patrones dentro de aquellosgrandes volúmenes de información donde en apariencia no existe nada útil”, o de otro modo más simple, en convertir datos sin aparente utilidad, en conocimiento. Sus aproximaciones son varias, siendo eltérmino inglés "Knowledge Discovery in Databases" -representado por las siglas KDD, o "descubrimiento de conocimiento en bases de datos" el que más se utiliza para asimilarlo a esta disciplina. Aunquetécnicamente debemos saber que KDD es el proceso general y la minería de datos forma parte de él.
Lo que con todo ello se intenta extraer es información o conocimiento que sea:
Válido
Novedoso:que aporte algo nuevo
Potencialmente útil: debe derivar hacia la toma de decisiones de actuación
Comprensible para el usuario: el operador que va a analizar la información o el decisor.
Laminería de datos requiere de la conjunción con otras disciplinas como la estadística, la computación, los sistemas de recuperación de información o ya se están comenzando a modelar sistemas con inteligenciaartificial.
Y para ello la minería exige de la utilización de tecnologías que faciliten el procesamiento de los cálculos, que de modo manual elevarían exponencialmente el tiempo de cálculo.BIGA DATA
Es un derivado de todos estos conceptos anteriores, uniendo a lo anterior tres conceptos básicos:
Volumen de datos: de un tamaño más que considerable
Complejidad de los datos: encuanto a su dificultad de tratamiento, lo que denomina "datos desestructurados" (imágenes, vídeo, texto)
Velocidad de análisis, explotación y decisión: siendo el objetivo máximo el 'tiempo real',...
Regístrate para leer el documento completo.