Topicos Avanzados

Páginas: 6 (1498 palabras) Publicado: 5 de marzo de 2014





13 DE FEBRERO DE 2014


TOPICOS AVANZADOS EN TECNOLOGIAS DE INFORMACION Y COMUNICACION


MTRO. JORGE GOMEZ HERNANDEZ



ALUMNO: LIC. JOSÉ CARLOS PÉREZ HERNÁNDEZCAPITULO I


1.- ¿Qué es dato estructurado y no estructurado?
Investigar los retos de almacenar y administrar datos no estructurados.
La expresión "información no-estructurada" se refiere típicamente a aquellos datos que no están organizados bajo el Modelo de Datos Relacional. Algunos ejemplos comunes de información no estructurada son los archivos de texto, documentos(PDF, Word), imágenes, audio y video, entre otros.

Una factibilidad para administrar los datos no estructurados es Big Data para almacenar y analizar datos estructurados. Google fue el primero en implementar una tecnología con tal fin: Bigtable. Se utiliza para guardar datos de varios proyectos en Google, como por ejemplo los índices de búsqueda Google Earth y Google Finance. Asimismo, escapaz de escalar hasta petabytes, soporta desde procesamiento batch hasta acceso en tiempo real con baja latencia. Bigtable utiliza Google File System (precursor de Hadoop Distributed File System) para almacenar datos y bitácoras.

Para el procesamiento de datos no-estructurados se ha evolucionado a la capacidad de administrar datos estructurados en soluciones basadas en Hadoop.
Apache Hive es unsoftware de Data Warehouse basado en Hadoop. Tiene funciones para sumarizar datos, ejecutar consultas ad-hoc y analizar grandes conjuntos de datos almacenados en Hadoop. Provee un lenguaje de consulta semejante a SQL, conocido como HiveQL. Internamente, HiveQL utiliza MapReduce para ejecutar las consultas. HiveQL es también extensible, en caso de ser necesario un análisis no incluido en ellenguaje, es posible conectar trabajos de MapReduce que implementen la funcionalidad deseada. Hive puede acceder directamente a archivos almacenados en HDFS o, incluso, a "tablas" en HBase.1

Big Data actualmente recopila y analiza fuentes externas de datos, como los medios sociales. Un motivo es que muchas organizaciones están luchando para enfrentar y administrar la incertidumbre inherente enciertos tipos de datos, tales como el clima, la economía o el sentimiento y la sinceridad de la gente en las redes sociales.

Otra razón por la cual los medios sociales y otras fuentes de datos externos no se utilizan con todo su potencial es la falta de habilidades. Contar con las habilidades avanzadas requeridas para analizar datos no estructurados – datos que no encajan en bases de datostradicionales, como texto, datos de sensores, datos geoespaciales, audio, imágenes y video – así como streaming data, sigue siendo un gran desafío para la mayoría de las organizaciones. Sólo 25% de los encuestados dice tener las capacidades necesarias para analizar datos con un alto grado de estructuración, lo cual constituye un gran inhibidor a la hora de obtener el máximo valor de Big Data.2

1Consultado de: http://www.ibm.com/developerworks/ssa/library/bd-almacenamiento-datos/
2 Consultado de http://empresas.it/2013/05/big-data-preguntas-y-respuestas-de-un-experto/
2. ¿Cuáles son los beneficios de una arquitectura almacenamiento de información centralizado contra una arquitectura de almacenamiento en servidores. TCO.

Servidor-Attached Storage Análisis (DAS) TCO
Un aumento de lacapacidad de almacenamiento con DAS significa que más unidades se deben agregar a un servidor existente o en otro servidor de uso general con almacenamiento de conexión deben ser comprados.

Costo de adquisición - el precio por megabyte es relativamente bajo, por lo que los costos de agregar unidades adicionales o un servidor adicional es generalmente razonable.

Costo de implementar - el...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Topicos Avanzados
  • Topicos avanzados
  • Topicos Avanzados De Calidad
  • Topicos avanzados de dirección de operaciones
  • Tópicos avanzados de base de datos
  • topicos avanzados de programacion
  • Topicos avanzados de base de datos
  • TOPICOS AVANZADOS DE PROGRAMACION

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS