Tareas
Algunos enfoquesde deduplicación actúan a nivel de archivo, pero otros van más allá y examinan los datos a nivel de subarchivo o de bloque. La determinación del carácter único a nivel de archivo o de bloques presentaventajas, aunque los resultados varían. Las diferencias residen en la cantidad de reducción conseguida mediante cada enfoque, y en el tiempo que taDRa cada enfoque en determinar qué es único.Deduplicación por archivos
La deduplicación de datos por archivo, también denominada almacenamiento de instancia única, (SIS), compara un archivo que hay que safeguardr o archivar con los que ya estánalmacenando, a través de la comparación de sus atributos con un índice. Si el archivo es único, se almacena y se actualiza el índice; si no lo es, sólo se almacena un indicador que apunta al archivoexistente. El resultado es que sólo se salva un ejemplar del archivo, y las copias subsiguientes se sustituyen por un “talón” que remite al archivo original.
Deduplicación por bloques
La deduplicación dedatos por bloques actúa a nivel de subarchivo. Como su propio nombre indica, el archivo se divide en segmentos – fragmentos o bloques – que se cotejan con la información almacenada previamentebuscando posibles redundancias.
El enfoque más popular para identificar duplicados consiste en asignar un identificador a cada fragmento de datos, utilizando un algoritmo de Hash, por ejemplo, que generaun ID o “huella dactilar” única para ese bloque. A continuación se compara el ID con un índice central. Si el ID ya existe, significa que el segmento de datos ya se ha procesado y almacenado antes....
Regístrate para leer el documento completo.