Checkpointing de alta disponibilidad en windows nt

Solo disponible en BuenasTareas
  • Páginas : 12 (2988 palabras )
  • Descarga(s) : 4
  • Publicado : 30 de marzo de 2010
Leer documento completo
Vista previa del texto
SISTEMA EN TIEMPO DE EJECUCIÓN DE ALTA DISPONIBILIDAD BASADO EN PUNTOS DE CONTROL PARA CLUSTERS DE WINDOWS NT

Introducción.
COC (Clusters of Computers) es un sistema paralelo que usa computadoras conectadas a través de redes de alta velocidad. Este sistema ofrece una plataforma rentable para realizar cómputos (cálculos) paralelos de ejecución prolongada y alto desempeño. Por otro lado WindowsNT ha dominado el mercado de Sistemas Operativos de escritorio, y esta siendo empleado crecientemente en muchos campos cruciales. En consecuencia, clusters de computadoras estándar que corren bajo Windows NT/2000 emergen como una alternativa competitiva para el cómputo paralelo de gran escala. Por ejemplo, el Advanced Cluster Consortium (AC3) el cual incluye a la Universidad Cornell, Intel,Microsoft, Dell y Giganet, anunció el 12 de Agosto de 1999 que había completado la instalación de un cluster de computadoras de alto rendimiento de 256 procesadores usando Windows NT 4.0.
Sin embargo, el principal problema con programar en COCs es el hecho de que es propenso al cambio. Computadoras desocupadas podrían estar disponibles para cómputo en un momento y haberse ido el siguiente a causa decarga, fallo o posesión. La probabilidad de que un COC falle se incrementa con el número de nodos, especialmente para aquellos que ejecutan Windows NT que tiene menos estabilidad que UNIX. Además, para programas paralelos de computación científica de gran escala, su tiempo de cómputo es muy largo. Durante computación normal, alguno de los eventos anormales mencionados anteriormente es probable quecause la falla de la aplicación completa. Para evitar este tipo de perdida de tiempo, e incrementar completamente la disponibilidad del sistema, es necesario alcanzar alta disponibilidad para COCs. CRR (Checkpointing & Rollback Recovery, Recuperación de estado Anterior y Punto de Control) ofrece un bajo sobrecosto y una solución total a este problema.
CRR el cual guarda el estado del proceso enalmacenamiento seguro en intervalos regulares o cuando el usuario lo requiera y reinicie el proceso desde su último punto de control almacenado ante una falla del sistema, es un método que evita la perdida de computación completa antes de que ocurra una falla. Puntos de Control para un sistema multiprocesador, como COC es mas complejo que solo hacer que cada procesador tome puntos de controlindependientemente. Para evitar el efecto domino y otros problemas de recuperación, el estado de la comunicación entre procesos se debe almacenar, y el punto de control global debe ser consistente.
CRR Paralelo en sistemas UNIX se ha alcanzado excesivamente y hay muchos sistemas existentes que incluyen MPVM, Condor, Fail-Safe PVM, etc. Pero en Windows NT este tipo de investigación es muy raro. Unpunto de control de hilo y migración se ha implementado en Brazos, un sistema distribuido que soporta el paradigma de la programación paralela en clusters de Windows NT. Chime es otro sistema de procesamiento paralelo en COC que soporta el lenguaje de programación C++ y logra tolerancia a fallos usando el mecanismo Eager Scheduling. Sin embargo, estos sistemas están basados en DSM (Distributed SharedMemory), y no hay ninguno implementado en el estándar existente MPEs, tales como PVM y MPI.
ChaRM-NT es un sistema paralelo en tiempo de ejecución que implementa el mecanismo CRR en Windows NT. Como ChaRM-NT se ubica en la cima del sistema de paso de mensajes, su enfoque puede ser fácilmente adaptado para diferentes sistemas de paso de mensajes. Ahora PVM para NT y HPVM 1.0 (High PerformanceVirtual Machine) son soportados. Y se implementa un nuevo algoritmo de punto de control coordinado que solo requiere O(n) mensajes de control durante la etapa de sincronización, donde n es el numero de procesos que participan. Además, ChaRM-NT implementa su CRR para procesos que se deben a WinNTCkpt, una herramienta CRR para aplicaciones de Windows NT.

PROTOCOLO Y TÉCNICAS CHARM-NT

Un nuevo...
tracking img