Tolerancia a fallas
TOLERANCIA A FALLAS
Decimos que un sistema falla cuando no cumple con la especificación. Los sistemas de computo pueden fallar debido a una falla en algún componente(procesador, memoria, dispositivo E/S, cable, software, etc.).
Una falla es un desperfecto, causado talvez por un error de diseño, un error de fabricación, error de programación, daño físico, condicionesambientales y muchas otras causas.
Las fallas se clasifican por lo general como transitorias, intermitentes o permanentes.
Las fallas transitorias ocurren una vez y después desaparecen. Si la operaciónse repite, la falla ya no se presenta.
Las fallas intermitentes desaparecen, reaparecen, etc... (Ejemplo un mal contacto de un conector).
Las fallas permanentes son aquellas que continúan existiendohasta reparar el componente con el desperfecto (ejemplo los circuitos quemados).
El objetivo del diseño y construcción de sistemas tolerantes de fallas consiste en garantizar que el sistemacontinué funcionando de manera correcta como un todo, incluso en la presencia de fallas. Las fallas pueden ocurrir en todos los niveles: transistores, circuitos, tarjetas, procesadores, sistemas operativos,programas de usuario, etc.
La confiabilidad de un sistema es en particular importante en un sistema distribuido, debido a la gran cantidad de componentes presentes; de ahí la mayor posibilidad deque falle uno de ellos. Por ejemplo en el procesador se pueden distinguir dos tipos de fallas: fallas silentes y fallas bizantinas.
Las fallas silentes (silenciosos) también conocidas como fallas dedetención, el procesador solo se detiene y no responde a las entradas subsecuentes ni produce mas entradas, excepto que puede anunciar que ya no esta funcionando.
En las fallas bizantinas, cuando unprocesador falla continúa con su ejecución, proporcionando respuestas incorrectas a las preguntas.
En el contexto de la investigación relativa a la tolerancia a fallas, un sistema que tiene la...
Regístrate para leer el documento completo.