Tolerância a Falhas

Os sistemas computacionais estão sujeitos a falhas originadas por fários fatores, internos ou externos: falta de energia elétrica, defeitos de fabricação do hardware, bugs de software ou hardware, erros de projeto de software ou hardware, problemas de desempenho, ataques externos como virus ou negação de serviço, entre outros. A tolerância a falhas visa equipar o sistema com a redundância necessária (temporal ou espacial) para que o mesmo continue sua operação normal, sem interrupções, mesmo na ororrênca dessas falhas. Entre os mecanismos mais utilizados podemos destacar o uso de replicação de processos, protocolos de difusão confiável, uso de memória estável, checkpointing, etc.
 
Pesquisadores: Fabíola Gonçalves Pereira Greve, George Lima