Em tempos onde mais aplicações estão sendo entregues com baixa confiança o que podemos aprender com a FEMA?
Resumidamente falaremos do papel do FEMA. Os Estados Unidos possui uma agência cujo objetivo é coordenar as respostas a desastres naquele país. Quando um estado declara estado de emergência ele pode solicitar diretamente ao presidente da república que o FEMA intervenha naquela ocorrência.
A agência FEMA tem um guia de referência que é o NIMS, National Incident Management System, que está disponibilizada a toda população, incluindo setores privados, governamental e organizações sem fins lucrativos.
Com o principal objetivo de trazer práticas e padrões para resolução de desastres, podemos aprender com a FEMA aspectos como treinamento, resiliência, como lidar com crises, como podemos dar respostas aos incidentes e como os alertas devem ser emitidos.
Além disso, como podemos organizar o time que atuará no incidente desde o comandante até o responsável por emitir as notas do incidente.
Caso queiram saber todos os procedimentos em detalhe do NIMS, acessem por esse link
Porque devemos aprender com o guia NIMS?
Problemas em sistemas podem minar rapidamente a confiança de um usuário, por isso como um SRE queremos reduzir ao máximo falhas em nossos sistemas, onde passamos a administrar a confiança gerenciando os riscos.
Assim como o NIMS, nós como SRE podemos lidar com problemas de forma organizada, muito daquilo que o NIMS utiliza podemos transformar para o dia a dia do seu software . O diagrama abaixo dá uma breve sequência de como podemos lidar com os problemas.
E como vocês tem feito a administração de incidentes? Nos deixe saber.