• (31) 99973-2709
  • hugomoraismendes@gmail.com

Simian Army (Exército Símio)

Simian Army (Exército Símio)

Simian Army (Exército Símio) é um conjunto de ferramentas e técnicas criadas pela Netflix analisar/testar a disponibilidade de um serviço/ferramenta mesmo em situações caóticas assim descobrindo se o sistema tem tolerância a falhas. Uma vez que nenhum componente pode garantir 100% de tempo de atividade. Logo a netflix projetou uma arquitetura em nuvem onde componentes individuais podem falhar sem afetar a disponibilidade de todo o sistema.

O nome dado a essa técnica é bem interessante, imagine um macaco selvagem com uma arma solto em um datacenter. Pense no potencial destrutivo.

Veja abaixo os integrantes do Simian Army:

Chaos Monkey, uma ferramenta que desativa aleatoriamente as instâncias de produção para garantir que o serviço continue a funcionar sem qualquer impacto no cliente.

Latency Monkey, propositalmente aumenta a latência em respostas dos serviços REST possibilitando testar a recuperação à indisponibilidade dos serviços, assim acaba simulando a degradação dos serviços e mede se os serviços upstream respondem adequadamente.

Conformity Monkey, encontra instâncias que não seguem as práticas recomendadas e as desliga. Por exemplo, se encontrar instâncias que não pertencem a um grupo de escalonamento automático, é um problema esperando para acontecer, logo essa máquina é desligada para ser feito a correção.

Doctor Monkey, utiliza verificações de integridade que são executadas em cada instância, bem como monitora outros sinais externos de integridade (carga de memoria, CPU) para detectar instâncias não íntegras. Depois que as instâncias não íntegras são detectadas, elas são removidas do serviço para serem adequadas.

Janitor Monkey, garante que nosso ambiente de nuvem esteja funcionando sem bagunça e desperdício. Ele procura recursos não utilizados e os desliga.

Security Monkey, é uma extensão do Conformity Monkey. Ele encontra falhas de segurança ou vulnerabilidades, como grupos de segurança configurados incorretamente e encerra as instâncias. Ele também garante que todos os nossos certificados SSL e DRM estejam válidos e não estejam próximos do vencimento.

10–18 Monkey, detecta problemas de configuração e tempo de execução em instâncias atendendo clientes em várias regiões geográficas, usando diferentes idiomas e conjuntos de caracteres.

Chaos Gorilla, é uma evolução do Chaos Monkey que, pois dentro de uma região, desabilita zonas para verificar se o sistema continua funcionando sem impacto para o usuário.

Chaos Gorilla, é semelhante ao Chaos Monkey, mas simula uma interrupção região inteira da AWS. Para verificar se os serviços se reequilibram automaticamente para as zonas de disponibilidade funcionais, sem impacto visível ao usuário ou intervenção manual.

Hugo Mendes

×

Tabela de Conteúdo