Se a materialização de falhas em produção é uma das certezas do gerenciamento dos serviços de TI, um posicionamento racional seria, o que vamos fazer para abordar esta situação com o menor impacto ao negócio? DevOps propõe uma estratégia de reconstruir mais do que reparar. Vamos entender melhor seus fundamentos.

ITIL

TI

hnz-consultoria-e-treinamentos-blog-o-temos-uma-certeza-em-ti-os-sistemas-vao-apresentar-falhas-em-producao-itil

Não é uma resposta fácil, devido a que as fontes das falhas são muitas vezes desconhecidas. As soluções de software estão se tornando cada vez mais complexas e tornando cada vez mais difícil sua gestão. Nos modelos clássicos como ITIL, a proposta é composta por uma série de sugestões:

– Enriquecer procedimentos e soluções de contorno, para encurtar os tempos de resolução,

– Estruturar equipes em 3 ou mais níveis de expertise  para distribuir o trabalho até direcionar os esforços as equipes especialistas caso seja um problema mais específico,

– Documentar uma base de conhecimento equacionar melhor as capacidades dos profissionais com recursos de resolução e diagnóstico,

– Utilizar uma Banco de Dados de Gerenciamento da Configuração, que ajude a localizar falhas e impactos,

– Orientar para resolver o incidente primeiro, de acordo com a criticidade e posteriormente investigar a causa raiz, etc.

No fundo estas ações visam a aumentar o controle e a administração de um trabalho extremamente fragilizado por tarefas manuais. Grandes lotes de entrega (releases) causando altos riscos na gestão, processos de mudança e liberação executados em forma manual, ambientes providenciados e configurados manualmente com dívidas técnicas altíssimas, falta de domínio das soluções por documentação escassa e obsoleta, profissionais com visão limitada à sua especialidade específica na abordagem das soluções, a resolução de incidentes pressionada por ambientes indisponíveis comprometendo o funcionamento do negócio.

DevOps

DevOps propõe uma mudança radical na maneira clássica de trabalhar tanto a mudança como a operação.  Se por um lado se adotam disciplinas para realizar ações contínuas, que no fundo é fundir o que chamávamos de projeto com operação, implantando pequenas diferenças da solução existente em produção, com impacto muito controlado e realizado frequentemente, por outro para que tudo isto funcione é necessário privilegiar a alta qualidade.  Isso permite dar foco na falha e usar rollback rápidos caso se materializem falhas. Os direcionamentos neste contexto são diferentes, caso se apresente uma falha, por exemplo algumas delas:

– Há necessidade de monitorar intensamente o comportamento das soluções, usando ferramentas de gestão de eventos e telemetria

– Mecanismos de detecção e auto recuperação são importantíssimos para reduzir impactos com o uso de instrumentação

– Os ambientes em toda a cadeia de valor da entrega são providenciados em forma rápida e padronizados o que permite ter soluções uniformes para realizar testes confiáveis

– Há necessidade de detectar quanto antes uma possível falha e recuperar rapidamente o ambiente, usando implantação em paralelo como blue-green, canário ou até feature-flag, como também implantações quentes em horário de expediente.

– Aumento da qualidade com a incorporação de testes automatizados em toda a cadeia de entrega, controle do débito técnico, realizando ações de melhoria contínua, kaizen, kata, etc.

– Gerenciamento da mudança usa mecanismos de transformação na classificação de normais para padrão, justificando um alto grau de controle no rollback como na disponibilização de soluções controladas de baixo risco

– Gerenciamento de Incidentes mais focado na auto-recuperação com a reconstrução do que no reparo, permitindo que a equipe foque na busca da causa raiz em ambiente isolado de produção, não comprometendo o negócio.

– Estabelecer uma intensa participação de todos na responsabilidade de olhar para as fragilidades e aplicar soluções que não dependam mais dos especialistas e sim de todos.

Conclusão

As práticas para estabilizar a gestão da TI são cada vez mais diversas, existindo uma fonte gigantesca de uma comunidade DevOps muito ativa em trazer soluções concretas para mudar a maneira de trabalhar artesanal na dependência das especialidades específicas e parciais das ações braçais.

Artigos relacionados:

O poder da VOZ do cliente ou VoC dentro da TI

O que é integração contínua e quais são os benefícios?

Conheça nosso canal no Youtube 

Leave a Reply