Encontrando os dados que realmente importam: um guia de autoajuda

Atualmente, o trabalho do profissional de TI é consumido pelo gerenciamento de um fluxo de dados aparentemente interminável. E como você já deve saber (caso não saiba, sinto muito por informar), a missão do profissional de TI não é apenas monitorar esse mar de informações, mas também interpretá-lo.
No processo de tomada de decisão, há algumas escolhas que não são exatamente decisões; na verdade, algumas delas exigem tão pouca ação cognitiva que geralmente são realizadas em uma sexta-feira à tarde. Infelizmente, os fluxos de dados deixados para a manhã de segunda-feira exigem um pouco de raciocínio e, às vezes, uma pitada de dados adicionais para fazer sentido.

Encontrando o sinal por trás do ruído

Então, você acaba ficando com o que chamamos no setor de uma “montanha de dados”. A diversão começa mesmo quando você precisa determinar quais informações terão valor ou uso prático no futuro e começa a separá-las do resto.
Embora seja uma prática comum em vários processos de datacenter, o monitoramento de infraestruturas é a fase em que as coisas começam a ficar realmente interessantes.
Nesse aspecto do trabalho, isolar os dados críticos do restante é fundamental para garantir o tempo de atividade do sistema e o bom desempenho da TI, pois ambos os fatores afetam bastante o sucesso geral dos negócios.
De acordo com minha experiência, posso dizer que há quatro princípios básicos úteis para o monitoramento:

  • Contexto. Pode parecer óbvio, mas é indispensável ter um conhecimento abrangente do que está sendo monitorado desde o início. Se você recebe alertas de uma infraestrutura importante que continua sendo totalmente funcional, talvez seja melhor ignorar a preguiça e investigar mais a fundo. Os alertas podem indicar um problema grave em desenvolvimento que, se não for resolvido, poderá ter um impacto muito maior no futuro.
  • Gravidade. O conhecimento dos processos do datacenter também deve incluir um insight da classificação dos aplicativos e dos componentes já que, infelizmente, nem tudo neste mundo é criado da mesma forma. Mais adiante, quando tudo começar a dar errado e as coisas pararem de funcionar, será muito útil saber identificar e priorizar o que é mais importante.
  • Simplicidade. Tempo é um luxo que a maioria dos profissionais de datacenter não têm o privilégio de exigir. Para muitos, tirar uma folga contratualmente estabelecida não é uma perspectiva muito provável; consequentemente, ser capaz de dedicar tempo para fornecer soluções de monitoramento superavançadas é algo fora da realidade. Portanto, é importante garantir que as soluções de monitoramento e emissão de alertas sejam simples e de fácil manutenção. Isso ajudará a identificar problemas com rapidez e evitar tempo de inatividade do sistema.
  • Correlação. Sem querer inferiorizar os outros três princípios, mas se você quiser saber o que é mais importante, recomendo que tenha este princípio sempre em mente (e é por isso que ele é o último). Identificar causa raiz é a verdadeira meta final, pois, a longo prazo, é ela que ajuda a poupar tempo. Você deve usar monitoramento e emissão de alertas para correlacionar eventos e ocorrências, o que, por sua vez, ajudará a localizar os problemas originais.

Contexto, gravidade, simplicidade e correlação. Quando ditos em sequência, parecem fazer parte do plano de ação de um livro de autoajuda. Mas, pensando bem, é isso que eles são. Mesmo assim, usar os quatro princípios como base para métodos de monitoramento e emissão de alertas ajudará você a alcançar os objetivos do datacenter e da organização como um todo.

Chris Paap é gerente técnico de produtos da SolarWinds