IT OPERATIONS ANALYTICS, O QUE SÃO?

Blog - IT OPERATIONS ANAYTICS, O QUE SÃO-01

por Antonio Fonte

As constantes mudanças e a crescente complexidade no hardware e software de um Data Center típico acabam dificultando os processos e, em alguns casos, tornam quase impossível identificar a causa-raiz dos problemas operacionais.

Simultaneamente, espera-se dos profissionais que operam os Data Centers e lidam com uma infinidade de métricas de redes e de arquivos de logs, que implementem soluções, de preferência automatizadas, rápidas e eficazes, para os problemas de desempenho e interrupções, bem como para identificar e resolver problemas potenciais antes que os processos de negócios sejam afetados.

Com o advento da Big Data, a operação de TI começou a usar esta disciplina para coletar e transformar a enorme quantidade de dados operacionais em informações relevantes e úteis para atender a demanda descrita e, com isso, surgiu IT Operations Analytics ou simplesmente ITOA.

ITOA

ITOA é, portanto, o uso de fundamentos e tecnologias de Big Data para coletar e correlacionar dados, identificar padrões e determinar causas raiz de problemas para a tomada de decisões informadas sobre operações e serviços de TI.

Ambientes de TI de médio e grande porte geralmente usam ferramentas de monitoramento de desempenho de rede (NPM) e de monitoramento de desempenho de aplicativos (APM). Mas, para identificar o problema que está afetando o desempenho do sistema ou o problema de infraestrutura que está impedindo o acesso a um aplicativo, os profissionais de operação de TI precisam saber o que está acontecendo nessas duas áreas: redes e aplicativos.

Para fazer isto o mais rápido possível, as aplicações de ITOA removem a maioria ou totalidade dos processos manuais envolvidos na correlação de alterações de infraestrutura com o desempenho dos aplicativos, reúnem dados automaticamente para fornecer uma visão em tempo real da performance e identificam anomalias e padrões para simplificar a resolução de problemas.

Como as aplicações de ITOA também fornecem análises preditivas, apontam desvios da normalidade e indicam tendências, os profissionais da operação podem melhor gerenciar recursos, evitar picos de demandas, identificar e resolver proativamente problemas antes que afetem usuários ou a empresa com gargalos e lentidão. Ou pior que este cenário, que culmine com a interrupção de serviços.

Como ITOA funciona

O software ITOA pode ser instalado localmente ou como SaaS (Software as a Service) num provedor de nuvem para coletar e armazenar dados estruturados ou não estruturados dos serviços em tempo real, incluindo sistemas operacionais, hypervisors, dispositivos de redes, sensores, aplicativos, bancos de dados, dispositivos etc. para em seguida normalizá-los e transformá-los em informações utilizáveis.

Tais informações podem incluir diferentes tipos de KPIs, como conexões de rede ativas, utilizações de CPU, padrões de uso de aplicativos, métricas de resposta do usuário, etc.

Muitas ferramentas ITOA “aprendem” o que é normal para um sistema, rede ou ambiente, criam linhas de base, identificam padrões e detectam anomalias em dados de logs e métricas de rede.

Finalmente, o software de análise de operações de TI envia alertas para um console de gerenciamento em tempo real sempre que um KPI excede um limite ou desvia-se de uma norma esperada, recomendando e priorizando ações para permitir que os administradores se concentrem nos problemas mais críticos para lidar com os de menor risco quando o tempo permitir.

ITOA ainda está evoluindo e não há um modelo padrão contra o qual avaliar as diversas ofertas do mercado. Portanto ao avaliar os diversos softwares de ITOA, leve em consideração:

Coleta e relatórios multi domínios

Uma ferramenta abrangente de análise de operações de TI deve ser capaz de pesquisar e coletar dados em tempo real em toda a infraestrutura da organização – física, virtual e em nuvem. Essas informações devem ser automaticamente correlacionadas com eventos por grupos de aplicativos, de usuários, de computadores e assim por diante, fornecendo alertas e relatórios acionáveis para solucionar problemas de desempenho e disponibilidade.

Estabelecimento de linhas de base

A ferramenta deve ter a capacidade de estabelecer linhas de base de sistema, rede ou ambiente a partir de dados de tendências históricas.

Análise automática de logs e análise preditiva

Isso inclui detecção automatizada de anomalias e análise comportamental baseada em “machine learning”. A análise preditiva usa comportamento de autoaprendizagem a partir de eventos passados para prever quando os problemas podem ocorrer no futuro ou para prever as tendências futuras para uso em planejamento de capacidade e alocação de recursos.

Escalabilidade

Se o volume de dados aumenta, o software ITOA deve ser capaz de lidar com a nova carga sem qualquer tempo de inatividade. Idealmente, o software ITOA deveria ter a permissão para ser instalado e entrar em funcionamento em minutos ou horas, ao invés de dias ou semanas. Os painéis devem ser claros, concisos e personalizáveis, permitindo solução eficiente de problemas e análises de causas raízes.

Para informações sobre ITOA e como o Grupo Cimcorp pode ajudar sua empresa a selecionar e implementar uma solução ITOA consulte um Executivo de Contas ou Arquiteto de Soluções de nossa equipe.