Uma avaliação de riscos para o Data Center não envolve unicamente o tempo de inatividade não planejado. Ela deve incluir possibilidades de perda de receita, falhas em equipamentos, problemas com clientes e até mesmo riscos à saúde dos profissionais do setor. Para iniciar um projeto de redução de riscos no Data Center é preciso responder a uma questão: o que pode impactar meus sistemas e dados críticos?
E é exatamente aí que a avaliação de riscos deixa clara sua importância, pois a partir dela que essa pergunta será respondida e os possíveis riscos serão identificados, tornando mais fácil o entendimento de quão perigosos eles podem ser, como podem impactar nos negócios e, principalmente, como reduzir a possibilidade de que ocorram. Assim, a avaliação de riscos contribui para identificar, entender e analisar o nível de risco a que o data center está exposto além de avaliar a tolerância da infraestrutura e ajudar na elaboração de uma estratégia de mitigação.
Como realizar uma avaliação de riscos para o Data Center
Proteger e manter a infraestrutura de TI exige um planejamento estratégico de gerenciamento de infraestrutura de Data Center (DCMI) de longo prazo. Para isso, algumas práticas podem ser adotadas:
Avaliação de risco integrada
O Data Center convencional surgiu há algumas décadas, já serviços de colocation e na nuvem são mais recentes. Além disso, o trabalho remoto e a adoção do BYOD também impactam na forma que a avaliação de riscos é realizada. Isso significa que ela não pode se aplicar unicamente ao Data Center, mas precisa ser levada para toda a organização, já que qualquer fator de risco para o Data Center pode ter sido gerado por fatores externos à infraestrutura de TI e precisa ser tratado simultaneamente.
Portanto, as organizações precisam de ferramentas e processos para monitorar cada área do Data Center para lidar com os riscos quando surgirem.
A avaliação de riscos vem antes da gestão de riscos
A avaliação de riscos é o primeiro passo para a criação de uma estratégia de gestão de riscos. Isso começa com uma análise do projeto de instalação, arquitetura de TI, topologia e sustentabilidade da operação. Essa avaliação também precisa considerar se houve alguma interrupção anterior e identificar a causa raiz para evitar que ocorra novamente. Além disso, caso a infraestrutura seja híbrida, com diversos Data Centers instalados, cada ativo precisa ser analisado para determinar sua resiliência, estimando possíveis danos e os custos para recuperação e, claro, descrevendo as ações que devem ser tomadas.
Tipos de riscos do Data Center
Como cada infraestrutura é diferente, não existe uma estratégia única para a avaliação de riscos no Data Center, o que pode tornar o processo de categorização mais difícil. Por isso, alguns fatores devem ser considerados:
Riscos de queda energia
A interrupção no fornecimento de energia é uma ameaça real para Data Centers de missão crítica. Por isso, as organizações precisam adotar uma estratégia de resiliência, que incorpore redes backup para manter os servidores e sistema de resfriamento em funcionamento. Contar com fontes de energia redundante e geradores de backup são alguns dos recursos recomendados.
A segurança contra quedas de energia também envolve sistemas para o carregamento de baterias UPS, tipos de bateria de backup, sistemas de armazenamento de combustível e o protocolo para seu manuseio.
Riscos ambientais
Riscos ambientais incluem calor ou frio excessivo e ruídos altos, que podem prejudicar funcionários que passam muito tempo no ambiente, o que os torna suscetíveis a hiper ou hipotermia e perda auditiva, e desastres naturais, como uma inundação ou incêndio. Esses riscos podem variar de acordo com a época do ano ou equipamento utilizado, exigindo monitoramento contínuo do ambiente.
Felizmente, muitos deles podem ser previstos e mitigados, por exemplo, construindo Data Centers em regiões de clima mais frio ou em locais que ofereçam opções de energia renovável para reduzir os custos com o resfriamento dos equipamentos, ou, ainda, investindo em detectores de fumaça por aspiração, que detectam focos de incêndio em estágio precoce. Também é recomendável evitar áreas próximas a aeroportos, fábricas de produtos químicos, bases militares e corpos d’água.
Riscos de segurança
Falhas de segurança incluem desde ataques cibernéticos até a invasão do ambiente físico do Data Center. Bugs em sistemas permitem que pessoas sem autorização acessem dados e aplicativos. Problemas com câmeras e controle de acesso também favorecem a invasão do ambiente.
Ataques cibernéticos podem ser tratados com a adoção de um sistema de segurança de dados robusto, com a implementação de autenticação multifator, verificação de vulnerabilidades, backups regulares e controle de acesso baseado em função. Já a segurança física do Data Center exige a adoção de sistemas inteligentes de controle de acesso, com câmeras e sensores de movimento e acesso biométrico.
Riscos de falhas nos sistemas
É fundamental identificar e corrigir vulnerabilidades rapidamente em toda a infraestrutura de TI. Isso exige uma arquitetura de rede e conectividade resiliente e redundante, com servidores alocados em diversos locais, clustering, espelhamento e duplicação para garantir acesso e entrega dos recursos necessários para o dia a dia de trabalho.
Data Centers modernos contam com uma plataforma resiliente, segura e autorrecuperável, mas isso não elimina a necessidade de realizar backups de dados para agilizar a recuperação e garantir que, mesmo no caso de algum incidente, o acesso às informações não seja interrompido.
Planejamento deficiente para recuperação de desastres
Identificar e reduzir os riscos pode não ser suficiente para evitar que um incidente interrompa uma operação. Por isso, qualquer estratégia de gerenciamento de riscos precisa de um plano eficiente de recuperação de desastres, com a descrição das ações a serem tomadas para garantir uma recuperação rápida. Isso pede a implementação de sistemas de monitoramento de fatores ambientais e tecnológicos que alertem os responsáveis quando algo inesperado acontecer.
Reduzir riscos é responsabilidade de todos
Claro, é impossível eliminar todas as possibilidades que podem interromper uma operação, entretanto, a avaliação de riscos precisa ser vista como uma importante ferramenta para a tomada de decisões voltada para a redução no tempo de inatividade. Da mesma forma, adotar processos e metodologias padronizadas, como DevOps, contribui para otimizar fluxos e processos, alinhando a gestão da infraestrutura de TI aos objetivos de negócios para torná-los mais resilientes.
Conheça as soluções para Data Centers e redes de comunicação da Tecnocomp e garanta o desempenho dos recursos TIC disponíveis na sua empresa. Nossos profissionais oferecem suporte especializado para otimizar a qualidade e reduzir custos, mantendo a conformidade com as definições do ITIL e garantindo gerenciamento e governança eficientes.