DECRETO Nº 3810 DE 1º DE FEVEREIRO DE 2021
Institui o ‘Plano de Continuidade de Serviços de TI’ no âmbito do Poder Executivo Municipal de São Manuel.
RICARDO SALARO NETO, Prefeito Municipal de São Manuel, Estado de São Paulo, no uso de suas atribuições legais, conferidas pelo artigo78, incisos IX da Lei Orgânica do Município;
DECRETA:
Art. 1º Fica instituído o “Plano de Continuidade de Serviços de TI (PCTI)” no Município de São Manuel, parte integrante deste Decreto, instrumento estratégico de avaliação de riscos, recuperação de dados e comunicação de processos, visando à continuidade dos serviços de Tecnologia da Informação – TI, no âmbito do Poder Executivo Municipal de São Manuel.
Parágrafo único. O Plano de Continuidade de TI (PCTI) abrange as estratégias necessárias à continuidade dos serviços de TI essenciais, para contingência, continuidade e recuperação de dados e informações quando da ocorrência de desastres, insurgência ou ocorrência de risco tecnológico desconhecido ou vulnerabilidade digital.
Art. 2º A efetivação do Plano de Continuidade de TI (PCTI) será realizada pelo Comitê de Desastre, Recuperação, Comunicação (CDR), instituído por ato próprio do Executivo Municipal
Art. 3º Este Decreto entrará em vigor na data de sua publicação.
São Manuel, 1º de fevereiro de 2021.
RICARDO SALARO NETO
PREFEITO MUNICIPAL
Registrado na Seção de Expediente em 1º de fevereiro de 2021.
LUCIANA FIDENCIO BELOTI SHINOZAKI
CHEFE DA SEÇÃO DE EXPEDIENTE
PLANO DE CONTINUIDADE DE SERVIÇOS DE TI
- APRESENTAÇÃO
Uma vez que falhas nos serviços de TI impactam diretamente na continuidade da prestação dos serviços públicos, almeja-se com este plano promover medidas de proteção rápidas e eficazes para os processos críticos de TI relacionados aos sistemas essenciais, em casos de incidentes graves ou desastres.
- ESCOPO
O Plano de Continuidade de TI (PCTI) abrange as estratégias necessárias à continuidade dos serviços de TI essenciais: contingência, continuidade e recuperação. Está voltado a conceder continuidade aos processos definidos como críticos para a TI da Prefeitura de São Manuel.
- SERVIÇOS ESSENCIAIS
São os seguintes serviços considerados essenciais, por ordem de priorização para o acionamento e execução deste Plano.
Serviço |
Criticidade[1] |
RPO[2] |
RTO[3] |
Impacto[4] |
Financeiro |
Legal |
Imagem |
Operacional |
ERP |
Alta |
Backup mais recente |
2 dias |
Indefinido |
Alto |
Alto |
Alto |
Active Directory |
Alta |
Backup mais recente |
2 dias |
Indefinido |
Alto |
Alto |
Alto |
Serviços on-line |
Alta |
Backup mais recente |
1 dia |
Indefinido |
Baixo |
Alto |
Médio |
Link de dados |
Média |
Redundância |
1 dia |
Indefinido |
Médio |
Médio |
Médio |
E-mail institucional / webmail |
Média |
Backup mais recente |
1 dia |
Indefinido |
Médio |
Médio |
Médio |
Portal da Prefeitura / website |
Média |
Backup mais recente |
1 dia |
Indefinido |
Médio |
Médio |
Médio |
Diário Oficial Eletrônico |
Baixa |
Backup mais recente |
1 dia |
Indefinido |
Alto |
Baixo |
Médio |
- PRINCIPAIS AMEAÇAS
Este plano deve ser acionado quando da ocorrência de cenários de desastres que apresentam risco à continuidade dos serviços essenciais.
EVENTO DE DESASTRE |
POSSÍVEIS CAUSAS |
Interrupção de energia elétrica |
- Causada por fator externo à rede elétrica do prédio ou de sua localidade, com duração da interrupção superior a 6 horas.
Causada por fator interno que comprometa a rede elétrica do prédio com curtos-circuitos, incêndio e infiltrações.
|
Falha na climatização da sala de servidores |
Superaquecimento dos ativos, devido a falha no sistema de refrigeração do ambiente. |
Indisponibilidade de rede/circuitos |
Rompimento de cabos de interconexão decorrente da execução de obras públicas, desastres ou acidentes. |
Falha humana |
Acidente ao manusear equipamentos críticos. |
Ataques internos |
Ataque aos ativos do Data Center. |
|
Incêndios que comprometam os serviços de TI. |
Desastres naturais |
Terremotos, tempestades, alagamentos etc. |
Falha de Hardware |
Falha que necessite reposição de peça ou reparo, cujo reparo ou aquisição dependa de processo licitatório. |
Ataque cibernético |
Ataque virtual que comprometa o desempenho, os dados ou configuração dos serviços essenciais. |
- PAPÉIS E RESPONSABILIDADES
- Comitê de Desastre/Recuperação/Comunicação (CDR):
O Comitê de Desastre, Recuperação, Comunicação (CDR) deverá avaliar o Plano de Continuidade de TI periodicamente e decidir pelo seu acionamento quando da ocorrência de desastres, respondendo em nível institucional pela execução deste e demais ocorrências relacionadas.
O Comitê deverá incluir autoridades em nível institucional e tomadores de decisão do Município de São Manuel, sendo certo que o líder desta equipe administrará e manterá o Plano de Administração de Crise.
Será ainda o Comitê responsável por todas as comunicações durante um desastre. Especificamente, eles se comunicarão com os funcionários, munícipes, autoridades e fornecedores, se necessário.
- Equipe técnica
A equipe técnica será responsável pelas instalações físicas que abrigam sistemas de TI e pela garantia de que as instalações de alternativa serão mantidas adequadamente. Ela avaliará os danos e supervisionará os reparos. Neste caso, quando ocorrer, a equipe administrará e manterá o Plano de Recuperação de Desastre.
Caberá à equipe técnica avaliar os danos específicos de qualquer infraestrutura de rede e fornecer dados e conectividade de rede, incluindo
WAN,
LAN ou de infraestrutura externa junto aos prestadores de serviço. Fornecerá ainda infraestrutura de servidores físicos e virtuais, necessária para que a TI execute suas operações e processos essenciais durante um desastre.
Garantirá que as aplicações essenciais funcionem como exigido, para atender aos objetivos de negócios em caso de e durante um desastre. A equipe técnica será a principal responsável por assegurar e validar o desempenho das aplicações essenciais.
A equipe técnica fornecerá aos funcionários as ferramentas de que estes necessitarem para desempenhar suas funções da forma mais rápida e eficiente possível. Eles precisarão provisionar todos os trabalhos do Município de São Manuel na solução de contingência e aqueles que trabalham remotamente com as ferramentas específicas à sua atuação. Neste caso, a equipe administrará e manterá o Plano de Continuidade Operacional.
Por fim, a equipe técnica analisará as perdas e mapeará a quantidade de dados perdidos e o tempo de recuperação desses dados, e formulará estratégia de recuperação de dados de acordo com as políticas pré-estabelecidas.
Deverá prover mecanismos de segurança no ambiente principal e alternativo. Resguardará aplicações e dados, evitando que desdobramentos de segurança afete o acionamento da continuidade, cuja proteção estará contida na política de segurança.
- INVOCAÇÃO DO PLANO
Este plano será acionado quando da ocorrência de algum dos cenários de desastres, a insurgência ou ocorrência de um risco desconhecido ou caso uma vulnerabilidade tenha grande possibilidade de ser explorada. O plano também poderá ser invocado em casos de testes ou por determinação do CDR, em conjunto com a alta administração do Município de São Manuel. Os integrantes do Comitê serão responsáveis por acionar os contatos e partes interessadas, prioritariamente por telefone, ou pessoalmente, caso seja possível.
- LISTA DE ACIONAMENTO DE CONTATOS
|
|
|
|
Chefe da Seção de CPD |
(14) 3812-4400, ramal 5203 |
|
Centro de Processamento de Dados |
Equipe técnica contratada |
(14) 3812-4400, ramal 4411 |
|
Centro de Processamento de Dados |
- MACROPROCESSOS
Este plano tem seus macroprocessos definidos nas atividades a seguir e se desmembra em planos específicos para cada área de atuação, quando da ocorrência de um desastre.
O Plano de Continuidade de Serviços de TI consiste em:
- Plano de Continuidade Operacional (PCO):Garantir a continuidade dos serviços essenciais de TI críticos na ocorrência de um desastre, enquanto recupera-se o ambiente principal.
- Plano de Administração da Crise (PAC):Definir atividade das equipes envolvidas e orquestrar as ações de contingência e comunicação durante e após a ocorrência de um desastre, com intuito de minimizar impactos até a superação da crise.
- Plano de Recuperação de Desastre (PRD): Planejar e agir para que, uma vez controlada a contingência e passada a crise, a TI retome seus níveis originais de operação no ambiente principal.
- ESTRATÉGIAS DE CONTINUIDADE
A estratégia de continuidade para o cenário atual da TI e serviços essenciais está estabelecida da seguinte forma:
- Tipo: Backup
Descrição: Cópias de
backup dos sistemas essenciais armazenadas em locais alternativos.
- Tipo: Redundância
Descrição:
link de dados alternativo, disponível automaticamente caso o
link de dados principal sofra alguma intercorrência.
- Ações de contingência/recuperação
Mapeamento da perda de dados e ativos, restabelecimento de toda a estrutura afetada e, após o ambiente principal estar operacional, provimentoda recuperação dos dados em
backups.
As ações de contingência e recuperação são detalhadas nos subplanos a seguir.
- PLANO DE CONTINUIDADE OPERACIONAL (PCO)
Este plano descreve os cenários de inoperância e seus respectivos procedimentos alternativos planejados, definindo as atividades prioritárias para garantir a continuidade dos serviços essenciais.
- Objetivo e escopo
É escopo deste plano garantir ações de continuidade durante e depois da ocorrência de uma crise ou cenário de desastre, tratando-se apenas das ações de contingência definidas na estratégia.
São objetivos do PCO:
- Prover meios para manter o funcionamento dos principais serviços de TI e a continuidade das operações, dos sistemas essenciais.
- Estabelecer procedimentos, controles e regras alternativas que possibilitem a continuidade das operações de TI durante uma crise ou cenário de desastre.
- Execução do plano
- Avaliação de Impacto de Desastre
Identificada a ocorrência de um incidente ou crise, o responsável deverá verificar a dimensão do impacto, extensão e possíveis desdobramentos do ocorrido.
- Acionamento do Plano
Dado o aval pelo CDR ao acionamento do plano, a equipe convocará uma reunião de emergência, com o intuito de coordenar prazos e orquestrar as ações de contingência, informar aos envolvidos as ações de contingência com a priorização dos serviços essenciais.
- Contingência de Backup
Devem ser adotadas as seguintes ações de contingência e continuidade por processo ou serviço essencial:
|
Instrução |
Duração |
Observação |
Resultado |
01 |
Verificar status da aplicação de backup e estimar impacto de perda de dados (janela) |
|
|
|
02 |
Identificar Jobs de backups cujos dados em questão foram afetados |
|
|
|
03 |
Estimar volume de dados a serem recuperados, tempo de recuperação dos dados e possíveis perdas operacionais |
|
|
|
04 |
Atestar retorno do funcionamento do ambiente principal |
|
|
|
05 |
Testar a aplicação de backup após desastre |
|
|
|
06 |
Validar políticas de backup implementadas |
|
|
|
- Encerramento do PCO
Uma vez validado o funcionamento do retorno dos sistemas essenciais e estabilidade do
Data Center, deverá ser emitido um parecer relatando as atividades realizadas neste PCO. Informar à equipe de CDR o retorno das atividades.
- PLANO DE ADMINISTRAÇÃO DE CRISES (PAC)
Este plano especifica as ações ante os cenários de desastres. As ações incluem gerir, administrar, eliminar ou neutralizar os impactos, inerente ao relacionamento entre os agentes envolvidos e/ou afetados, até a superação da crise, através da orquestração das ações e de uma comunicação eficaz.
- Objetivo
O objetivo deste plano é garantir a comunicação, gerenciar as crises e viabilizar uma compreensão linear a todos os envolvidos das ações antes, durante e após a ocorrência de uma catástrofe.
São objetivos específicos do PAC:
- Garantir a segurança à vida das pessoas;
Minimizar transtornos sobre os desdobramentos de incidentes e estimular o esforço em conjunto para superação da crise;
Orientar os funcionários e demais colaboradores com informações e procedimentos de conduta;
Informar a sociedade em tempo e com esclarecimentos condizentes com o ocorrido.
- Execução do Plano
- Comunicação na ocorrência de um desastre
Na ocorrência de um desastre será necessário entrar em contato com diversas áreas, principalmente as afetas, para informá-las de seu efeito na continuidade dos serviços e tempo de recuperação. O CDR será responsável por contatar estas unidades e passar as informações pertinentes a cada grupo, setor ou seguimento. A comunicação com cada parte ocorrerá da seguinte forma:
- Comunicar as autoridades
A prioridade do CDR será assegurar que as autoridades competentes tenham sido notificadas da catástrofe, principalmente se envolver risco às pessoas, fornecendo informações de localização, natureza, magnitude e impacto do desastre.
Autoridade |
Número de contato |
Data/hora do registro |
Número da ocorrência |
Polícia Militar |
190 |
|
|
Guarda Civil Municipal |
199 |
|
|
Bombeiros |
193 |
|
|
Ambulância |
192 |
|
|
- Comunicação após um desastre
Após reunião com a equipe técnica, o CDR elaborará um breve programa de comunicação para acionar as partes envolvidas e afetadas de modo a manter todos bem informados e passar a todos a perspectiva dos esforços necessários para o restabelecimento dos serviços inativos.
- Comunicação com os funcionários
O CDR deverá prover um meio de contato específico para este fim, com intuito de que todas as Diretorias do Município de São Manuel mantenham-se informadas da ocorrência de um desastre e da inatividade dos serviços essenciais de TI.
Caso não haja conectividade ou linha telefônica disponível, ceder essas informações por meio de publicações, ou outra estratégia definida no momento.
- Comunicar as Diretorias do Município de São Manuel
Acionar diretamente as unidades afetadas pelo desastre e fornecer contato. Informar a natureza, o impacto e a abrangência da catástrofe, como também as ações de contingência em andamento.
- Comunicar colaboradores externos, cidadãos e mídia
O CDR, em consonância com a Diretoria Municipal de Comunicação, deverá fornecer informações pertinentes aos colaboradores externos, munícipes em geral e mídia. Deverá publicar em meios oficiais e de ampla divulgação informações sobre o ocorrido.
- Comunicação retorno das operações
Comunicar a todas as partes supracitadas quando ocorrer o retorno das operações à normalidade.
- Encerramento do PAC
Uma vez validado o funcionamento do retorno dos sistemas essenciais e estabilidade do
Data Center, o CDR entrará em contato com as partes descritas neste plano, provendo as informações de retorno das operações com as informações de
status dos serviços essenciais.
Caberá ao CDR compor relatório com relação das atividades necessárias após a ocorrência do desastre como remanejamento dos canais de informação, abertura e acompanhamento de chamados correlatos ao ocorrido.
- PLANO DE RECUPERAÇÃO DE DESASTRES (PRD)
Este plano descreve os cenários de inoperância e seus respectivos procedimentos planejados, definindo as atividades prioritárias para restabelecer o nível de operação dos serviços no ambiente afetado, dentro de um prazo tolerável.
- Objetivo e escopo
É escopo deste plano garantir o retorno das operações do ambiente principal depois da ocorrência de uma crise ou cenário de desastre, tratando-se apenas dos ativos, conexões e configurações deste ambiente.
São objetivos do PRD:
- Avaliar danos aos ativos e conexões do Data Center e prover meios para sua recuperação.
Evitar desdobramentos de outros incidentes na facilidade principal.
Restabelecer o Data Centerdentro do prazo tolerável.
- Execução do Plano
- Identificar ativos danificados
A equipe técnica deverá identificar e listar todos os ativos danificados da ocorrência do desastre.
- Identificar acessos interrompidos
A equipe deverá identificar as interrupções de conexões e acessos gerados após o desastre, informando se a abrangência está na rede local, rede WAN, ou com o provedor de serviços.
- Listar serviços descontinuados
A equipe técnica deverá mapear quais serviços foram descontinuados, contendo as informações de perda de ativo e de conexão, com intuito de levar ao conhecimento do CDR. O relatório deverá abranger todos os componentes necessários à plena operação da aplicação como servidores, máquinas virtuais, banco de dados, firewall,
storage,
routers e
switches, bem como respectivas configurações de
proxy, DNS, rotas,
Vlans etc.
- Elaborar cronograma de recuperação
Após o mapeamento das perdas e impactos, a equipe técnica elaborará um breve cronograma de recuperação das aplicações, levando em consideração:
- A priorização dos serviços essenciais, ou determinação de nível institucional.
O RTO (Recovery Time Objective) definido para cada serviço essencial.
- A força de trabalho disponível.
- Substituição de ativos e equipamentos
Em caso de perda de ativos, deverá ser imediatamente informado ao CDR a necessidade de aquisição de ativos perdidos que não puderem ser recuperados. A equipe irá mensurar quanto tempo a aquisição irá impactar o RTO
(Recovery Time Objective) de cada serviço, comunicando ao CDR se há alguma solução alternativa a ser tomada enquanto é realizada a aquisição.
A equipe deverá verificar quais ativos foram danificados, se estão cobertos por garantia e se poderá ser acionada neste caso através de fornecedores.
- Reconfiguração de ativos e equipamentos
A equipe deverá verificar que as configurações dos ativos reparados ou substituídos estão em funcionamento pleno. Caso não estejam, deverá prover cronograma estimado para configurar estes ativos, informando aoCDR.
- Teste de ambiente
O ambiente principal do
Data Center antes do
recovery dos dados do
backup deverá ser testado, a fim de garantir que o processo de recuperação ocorra conforme o planejado.Os testes incluem a garantia dos mesmos níveis de capacidade e disponibilidade dos serviços essenciais antes do desastre.
- Recuperação dos dados do backup
Proceder a recuperação dos dados para as aplicações, seja do
storage ou fitas de
backup.
Validar as configurações e funcionalidades dos sistemas.
A validação pode ser realizada pelos testes automatizados de monitoramento dos serviços ou por equipe designada.
- Encerramento do PRD
Ao término do procedimento de recuperação, as informações serão consolidadas em parecer específico informado o horário de restabelecimento de cada serviço, equipamentos adquiridos, procedimentos de recuperação realizados e fornecedores acionados.
- DOCUMENTO DE VALIDAÇÃO E TESTE
O Plano de Continuidade de Serviços de TI será testado e validado em reunião entre o CDR e equipe técnica anualmente ou com a insurgência de novos fatores de risco, ou com a inclusão de um novo serviço no plano de continuidade.
Deverão ser realizados os seguintes testes:
Teste de mesa: Teste de complexidade simples, no qual é realizada uma análise (crítica, ensaios de execução) dos procedimentos e informações descritas, com o objetivo de atualizar e/ou validar os procedimentos e as informações contidas no Plano.
Simulação no ambiente (Simulação de situação real de interrupção): Teste de complexidade média no qual uma situação “artificial” é criada, por exemplo, é realizada a parada de um processo em horários diferentes das operações diárias (finais de semana, após o expediente etc.), sendo o resultado utilizado para validar se os planos possuem as informações necessárias e suficientes, de forma a permitir recuperação de determinado arranjo de contingência ou processo com sucesso.
- APROVAÇÃO DO PLANO DE CONTINUIDADE DE SERVIÇOS DE TI
A versão do Plano de Continuidade de Serviços de TI fica aprovada em ___/___/_____ por deliberação das partes envolvidas.
[1] (A)lto, (M)édio, (B)aixo, (I)ndefinido.
[2]Recovery Point Objective: Ponto em uma linha de tempo em que os dados devem ser recuperados após a ocorrência de uma ruptura.
[3]Recovery Time Objective:Período de tempo dentro do qual os níveis mínimos dos serviços e/ou sistemas devem ser recuperados após a ocorrência de uma interrupção.
[4] (A)lto, (M)édio, (B)aixo, (I)ndefinido.
[5]Teste de mesa, caminho percorrido, simulação
[6]Programado, executado, planejado, agendado