Análise e predições para o achatamento da curva de COVID-19 no Brasil: Uma abordagem com IA e SIR — Parte 3

Caíque Coelho
11 min readApr 10, 2020

Bem-vindo, este texto faz parte de uma série de estudos que estou conduzindo sobre a evolução temporal em relação ao número de casos de COVID-19 no Brasil. Os estudos passados podem ser encontrados nos links abaixo:

Artigo 1: Prevendo o crescimento de casos de COVID-19 (coronavírus) no Brasil com análise de dados, gráficos e equações! — Parte 1

Artigo 2: Análise e predição do crescimento de casos de COVID-19 (coronavírus) no Brasil — Parte 2

Artigo 4: Prevendo o real número de infectados e o fim da COVID-19 no Brasil, utilizando inteligência artificial e SIR — Parte 4

Artigo 5: Inteligência artificial e SIR na predição do fim da primeira onda do coronavírus no Brasil — Parte 5

Artigo 6: Prevemos a catástrofe da COVID-19 de 2021 utilizando IA e SIR

Todos os códigos e dados utilizados neste estudo estão disponíveis no github no link a seguir:

Neste texto veremos:

  • Previsões de novos casos com Inteligência Artificial x Realidade (Casos Confirmados);
  • Evolução da porcentagem de novos casos por dia e comparação com outros países com boas evoluções;
  • Comparação dos modelos de Inteligência Artificial com o modelo matemático para epidemias SIR;
  • Análise dos casos de COVID-19 no estado de SP e RJ.

Para este estudo você terá que entender um pouco sobre o conceito de duas ideias: o que é o tão falado achatamento da curva e o que é o modelo SIR. Os dados utilizados são disponibilizados pela Jonhs Hopkins University neste link, também podemos encontrar os dados em tempo real no site World O Meter e dados para os estados e municípios brasileiros aqui.

Atenção: A ideia deste estudo é levantar hipóteses a partir dos dados que já temos até agora, analisando a tendência do crescimento diário de novos casos. O artigo não tem a intenção de pregar o alarmismo e deve ser interpretado como uma abordagem de estudo sem nenhuma validação ou comprovação científica.

Achatamento da curva

O achatamento da curva é a ideia de redução na velocidade da disseminação do vírus, para que possamos ter uma contaminação mais controlada e devagar ao longo do tempo, ou seja, o ideal seria ao invés de termos 100 pessoas contaminadas em apenas um dia, devemos passar a ter 10 pessoas contaminadas por dia, ao longo de dez dias, por isso o nome achatamento, deixamos de ter um pico de 100 pessoas e passamos a ter uma constância de menos casos por dia ao longo do tempo.

Com esta aplicação podemos evitar o colapso do sistema de saúde que não está preparado para lidar com um alto volume de novos casos. O achatamento precisa chegar ao ponto onde tenhamos uma vazão de pessoas recuperadas de casos graves em número igual ou maior ao número de novos casos graves por dia, para que seja possível atender todas as pessoas necessitadas! Mais explicações sobre o achatamento da curva pode ser encontrada neste link da BBC.

Modelo SIR

O modelo SIR (suscetível — infectado — recuperado) é um modelo matemático simples que representa as doenças de transmissão direta. Proposto por W. O. Kermack (Bioquímico) e A. G. McKendrick (médico e epidemiologista) em 1927 e amplamente usado e recomendado até hoje no estudo da transmissão de doenças. O gráfico abaixo nos dá uma ideia de como o coronavírus se comporta em relação a uma gripe comum usando o modelo SIR para inferir a quantidade de pessoas suscetíveis a infecção ao longo do tempo, número de infectados e de recuperados

Fonte: https://ktreta.blogspot.com/2020/03/modelos.html

Olhando esse gráfico podemos ver que a velocidade de contaminação do COVID-19 é muito maior do que uma gripe comum, enquanto uma gripe tem a capacidade de contaminar algo em torno de 79 mil pessoas dentro de 20 a 30 semanas o coronavírus chega a poder contaminar 2.3 milhões de pessoas no mesmo tempo! Por isso temos muito claro aqui a necessidade de medidas para o achatamento da curva, não estamos lidando com uma doença comum a qual os nossos sistemas de saúde estão preparados para lidar, o volume é muito maior! Para quem tiver interesse em se aprofundar mais nas explicações sobre o modelo SIR recomendo neste link um ótimo trabalho com a aplicação do modelo à Hepatite A.

Previsões de novos casos com Inteligência Artificial x Realidade

No dia 27 de março publiquei um estudo prevendo os novos números de casos do dia 27 março até o dia 2 de abril usando alguns modelos de inteligência artificial. Abaixo irei apresentar o comparativo entre os modelos e o número real de casos confirmados nestes dias:

Felizmente podemos ver que o número real de total de casos confirmados ficou abaixo das previsões feitas pelo modelo mais otimista, sendo um número bem próximo até o dia 29 de março. Esse pode ser um bom indicativo de que as medidas de isolamento tem funcionado e podem estar começando a levar para um achatamento da curva, principalmente na cidade de São Paulo a qual iremos analisar separadamente posteriormente. Por simplicidade e para que tenhamos mais tempo de explorar outros algoritmos de inteligência artifical, iremos manter apenas o algoritmo de regressão linear (cenário pessimista) e o algoritmo SVR (cenário otimista), além desses, iremos trazer o modelo matemático para epidemias, o SIR.

Evolução da porcentagem de novos casos por dia e comparação com outros países com boas evoluções

No estudo passado utilizamos o modelo de Inteligência Artifical do cenário mais negativo para prever a porcentagem de novos casos por dia, do dia 27 de março até o dia 1 de abril, e chegamos a conclusão de que uma porcentagem de novos casos por dia próxima a 16% poderia indicar um cenário estabilizado rumo a um cenário positivo. No gráfico abaixo podemos ver a porcentagem de novos casos por dia prevista e o número real confirmado:

Até o dia 30 de março podemos acompanhar uma boa redução na porcentagem de novos casos, porém no dia 31 tivemos uma alta elevação, comportamento o qual já havíamos notado no estudo passado. A porcentagem de novos casos diários no Brasil ainda está muito instável, passando por momentos de redução e posteriores elevações. As porcentagens para os útimos 30 dias até o dia 8 de abril segue abaixo:

Nos últimos dias novamente tivemos uma redução na porcentagem, seguida de uma elevação que esbarrou em um pico de 15% entre os dias 6 e 7 de abril. Com esta instabilidade diária ainda é muito difícil tirarmos qualquer conclusão sobre o nosso futuro, mas podemos manter uma perspectiva de que caso essa porcentagem não ultrapasse novamente a barreira dos 15% e comece a cair nos pŕoximos 14 dias, podemos estar sim caminhando para um cenário de redução de casos, o que indicará que as medidas tomadas até agora estão funcionando.

Aplicando os modelos de inteligência artificial na tentativa de prever as porcentagem futuras nos próximos 7 dias, encontramos uma barreira entre 11% a 13% o que nos indica uma leve redução na quantidade de casos diários, porém uma redução insuficiente para chegarmos no achatamento da curva. A Coréia do Sul por exemplo atingiu um valor de 8% antes de chegar no achatamento da curva como podemos ver abaixo.

A situação fica ainda mais discrepante quando olhamos a quantidade de casos diários da Coréia do Sul em relação ao Brasil, a partir de 30 casos confirmados em ambos os países

A Coréia do Sul teve um pico de 851 casos confirmados em um único dia em 11 dias, após isso seguiu para o achatamento da curva, já o Brasil chegou ao pico de 2136 casos confirmados em apenas um dia no dia 8 de abril, sendo impossível enxergarmos qualquer tipo de achatamento acima.

Abaixo podemos ver a evolução do gráfico de novos casos por dia e o total de casos acumulados.

Comparando modelos de Inteligência Artificial com o modelo matemático para epidemias SIR

Para a comparação deste estudo vamos seguir apenas com o algoritmo de Regressão Linear (cenário pessimista), e com o algoritmo SVR (cenário otimista) e traremos as previsões do modelo SIR. Calibrei os modelos com os dados coletados até o dia 8 de abril, portanto iremos prever os números dos próximos 7 dias, 9 de abril até 15 de abril.

Após a aplicação do modelo SIR podemos ver que suas previsões ficaram abaixo do próprio modelo de Inteligênca Artificial mais otimista, sendo esta a previsão mais otimista possível é a que esperançosamente esperamos alcançar dentro dos próximos dias, portanto vamos nos apegar a ela e conferir posteriormente com este estudo em qual direção de fato estamos seguindo!

Aplicando o modelo SIR com os dados brasileiros atuais temos o seguinte cenário:

Análise dos casos de COVID-19 no estado de SP e RJ

Um discernimento que precisamos passar a ter a partir de agora é como está a evolução dos casos em cada estado, uma vez que cada estado tem tratado de forma diferente a pandemia. Sendo o estado de São Paulo o local com o maior número de casos, precisamos entender se o estado continua puxando a alta de crescimento de novos casos no Brasil ou se os demais estados também estão alavancando este número.

Além disso com a aplicação do distanciamento social em São Paulo através da aplicação de medidas que mantêm comércios não essenciais fechados, precisamos analisar se essas medidas tem sido efetivas em busca do achatamento da curva na cidade de São Paulo. Abaixo podemos ver os gráficos para as quantidades de casos acumulados na cidade de São Paulo e no estado, e posteriormente o gráfico com a quantidade de novos casos por dia.

Fica bem claro que a quantidade de casos no estado de São Paulo é fortemente influenciado pelo os casos na cidade de São Paulo. Até dia 9 de abril temos 7480 casos confirmados no estado e 4947 na cidade, sobrando 2533 casos fora da cidade de São Paulo, algo próximo a 1/3 dos casos.

Abaixo temos a porcentagem de novos casos por dia para o estado de São Paulo.

Vemos uma redução na porcentagem de novos casos depois de um pico de 54%, porém as porcentagens seguintes ainda são muito altas para chegarmos em um achatamento.

Em seguida temos o gráfico para o estado do Rio Janeiro.

O Rio de Janeiro também vem de uma redução após um pico de 56%, porém também apresenta porcentagens elevadas de novos casos por dia.

Por fim, podemos aplicar os modelos de inteligência artificical para tentar prever o número de casos acumulados para o estado de SP e RJ nos próximos dias, para estas previsões não irei utilizar o modelo SIR dado que não possuo os dados de pessoas recuperadas separadas por estado, informação necessária para o modelo SIR.

Previsões para o estado de São Paulo

Previsões para SP

Previsões para o estado do Rio de Janeiro

Previsões para RJ

Conclusões

Após todas essas análises o que fica mais claro é que o distanciamento social imposto em vários lugares tem sim causado um efeito na redução de novos casos de COVID-19 no Brasil, no entanto é preocupante que esta redução seja tão pequena até este momento, além disso, a taxa de isolamento tem reduzido em São Paulo dia a dia, o ideal previsto pelo governo seria um isolamento de 70% porém entre os dia 8 e 9 de abril o isolamento foi de apenas 50%. Com esta redução do isolamento estamos correndo o risco de desperdiçar todo o isolamento feito até agora e provocar novas ondas de alta infecção o que seriam um desastre no momento atual! As pessoas precisam se atentar a isto, quanto mais cedo entendermos a necessidade do isolamento e praticá-lo mais cedo seremos capazes de voltar ao normal.

Outro ponto que chama atenção foi o pronunciamento do secretário de saúde de São Paulo, José Henrique Germann no dia 26 de março, afirmando que o estado de São Paulo representava 90% dos casos no Brasil, mas após a aplicação do isolamento passou a ser apenas 30%. Porém no dia 8 de abril o estado de São Paulo conta com 6708 casos, representando 41% dos casos no Brasil, portanto tivemos novamente uma elevação em São Paulo em comparação com o restante do país.

Ademais ainda temos questões como subnotificações, onde nem todos os casos de COVID-19 são reportados, por orientação do governo apenas os casos mais graves devem entrar nas contas, logo todo os números apresentados aqui estão muito abaixo do número real. Hoje no estado de São Paulo temos mais de 16 mil testes de COVID-19 aguardando o resultado, neste meio tempo podemos ter mais pessoas infectadas por essas pessoas que ainda não possuem o resultado e até óbitos sem a verdadeira causa. Aproveitando o momento, se você conhece algum trabalho que lida com o problema das subnotificações por favor deixe a recomendação nos comentários.

Trabalhos futuros:

  • Análise das previsões em comparação com os casos confirmados
  • Análise e previsões de demais estados
  • Análise de subnotificações e possíveis casos não contabilizados
  • Modelo SIR na previsão de recuperados e infectados.

Lembrando que todo o código e dados utilizados neste estudo está disponível no github no link a seguir:

Se você gostou deste estudo deixe os seus aplausos e compartilhe com o máximo de pessoas para que possamos conscientizar e lutarmos juntos. Qualquer dúvida ou feedback fico a disposição através dos comentários e lembre-se de me seguir por aqui para receber notificações de novos estudos.

Espero que estejam todos bem! Um grande abraço,

Caíque Coelho

--

--

Caíque Coelho

A QA lover and App Developer on weekends and a Data Scientist on free time. Founder App Teste Eneagrama.