Análise de violência contra a mulher no RS com PostGIS e QGIS
Gerando mapas com o uso de dados abertos da Secretaria Estadual de Segurança Pública do RS
Um dos grandes desafios para pessoas que trabalham com dados de epidemiologia e vigilância em saúde no Brasil, é a produção e disseminação de informações de forma confiável, oportuna e sistematizada. Porém, como esta é uma atividade que demanda tempo de trabalho, geralmente de equipes reduzidas e com recursos escassos, é importante poder automatizar o processo, com o uso de ferramentas gratuitas e de código aberto.
Neste artigo pretendo descrever as principais etapas para a produção de uma análise dos dados dos registros de violência contra a mulher da Secretaria Estadual de Segurança Pública do RS (Indicadores da Violência Contra a Mulher — Lei Maria da Penha). Os dados utilizados são de domínio público e as ferramentas para a preparação, análise e visualização de dados são KNIME, PostgreSQL/PostGIS e QGIS.
Uma das vantagens de carregar os arquivos de dados e shape para um sistema de gerenciamento de bando de dados como o PostgreSQL/PostGIS é que o processamento das consultas (incluindo joins e cálculos) é realizado por uma aplicação própria para tal finalidade, ao invés de fazer com que o processamento seja realizado pela aplicação do QGIS. Especialmente se o PostgreSQL estiver em um servidor específico, pois desta forma não irá consumir processamento e memória local.
Porém mesmo se o PostgreSQL e o QGIS estiverem instalados na mesma máquina, a tendência é de que as consutas sejam realizadas com melhor desempenho e estabilidade através do PostgreSQL com PostGIS.
Acesso os dados
Os dados de notificações de violência contra a mulher no estado do RS podem ser acessados em: https://ssp.rs.gov.br/indicadores-da-violencia-contra-a-mulher.
São disponibilizados arquivos em formato .XLS com os totais por tipo, município e mês de ocorrência. Neste caso, foram utilizados os arquivos de dados dos anos de 2012 até 2021.
Transformando os dados
Os dados foram remodelados para o formato de uma única tabela, contendo os nomes dos municípios, tipo de ocorrência e seu total anual para cada município.
Em seguida foram adicionadas novas variáveis (de fontes complementares) a fim de viabilizar o enriquecimento da análise dos dados. As variáveis adicionadas forma:
- Código do IBGE;
- População residente;
- Indice de Desenvolvimento Sócio Econômico (IDESE);
- Produto Interno Bruto municipal;
- Pertencimento à região metropolitana de Porto Alegre;
Em seguida foram calculados e criados os índices de ocorrências por 100 mil habitantes e PIB per capita.
Carregando os dados
A nova tabela criada foi carregada em PostgreSQL a fim de permitir a sua utilização com dados georreferenciados com as funionalidades do pacote PostGIS.
Também foi carregado no PostgreSQL/PostGIS o arquivo .SHP contendo as informações dos limites territoriais dos municípios do estado do RS. A carga realizada para o PostGIS faz com que as coordenadas geográficas sejam interpretadas e processadas como informação geoespacializada pelo PostgreSQL.
Visualizando os dados
Para a visualização dos dados de ocorrências de violência contra a mulher, agora de forma georreferenciada, foi utilizado o QGIS. Nele é possível acessar diretamente os dados armazenados no PostGIS, através de consultas que combinam as duas tabelas carregadas anteriormente. Desta forma, além de visualizar os municípios no mapa, é possível realizar comparações visuais dos níveis de índices de ocorrências de violência contra a mulher entre municípios do RS.
Nos exemplos a seguir são demonstradas comparações entre a média dos índices de ocorrências por 100 mil habitantes, entre os anos de 2016 e 2021, dos municípios do RS.
Para uma melhor compreensão da distribuição das frequências dos índices por município, o QGI permite a criação do histograma de cada layer criada. Basta acessar o menu Propriedades da layer, em Simbologia e especificar as configurações de exibição do histograma, como métricas, classes e intervalos.
Ainda é possível a criação de outros formatos de gráficos que servem como complemento às visualizações espacializadas. Um exemplo é a criação de um gráfico de dispersão apresentando a relação entre o Índice IDESE e a média de ocorrências de um dado tipo de violência, por município no estado.
Exportando mapas para um website
Um recurso complementar e muito útil é a possíbilidade de exportar os mapas criados para que sejam incorporados à páginas específicas de websites. Basta salvar o arquivo no servidor web e utilizar o iframe:
<iframe src=”endereço do arquivo do mapa" title=”description”></iframe>
O resultado será semelhante ao exibido na figura a seguir.
Também é possível salvar e publicar o mapa no Github, tal como eu fiz.
Para acessar o mapa online acesse: Análise de violência contra a mulher no RS (labulatif.github.io)
Você deverá encontrar uma tela semelhante a esta:
Algumas conclusões
Estes são alguns exemplos das visualizações e análises que podem ser realizadas com a utilização do PostGIS e QGIS combinados, embora ambas as ferramentas possuam muitíssimas outras potencialidades para a análise geoespacial. E algumas delas, possivelmente venham a ser apresentadas aqui, em atualizações deste post.
Este exemplo de uso de dados de atendimentos de violência contra a mulher, com base na Lei Maria da Penha, no estado do RS, é apenas uma primeira postagem de um projeto de data analytics utilizando múltiplas fontes de dados o qual está sendo desenvolvido atualmente. Por esta razão alguns detalhes e refinamentos ainda não foram divulgados.
Caso você possua interesse em maiores detalhes, processos e códigos (ou sugestões), pode solicitar via mensagem direta em meu perfil no Linkedin. Também lhe convido a seguir meu perfil para poder acompanhar novas postagens.
Além de postagens pontuais com algumas etapas deste projeto, quando ele estiver finalizado, realizarei um post compartilhando a totalidade do produto final.
Até lá!