-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathREADME.Rmd
197 lines (151 loc) · 9.09 KB
/
README.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
---
output: github_document
---
<!-- README.md is generated from README.Rmd. Please edit that file -->
```{r, include = FALSE}
knitr::opts_chunk$set(
echo = FALSE,
message = FALSE,
warning = FALSE,
fig.align = "center",
comment = "#>",
fig.path = "man/figures/README-",
out.width = "100%"
)
```
# Projeto final do Curso de Faxina de dados: Feminícidio
Esse pacote foi produzido especialmente para o trabalho final do curso de Faxina de dados do [curso-r](https://curso-r.com/).
## Para instalar
```
devtools::install_github("katerine-dev/feminicidio")
```
## O projeto
As bases brutas foram baixadas diretamente do [Portal de Transparência do Governo]( http://www.ssp.sp.gov.br/transparenciassp/).
Foi escolhido o prazo de março de 2020 a junho de 2021, chegando num total de 16 arquivos em .xls. As informações sobre outros meses posteriores ainda não estavam disponíveis no site.
Atualmente existem vários estudos que demonstram um aumento relevante de nºs de casos de feminicídio e agressões contra mulheres na pandemia. O objetivo da análise é observar os casos de feminicídio entre o início da pandemia e os dias de hoje.
O isolamento social acentuou a violência doméstica, as mulheres que já viviam algum tipo de vulnerabilidade foram forçadas a passarem mais tempo com seus agressores, seja por aderirem ao trabalho remoto, desemprego ou pela responsabilidade familiar de ficar com as crianças ou idosos em casa.
Além da violência, as mulheres convivem com uma sobrecarga do trabalho doméstico e familiares que se concentram desigualmente entre o homem e a mulher que reforçam ainda mais o machismo.
Esse tipo de convívio direto e forçado expos diretamente as mulheres a agressões psicológicas, físicas e sexuais constantes. Dificultando também o acesso a essas mulheres de suporte adequado para o enfrentamento à violência.
A análise será diante desse cenário.
## Descrição da Base Untidy
Como citado anteriormente as bases foram baixadas de um portal de dados públicos, sendo observado diferentes problemas que poderiam prejudicar a análise.
Lista de problemas:
- Colunas não necessárias
- Problemas com enconding
- Nºs de latitude e longitude fora do padrão
- Letras maiúsculas nas colunas
- Colunas separadas que eram da mesma espécie
- Problemas com as datas datas e horas
- Informações diferentes numa mesma coluna
- Duplicidade de informações
- Linhas com lacunas ou "0"
- Nomes de colunas sem padrão
A base continha no total 55 colunas e 491 linhas.
## O planejamento
Foi decidido dividir os dados entre 4 bases tidys relacionadas pelo o assunto para a arrumação principal.
- A primeira divisão: `infracoes_arrumado` e `infracoes_arrumado2` (Foi escolhido realizar a limpeza dividindo entre tipicidade e natureza jurídica)
- A segunda divisão: `datas_arrumado`
- A terceira divisão: `endereco_arrumado`
- A quarta divisão: `partes_arrumado`
Finalizando a arrumação foi realizado um join entre elas produzindo a `base_final_tidy`. Escolhi separar as informações relacionadas as partes constituindo assim a base específica de `partes_tidy`.
```{r echo=TRUE}
feminicidio::base_final_tidy |>
dplyr::glimpse()
```
Nessa observamos as informações mais genéricas sobre os casos, contendo infrações, endereços e delegacias.
```{r echo=TRUE}
feminicidio::partes_tidy |>
dplyr::glimpse()
```
Essa base é mais específica, contendo informações das partes envonvidas nos crimes. Em alguns casos haviam mais de uma vítima com desfechos diferentes e qualidades diferentes. Para deixar as informações mais individuais foi decidido separar essas variáveis da base principal.
## Resultados
### Incidentes por dia de semana
```{r incidentes-diasemana}
feminicidio::base_final_tidy |>
dplyr::select(num_bo, ano_bo, dhocorrencia) |>
dplyr::mutate(diasemana = lubridate::wday(dhocorrencia)) |>
dplyr::filter(diasemana != "NA") |>
dplyr::mutate(diasemana = as.character(diasemana)) |>
dplyr::mutate(
diasemana = dplyr::case_when(
diasemana = stringr::str_detect(diasemana, stringr::regex("1")) ~ "Segunda",
diasemana = stringr::str_detect(diasemana, stringr::regex("2")) ~ "Terça",
diasemana = stringr::str_detect(diasemana, stringr::regex("3")) ~ "Quarta",
diasemana = stringr::str_detect(diasemana, stringr::regex("4")) ~ "Quinta",
diasemana = stringr::str_detect(diasemana, stringr::regex("5")) ~ "Sexta",
diasemana = stringr::str_detect(diasemana, stringr::regex("6")) ~ "Sábado",
diasemana = stringr::str_detect(diasemana, stringr::regex("7")) ~ "Domingo",
TRUE ~ diasemana
)
) |>
dplyr::group_by(diasemana) |>
dplyr::count(ano_bo) |>
ggplot2::ggplot(ggplot2::aes(x = n, y = diasemana, fill = n)) +
ggplot2::geom_tile(colour = "white") +
ggplot2::facet_wrap( ~ ano_bo, ncol = 1) +
ggplot2::labs(x = "Incidentes", y = "Dia da semana ", fill = "Nº de Incidentes") +
ggplot2::scale_fill_gradient2(low = "#fad8fa",
mid = "#f5b6f5",
high = "#300630") +
ggplot2::theme_light(10)
```
Podemos observar que o nº de incidente piora principalmente nos finais de semana e começo da semana, concluindo portanto que nestes dias a concentração da convivência entre o agressor e a vítima dentro de casa eleva o número de registro de ocorrência. Outros fatores de risco que agravam é o consumo excessivo de álcool nos finais de semana e eventos que possam elevar o estresse dentro de casa.
### Período da ocorrência
```{r periodoocorrencia-prop}
feminicidio::base_final_tidy |>
dplyr::select(ano_bo, peridoocorrencia) |>
dplyr::group_by(ano_bo) |>
dplyr::mutate(peridoocorrencia = stringr::str_to_title(peridoocorrencia)) |>
dplyr::mutate(
peridoocorrencia = dplyr::case_when(
stringr::str_detect(peridoocorrencia, stringr::regex("Pela Manha")) ~ "Pela Manhã",
stringr::str_detect(peridoocorrencia, stringr::regex("A Noite")) ~ "Noite",
stringr::str_detect(peridoocorrencia, stringr::regex("A Tarde")) ~ "Tarde",
TRUE ~ peridoocorrencia
)
) |>
dplyr::count(peridoocorrencia) |>
dplyr::mutate(prop = n / sum(n)) |>
dplyr::mutate(prop = formattable::percent(prop)) |>
dplyr::mutate(ano_bo = as.character(ano_bo)) |>
dplyr::mutate(peridoocorrencia = forcats::fct_reorder(peridoocorrencia, n)) |>
ggplot2::ggplot(ggplot2::aes(x = prop, y = peridoocorrencia, fill = ano_bo)) +
ggplot2::geom_col(position = "dodge") +
ggplot2::scale_x_continuous(labels = scales::percent) +
ggplot2::scale_fill_manual(values = c("#D8BFD8", "#EE82EE")) +
ggplot2::labs(x = "Proporção", y = "Periodo da ocorrência", fill = "Ano") +
ggplot2::theme_minimal(10)
```
O período mais constante é a noite/madrugada entre os anos de 2020 e 2021 os crimes ocorreram pelo menos 34.68% e 24.64% respectivamente no período de descanso.
### Quem comete a violência doméstica e familiar?
```{r relacionamento-incidente}
feminicidio::partes_tidy |>
dplyr::select(ano_bo, bo_autoria, relacionamento) |>
dplyr::filter(relacionamento != "NA") |>
dplyr::filter(relacionamento != "parentesco,envolvimento amoroso") |>
dplyr::filter(relacionamento != "parentesco,casamento") |>
dplyr::mutate(relacionamento = stringr::str_to_title(relacionamento)) |>
dplyr::mutate(
relacionamento = dplyr::case_when(
stringr::str_detect(relacionamento, stringr::regex("Uniao Estavel")) ~ "União Estável",
stringr::str_detect(relacionamento, stringr::regex("Nenhuma Relacao")) ~ "Nenhuma Relação",
TRUE ~ relacionamento
)
) |>
dplyr::group_by(ano_bo, relacionamento) |>
dplyr::count(relacionamento) |>
ggplot2::ggplot(ggplot2::aes(x = n, y = relacionamento, fill = relacionamento)) +
ggplot2::geom_boxplot(position = "dodge", alpha = 0.5) +
ggplot2::scale_fill_manual(values = c("#8282ee", "#dc1edc", "#8eacff", "#b882ee", "#e49aa5")) +
ggplot2::labs(x = "Incidentes", y = "Relacionamento") +
ggplot2::theme_minimal(10) +
ggplot2::theme(legend.position = "none")
```
Sabemos que o agressor poderá ser o marido, convivente, namorado, irmãos, cunhado, cunhada, sogro, sogra, e outros, independentemente do sexo ou grau de parentesco com a vítima. Atualmente, também se reconhece a aplicação da lei nas relações homoafetivas entre mulheres.
Percebemos na figura acima que ao autor do crime e a sua relação com a vítima o nº de incidentes (ocorrências registradas) é muito mais atenuante quando tem qualquer tipo de envolvimento amoroso, concluindo então que o agressor não será apenas o marido ou companheiro.
### Denuncie
É perceptivel que esse cenário é muito difícil e traumático. Caso você queria ajudar uma vítima de violência doméstica denuncie nos seguintes canais:
- Disque 180 – Central de Atendimento à Mulher, para denúncias, ou
- Disque 190 – Polícia Militar, para atuação emergencial.
<img src='man/figs/feminista.png' align="left" height="139" /></a>
_"Feminismo é um movimento para acabar com sexismo, exploração sexista e opressão"_ (BUENO, Winnie. _Feminist Theory: From Margin to Center_ [Teoria feminista: da margem ao centro]. Sounth End Press. 1984.)