GitHub - edilton-bs/EducaODS-Enem: Análise dos dados do ENEM em relação aos Objetivos de Desenvolvimento Sustentável (ODS) em educação, explorando fatores socioeconômicos, regionais e de diversidade.

Análise dos Dados do ENEM e ODS em Educação

Este repositório é dedicado à análise dos dados do Exame Nacional do Ensino Médio (ENEM) em relação aos Objetivos de Desenvolvimento Sustentável (ODS) no contexto da educação. Aqui, exploramos diversos aspectos, desde fatores socioeconômicos até diferenças regionais e de diversidade.

Objetivos:

Investigar as disparidades educacionais no Brasil utilizando os dados do ENEM.
Relacionar o desempenho no exame com os ODS em educação.
Fornecer insights para políticas públicas voltadas para a educação.

Ideias da Análise:

Desempenho por região e correlação com indicadores socioeconômicos.
Diversidade e áreas de conhecimento com foco em: matemática e redação.
Acessibilidade e análise de candidatos menos favorecidos.
Avaliar quais métodos de estudo se destacaram para o desempenho dos alunos e quais foram os principais desafios enfrentados.
Criação de modelos através de Regressão Linear e Random Forest para avaliar classificadores que impactam na nota dos alunos.

Extração de Dados:

Através da plataforma do INEP: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados e baixamos os Microdados do Enem 2022. Daí, haviam 4 pastas:

DADOS
DICIONÁRIOS
INPUTS
LEIA-ME E DOCUMENTOS TÉCNICOS
PROVAS E GABARITOS

Na primeira pasta, haviam os csv's com os dados do ENEM 2022 EM "MICRODADOS_ENEM_2022.csv", onde temos as informações de cada candidato por número de inscrição das colunas descritas na pasta de dicionários. E os arquivos com as respostas dos estudantes em "QUEST_HAB_ESTUDO.CSV" do questionário sobre os hábitos de estudo na pandemia.

Na segunda pasta, havia o dicionário de variáveis na aba "MICRODADOS_ENEM_2022", o dicionário referente aos itens da prova como código da questão, área do conhecimento, se o item foi abandonado, níveis de dificuldade, entre outros na aba "ITENS_PROVA_2022" e por último havia o dicionário referente aos hábitos de estudo durante a pandemia na aba "QUEST_HAB_ESTUDO".

Na terceira pasta, havia alguns arquivos em .sas e .r para auxiliar na leitura dos dados. Que não utilizaremos.

Na quarta pasta, haviam os editais, informações sobre o cálculo da nota, a metodologia utilizada, a estrutura do exame, entre outros em PDF. Que também não nos aprofundaremos.

Na última pasta, temos os arquivos com as provas e gabaritos em PDF's que não serão utilizado.

Limpeza de Dados:

Após uma leitura inicial dos dados, decidimos importar as seguintes colunas:

'NU_INSCRICAO'
'TP_FAIXA_ETARIA'
'TP_SEXO'
'TP_COR_RACA'
'TP_ESCOLA'
'TP_ENSINO'
'IN_TREINEIRO' (Se o aluno está fazendo o ENEM para treinar)
'CO_MUNICIPIO_ESC' (Código no Município e Estado da Escola)
'TP_PRESENCA_CN' (Presença em Ciências Naturais)
'TP_PRESENCA_CH' (Presença em Ciências Humanas)
'TP_PRESENCA_LC' (Presença em Linguagens e Comunicações)
'TP_PRESENCA_MT' (Presença em Matemática)
'NU_NOTA_CN' (Nota de Ciências Naturais)
'NU_NOTA_CH' (Nota de Ciências Humanas)
'NU_NOTA_LC' (Nota de Linguagens e 4F4C Comunicações)
'NU_NOTA_MT' (Nota de Matemática)
'TP_STATUS_REDACAO' (Presença na Redação)
'NU_NOTA_REDACAO' (Nota de Redação)
'Q001' (Nível Educacional do Pai)
'Q002' (Nível Edcacional da Mãe)
'Q005' (Número de Habitantes na Residência)
'Q006' (Renda Familiar)
'Q024' (Acesso a Computadores)
'Q025' (Acesso a Internet)

A partir daí, pela limitação do github com espaço de memória, começamos extraindo com Pandas os dados em "MICRODADOS_ENEM_2022.csv" que inicialmente continham 3.476.105 linhas e 76 colunas. Pelo fato dos dados serem muito grandes, filtramos o número de alunos que estiveram presentes nos dois dias de prova em todas as áreas e que responderam o questionário sobre os hábitos de estudo durante a pandemia em "QUEST_HAB_ESTUDO.csv". Através de um merge nos dois datasets de dados na coluna "NU_INSCRICAO" que é comum a ambos, geramos nosso csv final "microdados_reduzido.csv".

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
DADOS		DADOS
DICIONÁRIO		DICIONÁRIO
Imagens		Imagens
.gitignore		.gitignore
README.md		README.md
main.ipynb		main.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Análise dos Dados do ENEM e ODS em Educação

Objetivos:

Ideias da Análise:

Extração de Dados:

Limpeza de Dados:

About

Uh oh!

Releases

Packages

Languages

edilton-bs/EducaODS-Enem

Folders and files

Latest commit

History

Repository files navigation

Análise dos Dados do ENEM e ODS em Educação

Objetivos:

Ideias da Análise:

Extração de Dados:

Limpeza de Dados:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages