8000 GitHub - edilton-bs/EducaODS-Enem: Análise dos dados do ENEM em relação aos Objetivos de Desenvolvimento Sustentável (ODS) em educação, explorando fatores socioeconômicos, regionais e de diversidade.
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

Análise dos dados do ENEM em relação aos Objetivos de Desenvolvimento Sustentável (ODS) em educação, explorando fatores socioeconômicos, regionais e de diversidade.

Notifications You must be signed in to change notification settings

edilton-bs/EducaODS-Enem

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

36 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Análise dos Dados do ENEM e ODS em Educação

Este repositório é dedicado à análise dos dados do Exame Nacional do Ensino Médio (ENEM) em relação aos Objetivos de Desenvolvimento Sustentável (ODS) no contexto da educação. Aqui, exploramos diversos aspectos, desde fatores socioeconômicos até diferenças regionais e de diversidade.

Objetivos:

  • Investigar as disparidades educacionais no Brasil utilizando os dados do ENEM.
  • Relacionar o desempenho no exame com os ODS em educação.
  • Fornecer insights para políticas públicas voltadas para a educação.

Ideias da Análise:

  • Desempenho por região e correlação com indicadores socioeconômicos.
  • Diversidade e áreas de conhecimento com foco em: matemática e redação.
  • Acessibilidade e análise de candidatos menos favorecidos.
  • Avaliar quais métodos de estudo se destacaram para o desempenho dos alunos e quais foram os principais desafios enfrentados.
  • Criação de modelos através de Regressão Linear e Random Forest para avaliar classificadores que impactam na nota dos alunos.

Extração de Dados:

Através da plataforma do INEP: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados e baixamos os Microdados do Enem 2022. Daí, haviam 4 pastas:

  • DADOS
  • DICIONÁRIOS
  • INPUTS
  • LEIA-ME E DOCUMENTOS TÉCNICOS
  • PROVAS E GABARITOS

Na primeira pasta, haviam os csv's com os dados do ENEM 2022 EM "MICRODADOS_ENEM_2022.csv", onde temos as informações de cada candidato por número de inscrição das colunas descritas na pasta de dicionários. E os arquivos com as respostas dos estudantes em "QUEST_HAB_ESTUDO.CSV" do questionário sobre os hábitos de estudo na pandemia.

Na segunda pasta, havia o dicionário de variáveis na aba "MICRODADOS_ENEM_2022", o dicionário referente aos itens da prova como código da questão, área do conhecimento, se o item foi abandonado, níveis de dificuldade, entre outros na aba "ITENS_PROVA_2022" e por último havia o dicionário referente aos hábitos de estudo durante a pandemia na aba "QUEST_HAB_ESTUDO".

Na terceira pasta, havia alguns arquivos em .sas e .r para auxiliar na leitura dos dados. Que não utilizaremos.

Na quarta pasta, haviam os editais, informações sobre o cálculo da nota, a metodologia utilizada, a estrutura do exame, entre outros em PDF. Que também não nos aprofundaremos.

Na última pasta, temos os arquivos com as provas e gabaritos em PDF's que não serão utilizado.

Limpeza de Dados:

Após uma leitura inicial dos dados, decidimos importar as seguintes colunas:

  • 'NU_INSCRICAO'
  • 'TP_FAIXA_ETARIA'
  • 'TP_SEXO'
  • 'TP_COR_RACA'
  • 'TP_ESCOLA'
  • 'TP_ENSINO'
  • 'IN_TREINEIRO' (Se o aluno está fazendo o ENEM para treinar)
  • 'CO_MUNICIPIO_ESC' (Código no Município e Estado da Escola)
  • 'TP_PRESENCA_CN' (Presença em Ciências Naturais)
  • 'TP_PRESENCA_CH' (Presença em Ciências Humanas)
  • 'TP_PRESENCA_LC' (Presença em Linguagens e Comunicações)
  • 'TP_PRESENCA_MT' (Presença em Matemática)
  • 'NU_NOTA_CN' (Nota de Ciências Naturais)
  • 'NU_NOTA_CH' (Nota de Ciências Humanas)
  • 'NU_NOTA_LC' (Nota de Linguagens e 4F4C Comunicações)
  • 'NU_NOTA_MT' (Nota de Matemática)
  • 'TP_STATUS_REDACAO' (Presença na Redação)
  • 'NU_NOTA_REDACAO' (Nota de Redação)
  • 'Q001' (Nível Educacional do Pai)
  • 'Q002' (Nível Edcacional da Mãe)
  • 'Q005' (Número de Habitantes na Residência)
  • 'Q006' (Renda Familiar)
  • 'Q024' (Acesso a Computadores)
  • 'Q025' (Acesso a Internet)

A partir daí, pela limitação do github com espaço de memória, começamos extraindo com Pandas os dados em "MICRODADOS_ENEM_2022.csv" que inicialmente continham 3.476.105 linhas e 76 colunas. Pelo fato dos dados serem muito grandes, filtramos o número de alunos que estiveram presentes nos dois dias de prova em todas as áreas e que responderam o questionário sobre os hábitos de estudo durante a pandemia em "QUEST_HAB_ESTUDO.csv". Através de um merge nos dois datasets de dados na coluna "NU_INSCRICAO" que é comum a ambos, geramos nosso csv final "microdados_reduzido.csv".

teste

About

Análise dos dados do ENEM em relação aos Objetivos de Desenvolvimento Sustentável (ODS) em educação, explorando fatores socioeconômicos, regionais e de diversidade.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%
0