O Exame Nacional do Ensino Médio (ENEM) foi criado em 1998 com o propósito de avaliar o desempenho escolar dos estudantes ao término da educação básica. Em 2004, o ENEM se tornou popular quando foi possível usar a nota do exame para acesso a bolsas de instituições privadas. Conforme o decorrer dos anos, o número de participantes da prova vem aumentando e, com isso, são acumuladas grandes quantidades de dados sobre os participantes. Além das informações referentes às notas de cada estudante, são salvos também dados socioeconômicos daqueles que participaram do exame. Com esses extensos \textit{datasets} é possível a aplicação de \textit{Machine Learning} (ML) porém, junto a isso, existe o problema de limitação de hardware, pois uma máquina comum não suporta a quantidade de gigabytes de dados que o ENEM possui. Neste trabalho, após o pré-processamento dos dados, foi aplicado o algoritmo de clusterização \textit{k-menas}, gerando 3 agrupamentos. O objetivo da clusterização neste trabalho é, a partir de uma análise nas visualizações geradas, identificar as características socioeconômicas de cada agrupamento, em relação a nota média atingida no ENEM de 2018 e 2019. Os \textit{clusters} gerados indicam que as questões socioeconômicas tendem a se relacionar com a nota média atingida pelos participantes. |