|
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/30358
|
Title: | Student dropout risk detection at University of Évora |
Authors: | Prite, Sharmin Sultana |
Advisors: | Gonçalves, Teresa Rato, Luís |
Keywords: | Academic Data Mining Machine Learning Classifier Dropout Random Forest Mineração de Dados Académicos Aprendizagem Automática Classificação Abandono Escolar Floresta Aleatória |
Issue Date: | 28-Sep-2021 |
Publisher: | Universidade de Évora |
Abstract: | Currently, student dropout is a global problem in higher education affecting
the results of education systems. In addition to providing state-of-the-art
education, any institution needs to maintain its student flow rate, which
means that predicting dropout is critical to measuring the success of an
education system.
This work focuses on identifying the risk of dropout at the University of
Évora based on students’ academic performance. We propose a set of aca-
demic information as predictive attributes and present machine learning
models that have a precision of 96.8% and f1-measure of 94.8% as perfor-
mance in identifying students at risk of dropping out.
In this regard, 13 years of academic data were collected from four different
academic programs (the academic years 2006/2007 to 2018/2019 and Man-
agement, Biology, Informatics Engineering and Nursing programs). After
collecting the students’ academic records, anonymizing the information and
pre-processing the data, an engineering and attribute selection process was
conducted, building the data sets. Various machine learning algorithms were
applied and their performance was compared; models were built with Deci-
sion Trees (DT), Naïve Bayes (NB), Support Vector Machines (SVM) and
Random Forest (RF), with the latter algorithm having obtained the best
performance in terms of recall; Sumário:
Detecção de Risco de Abandono de Alunos na
Universidade de Évora
Atualmente, o abandono escolar é um problema global no ensino superior
que afeta os resultados dos sistemas educativos. Além de fornecer educação
de ponta, qualquer instituição precisa manter a taxa de fluxo de alunos, o
que significa que a previsão do abandono escolar é essencial para medir o
sucesso de um sistema de ensino.
Este trabalho centra-se na identificação do risco de abandono escolar na Uni-
versidade de Évora com base no desempenho escolar dos alunos. Propomos
um conjunto de informação académica como atributos preditivos e apresen-
tamos modelos de aprendizagem automática que apresentam uma precisão
de 96.8% e f1-medir de 94.8% como desempenho na identificação de alunos
em risco de desistência.
Nesse sentido, foram recolhidos 13 anos de dados académicos de quatro cursos
diferentes (anos letivos de 2006/2007 a 2018/2019 e cursos de Gestão, Bi-
ologia, Engenharia Informática e Enfermagem). Após a recolha do percurso
académico dos alunos, a anonimização da informação e o pré-processamento
dos dados, foi conduzido um processo de engenharia e seleção de atributos,
construindo assim os conjuntos de dados. Foram aplicados vários algoritmos
de aprendizagem automática e o seu desempenho foi comparado; foram con
struídos modelo com Árvores de Decisão (DT), Naïve Bayes (NB), Máquinas
de Vetores de Suporte (SVM) e Random Forest (RF), tendo este último al-
goritmo obtido o melhor desempenho no que respeita à cobertura. |
URI: | http://hdl.handle.net/10174/30358 |
Type: | masterThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Mestrado
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|