Please use this identifier to cite or link to this item: http://hdl.handle.net/10174/30358

Title: Student dropout risk detection at University of Évora
Authors: Prite, Sharmin Sultana
Advisors: Gonçalves, Teresa
Rato, Luís
Keywords: Academic Data Mining
Machine Learning
Classifier
Dropout
Random Forest
Mineração de Dados Académicos
Aprendizagem Automática
Classificação
Abandono Escolar
Floresta Aleatória
Issue Date: 28-Sep-2021
Publisher: Universidade de Évora
Abstract: Currently, student dropout is a global problem in higher education affecting the results of education systems. In addition to providing state-of-the-art education, any institution needs to maintain its student flow rate, which means that predicting dropout is critical to measuring the success of an education system. This work focuses on identifying the risk of dropout at the University of Évora based on students’ academic performance. We propose a set of aca- demic information as predictive attributes and present machine learning models that have a precision of 96.8% and f1-measure of 94.8% as perfor- mance in identifying students at risk of dropping out. In this regard, 13 years of academic data were collected from four different academic programs (the academic years 2006/2007 to 2018/2019 and Man- agement, Biology, Informatics Engineering and Nursing programs). After collecting the students’ academic records, anonymizing the information and pre-processing the data, an engineering and attribute selection process was conducted, building the data sets. Various machine learning algorithms were applied and their performance was compared; models were built with Deci- sion Trees (DT), Naïve Bayes (NB), Support Vector Machines (SVM) and Random Forest (RF), with the latter algorithm having obtained the best performance in terms of recall; Sumário: Detecção de Risco de Abandono de Alunos na Universidade de Évora Atualmente, o abandono escolar é um problema global no ensino superior que afeta os resultados dos sistemas educativos. Além de fornecer educação de ponta, qualquer instituição precisa manter a taxa de fluxo de alunos, o que significa que a previsão do abandono escolar é essencial para medir o sucesso de um sistema de ensino. Este trabalho centra-se na identificação do risco de abandono escolar na Uni- versidade de Évora com base no desempenho escolar dos alunos. Propomos um conjunto de informação académica como atributos preditivos e apresen- tamos modelos de aprendizagem automática que apresentam uma precisão de 96.8% e f1-medir de 94.8% como desempenho na identificação de alunos em risco de desistência. Nesse sentido, foram recolhidos 13 anos de dados académicos de quatro cursos diferentes (anos letivos de 2006/2007 a 2018/2019 e cursos de Gestão, Bi- ologia, Engenharia Informática e Enfermagem). Após a recolha do percurso académico dos alunos, a anonimização da informação e o pré-processamento dos dados, foi conduzido um processo de engenharia e seleção de atributos, construindo assim os conjuntos de dados. Foram aplicados vários algoritmos de aprendizagem automática e o seu desempenho foi comparado; foram con struídos modelo com Árvores de Decisão (DT), Naïve Bayes (NB), Máquinas de Vetores de Suporte (SVM) e Random Forest (RF), tendo este último al- goritmo obtido o melhor desempenho no que respeita à cobertura.
URI: http://hdl.handle.net/10174/30358
Type: masterThesis
Appears in Collections:BIB - Formação Avançada - Teses de Mestrado

Files in This Item:

File Description SizeFormat
Mestrado-Engenharia_Informatica-Sharmin_Sultana_Prite.pdf1.18 MBAdobe PDFView/Open
FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Dspace Dspace
DSpace Software, version 1.6.2 Copyright © 2002-2008 MIT and Hewlett-Packard - Feedback
UEvora B-On Curriculum DeGois