|
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/31064
|
Title: | Plataforma integrada de dados de acidentes de viação para suporte a processos de aprendizagem automática |
Authors: | Santos, Daniel Filipe Pé-Leve dos |
Advisors: | Saias, José Quaresma, Paulo Miguel Nogueira, Vitor Beires |
Keywords: | Machine Learning Data Analysis Road Accident Data Clustering Decision Trees Random Forest Aprendizagem automática Análise de dados Road Accident Data Clustering Decision Trees Random Forest |
Issue Date: | 26-Jan-2022 |
Publisher: | Universidade de Évora |
Abstract: | Integrated road accident data platform to support
machine learning techniques
Traffic accidents are one of the most important concerns of the world, since they result in numerous
casualties, injuries, and fatalities each year, as well as significant economic losses. There are many factors
that are responsible for causing road accidents. If these factors can be better understood and predicted,
it might be possible to take measures to mitigate the damages and its severity. The purpose of this
dissertation is to identify these factors using accident data from 2016 to 2019 from the district of Setúbal,
Portugal. This work aims at developing models that can select a set of influential factors that may be used
to classify the severity of an accident, supporting an analysis on the accident data. In addition, this study
also proposes a predictive model for future road accidents based on past data. Various machine learning
approaches are used to create these models. Supervised machine learning methods such as decision trees
(DT), random forests (RF), logistic regression (LR) and naive bayes (NB) are used, as well as unsupervised
machine learning techniques including DBSCAN and hierarchical clustering. Results show that a rule-based
model using C5.0 algorithm is capable of accurately detecting the most relevant factors describing a road
accident severity. Furthermore, the results of the predictive model suggests the RF model could be a useful
tool for forecasting accident hotspots; Sumário: Os acidentes de trânsito são uma grande preocupação a nível mundial, uma vez que resultam em grandes
números de vítimas, feridos e mortes por ano, como também perdas económicas significativas. Existem
vários fatores responsáveis por causar acidentes rodoviários. Se pudermos compreender e prever melhor
estes fatores, talvez seja possível tomar medidas para mitigar os danos e a sua gravidade. O objetivo desta
dissertação é identificar estes fatores utilizando dados de acidentes de 2016 a 2019 do distrito de Setúbal,
Portugal. Este trabalho tem como objetivo desenvolver modelos capazes de selecionar um conjunto de
fatores influentes e que possam vir a ser utilizados para classificar a gravidade de um acidente, suportando
uma análise aos dados de acidentes. Além disso, este estudo também propõe um modelo de previsão
para futuros acidentes rodoviários com base em dados do passado. Várias abordagens de aprendizagem
automática são usadas para criar esses modelos. Métodos de aprendizagem supervisionada, como árvores
de decisão (DT), random forest (RF), regressão logística (LR) e naive bayes (NB), são usados, bem como
técnicas de aprendizagem automática não supervisionada, incluindo DBSCAN e clustering hierárquico. Os
resultados mostram que um modelo baseado em regras usando o algoritmo C5.0 é capaz de detetar com
precisão os fatores mais relevantes que descrevem a gravidade de um acidente de viação. Além disso, os
resultados do modelo preditivo sugerem que o modelo RF pode ser uma ferramenta útil para a previsão de
acidentes. |
URI: | http://hdl.handle.net/10174/31064 |
Type: | masterThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Mestrado
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|