|
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/11835
|
Title: | Sobre testes de detecção de "outliers" em populações exponenciais |
Authors: | Braumann, Maria Manuela São Pedro Abreu |
Keywords: | Probabilidades Estatística Outliers |
Issue Date: | 1994 |
Publisher: | Universidade de Évora |
Abstract: | É óbvio o interesse da detecção de "outliers" em amostras, uma vez que estas podem ser contaminadas por essa observações "surpreendentes", isto é, a informação dada pelas amostras poderá ser distorcida.
Torna-se portanto fundamental procurar meios de interpretar ou reconhecer "outliers". No entanto, até agora, a detecção de "outliers" não tem sido feita por métodos rigorosos e objectivos, uma vez que na selecção das observações a testar se têm utilizado apenas processos intuitivos ( os candidatos a "outliers" são escolhidos empiricamente, a priori ).
Com o método GAN (generativo de alternativa natural), Rosado, na sua tese de doutoramento (1984), trata o problema de uma forma objectiva, sendo a observação rejeitada como "outlier" escolhida a posteriori, uma vez rejeitada a homogeneidade nas observações.
A detecção e tratamento de "outliers" têm importância em todas as áreas científicas e aplicações que recorrem a estudos estatísticos. As técnicas de detecção e identificação de "outliers" são também importantes para a eliminação de elementos estranhos em amostras de populações e para o ajustamento de modelos regressionais ou outros (através do estudo de existência de "outliers" nos resíduos).
A distribuição exponencial tem um papel relevante em muitas aplicações, principalmente quando se pretende estudar tempos de vida de sistemas (mecânicos, electrónicos, biológicos ou outros) ou suas componentes.
A "performance" dos testes desenvolvidos para detecção e identificação de "outliers" em populações exponenciais, quer os clássicos quer os novos testes obtidos por Rosado, não era conhecida, não obstante a existência de critérios de medição de "performance" para testes desta natureza propostos na literatura e aceites como relevantes.
Um dos objectivos deste trabalho é a obtenção de novas estatísticas de teste obtidas pelo método GAN, de forma a cobrir todas as hipóteses possíveis (para um "outlier") no que respeita à distribuição exponencial. Um outro objectivo é a elaboração de tabelas de valores críticos e, por fim, a determinação das medidas de "performance" dos testes já existentes e dos novos obtidos neste trabalho. Será feito um estudo comparativo da "performance" dos vários testes, estudo esse que trará consequências sobre a sua aplicação prática.
Posto isto, vejamos sucintamente no que consta o trabalho.
No capítulo I começaremos por ver o que é um "outlier", como aparece, como o detectar
e por fim como o tratar (o que fazer com ele). Nesta parte do trabalho seguiremos de perto Braumann (1989). A seguir vamos ver o que são testes de discordância para "outliers"; serão apresentados os testes tradicionais e abordado um novo teste de Rosado (1984). No ponto 1.5 abordaremos as medidas de "performance" dos testes.
Já no capítulo II será desenvolvido o novo método de Rosado (1984), o método generativo de alternativa natural (método GAN) e com base nele obteremos novas estatísticas de teste para o caso da distribuição exponencial. Para além da obtenção destas novas estatísticas serão também apresentadas as estatísticas já anteriormente obtidas por Rosado, algumas das quais coincidem com as estatísticas clássicas. Para todas estas estatíticas serão determinadas as respectivas funções de distribuição, para os dois casos possíveis: existência de "outlier" na amostra e não existência de "outlier" na amostra.
No capítulo III e relativamente a todas as estatísticas, serão determinadas expressões analíticas para o cálculo dos valores críticos e para as medidas de "performance". Apresentar-se-ão também formas de proceder ao cálculo numérico das mesmas, deduzindo-se por vezes fórmulas alternativas que visam facultar e apressar o cálculo, o qual, de outra forma, se tornaria praticamente impossível.
No capítulo IV apresentar-se-ão tabelas de valores críticos e tabelas das medidas de "performance". Será ainda feita uma análise destes valores, nomeadamente comparando a "performance" dos novos testes obtidos pelo método GAN com a "performance" de testes tradicionais. |
URI: | http://hdl.handle.net/10174/11835 |
Type: | doctoralThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Doutoramento
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|