|
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/18267
|
Title: | Estudo sobre análise de sentimentos em textos |
Authors: | Fernando, Henriques |
Advisors: | Rodrigues, Irene Pimenta |
Keywords: | Análise de sentimentos Mineração de textos Classificação de polaridade Aprendizado supervisionado Caracteristicas linguísticas Orientação semântica Aprendizado em máquina Sentiment analysis Opinion mining Polarity classification Supervised learning Linguistic features Semantic orientation Machine learning |
Issue Date: | 2013 |
Publisher: | Universidade de Évora |
Abstract: | O sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline. |
URI: | http://hdl.handle.net/10174/18267 |
Type: | masterThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Mestrado
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|