Sistemas de Informação

Trabalho de Conclusão
Título:MACHINE LEARNING NA IDENTIFICAÇÃO DO SENTIMENTO ASSOCIADO AOS TWEETS E PREÇO DE AÇÕES
Aluno:FREDERICO AUGUSTO SCHMITZ
Semestre:2021/02
Situação:Concluido
Áreas de interesse:Não informado
Orientador:Juliano Varella de Carvalho
Avaliadores:Edvar Bergmann Araujo, Gabriel da Silva Simões
Documentos:Anteprojeto, Texto final TC1 (liberado apenas para a banca), Texto final TC2
Palavras-chave:Machine Learning. Análise de sentimentos. Bolsa de Valores. Ações. Tweets.
Resumo:

O número de novos investidores cadastrados na bolsa de valores brasileira quase dobrou em 2020, em relação ao ano anterior. A maioria destes novos investidores tem como principal motivação buscar conhecimento em novas formas de investimento bem como uma maior rentabilidade. Pesquisas mostram que as redes sociais e plataformas online são a principal fonte utilizada por estes investidores para aprendizagem e busca de informações. O número crescente de investidores e transações executadas criam um alto volume de dados que escondem padrões e correlações, fazendo o mercado financeiro um candidato relevante à execução de técnicas de Machine Learning sobre Big Data. A análise de sentimentos é o campo responsável por analisar opiniões e sentimentos das pessoas em relação a produtos e serviços, o rápido crescimento desta área coincide com o crescimento das redes sociais e a grande quantidade de opiniões geradas por seus usuários. Pelos motivos e informações apresentadas anteriormente, este trabalho propôs a utilização de técnicas de Machine Learning com o objetivo de analisar se o sentimento expressado pelos investidores em tweets tem correlações com os movimentos do mercado financeiro. Para se chegar neste objetivo realizou-se a coleta de um grande volume de tweets através da aplicação de técnicas de data mining. Estes tweets foram então analisados e processados por meio da aplicação de algoritmos de Processamento de Linguagem Natural, visando filtrar apenas tweets que estejam relacionados com investidores. O sentimento destes tweets foi analisado com o auxílio da ferramenta Google Cloud Natural Language, e então validado através da comparação de seu resultado com um evento externo. Por fim um modelo de predição foi construído com a utilização do algoritmo de classificação Support Vector Machine. Os resultados apresentados por este modelo vão de encontro com a Hipótese do Mercado Eficiente. De acordo com ela, o preço de um ativo reflete de forma eficiente toda e qualquer informação já publicada, sendo assim o preço do amanhã não pode ser previsto utilizando informações do passado.

Link biblioteca:Não informado

TC Online - Sistema de Trabalhos de Conclusão Online