Trabalho de Conclusão |
---|
Título: | MACHINE LEARNING NA IDENTIFICAÇÃO DO SENTIMENTO ASSOCIADO AOS TWEETS E PREÇO DE AÇÕES |
Aluno: | FREDERICO AUGUSTO SCHMITZ |
Semestre: | 2021/02 |
Situação: | Concluido |
Áreas de interesse: | Não informado |
Orientador: | Juliano Varella de Carvalho |
Avaliadores: | Edvar Bergmann Araujo, Gabriel da Silva Simões |
Documentos: | Anteprojeto, Texto final TC1 (liberado apenas para a banca), Texto final TC2 |
Palavras-chave: | Machine Learning. Análise de sentimentos. Bolsa de Valores. Ações. Tweets. |
Resumo: | O número de novos investidores cadastrados na bolsa de valores brasileira quase dobrou em 2020, em relação ao ano anterior. A maioria destes novos investidores tem como principal motivação buscar conhecimento em novas formas de investimento bem como uma maior rentabilidade. Pesquisas mostram que as redes sociais e plataformas online são a principal fonte utilizada por estes investidores para aprendizagem e busca de informações. O número crescente de investidores e transações executadas criam um alto volume de dados que escondem padrões e correlações, fazendo o mercado financeiro um candidato relevante à execução de técnicas de Machine Learning sobre Big Data. A análise de sentimentos é o campo responsável por analisar opiniões e sentimentos das pessoas em relação a produtos e serviços, o rápido crescimento desta área coincide com o crescimento das redes sociais e a grande quantidade de opiniões geradas por seus usuários. Pelos motivos e informações apresentadas anteriormente, este trabalho propôs a utilização de técnicas de Machine Learning com o objetivo de analisar se o sentimento expressado pelos investidores em tweets tem correlações com os movimentos do mercado financeiro. Para se chegar neste objetivo realizou-se a coleta de um grande volume de tweets através da aplicação de técnicas de data mining. Estes tweets foram então analisados e processados por meio da aplicação de algoritmos de Processamento de Linguagem Natural, visando filtrar apenas tweets que estejam relacionados com investidores. O sentimento destes tweets foi analisado com o auxílio da ferramenta Google Cloud Natural Language, e então validado através da comparação de seu resultado com um evento externo. Por fim um modelo de predição foi construído com a utilização do algoritmo de classificação Support Vector Machine. Os resultados apresentados por este modelo vão de encontro com a Hipótese do Mercado Eficiente. De acordo com ela, o preço de um ativo reflete de forma eficiente toda e qualquer informação já publicada, sendo assim o preço do amanhã não pode ser previsto utilizando informações do passado. |
Link biblioteca: | Não informado |
TC Online - Sistema de Trabalhos de Conclusão Online