Trabalho de Conclusão |
---|
Título: | VISUALIZAÇÃO DE DADOS DE PACIENTES COM CÂNCER A PARTIR DA BASE DE DADOS DO INCA. |
Aluno: | Dieison Medinger |
Semestre: | 2017/01 |
Situação: | Concluido |
Áreas de interesse: | Não informado |
Orientador: | Juliano Varella de Carvalho |
Avaliadores: | Carlos Sergio Schneider, Guillermo Nudelman Hess |
Documentos: | Anteprojeto, Texto final TC2 |
Palavras-chave: | Gráficos. Data Mining. Câncer. Visualização de dados. Descoberta de Conhecimento. |
Resumo: | Câncer é uma das doenças que mais intriga cientistas e pesquisadores por não haver uma cura 100% eficaz e nem causas comprovadas, podendo variar de caso para caso. Estimativas para 2016 e 2017 apontam 596.070 casos novos de câncer, sendo 49% em mulheres e 51% em homens, reforçando a magnitude do problema no país. Estudos e pesquisas ligadas a esta doença vêm ganhando mais espaço com o passar dos anos, não só na esfera nacional, mas também mundial. Em todo o mundo existem entidades e ONGs (Organizações não governamentais) que buscam fomentar discussões, estudos e promover fóruns sobre o tema. Assim, na Europa há o Cancer Research UK, nos Estados Unidos da America o American Cancer Society que incentivam e promovem pesquisas sobre a doença. No Brasil há o INCA (Instituto Nacional de Câncer) que além de investimentos para área de pesquisa disponibiliza uma base de dados sobre pacientes, com informações de idade, sexo, estado, município de nascimento e residência, bem como onde o paciente foi diagnosticado com câncer, tipo de tumor, histórico de alcoolismo e tabagismo, entre outros. Esta base mantém registros entre os anos de 1985 e 2015. Em um primeiro momento, para profissionais da área de tecnologia da informação, esta base de dados pode ser de grande valia, demonstrando um potencial enorme para exploração dos dados ali contidos através da construção de gráficos e visualizações customizadas, busca de padrões através de técnicas de data mining ou até mesmo um ponto de partida para comparação dos casos ali contidos com bases de institutos de outros países. Porém, quando esta base de dados, de forma crua, é apresentada a um profissional da área da saúde, ele não tem a mesma capacidade e conhecimento técnico para explorar todo o potencial destes dados como um profissional de TI. Pensando nesta dificuldade que um pesquisador não ligado a área da tecnologia venha a ter para interpretar e utilizar de forma eficiente estas informações disponibilizadas é que propõe-se o desenvolvimento deste trabalho. A fim de gerar visualizações e gráficos customizados, foi criada uma ferramenta para visualização dessa base de uma forma onde o usuário pode interagir com os dados e investigar a informação ali contida, também aplicando regressão linear, uma técnica de mineração de dados, agregando assim novas perspectivas aos dados já existentes. Foram geradas visualizações interativas, gráficos atraentes e instigantes com a capacidade de também explorar regressões lineares. Utilizou-se recursos e bibliotecas disponíveis na linguagem de programação R. Buscando facilitar a disponibilização destes dados, todo o conteúdo gerado foi disponibilizado de forma online, em um servidor R rodando uma aplicação Shiny. Após a finalização da ferramenta alguns profissionais da área foram convidados a realizar testes e deixar feedback quanto a facilidade de uso e relevância desta nova solução para a comunidade de pesquisadores. |
Link biblioteca: | Não informado |
TC Online - Sistema de Trabalhos de Conclusão Online