Atribuição de autoria através do uso de métodos tradicionais e redes complexas
Modelagem e reconhecimento de padrões em textos com redes complexas
Agrupamento de dados baseado em grafos com árvores geradoras mínimas e distância ...
Processo: | 15/05676-8 |
Modalidade de apoio: | Bolsas no Brasil - Mestrado |
Data de Início da vigência: | 01 de julho de 2015 |
Data de Término da vigência: | 31 de julho de 2017 |
Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
Acordo de Cooperação: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) |
Pesquisador responsável: | Diego Raphael Amancio |
Beneficiário: | Vanessa Queiroz Marinho |
Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
Bolsa(s) vinculada(s): | 15/23803-7 - Atribuição de autoria através do uso de métodos tradicionais e redes complexas, BE.EP.MS |
Assunto(s): | Processamento de linguagem natural Processamento de texto Teoria dos grafos Reconhecimento de padrões Redes complexas |
Palavra(s)-Chave do Pesquisador: | Processamento de texto | Reconhecimento de Padrões | Redes Complexas | teoria dos grafos | Processamento de Línguas Naturais |
Resumo A modelagem de grafos e redes complexas vem sendo aplicada com sucesso em diferentes domínios, sendo objeto de estudo de distintas áreas que incluem, por exemplo, a matemática e a computação. A descoberta de que métodos derivados do estudo de redes complexas podem ser utilizados para analisar textos em seus distintos níveis de complexidade proporcionou grandes avanços em tarefas de processamento de línguas naturais. Exemplos de aplicações analisadas com os métodos e ferramentas de redes complexas são a detecção de conceitos relevantes, a criação de sumarizadores extrativos automáticos e reconhecedores de autoria. Esta última tarefa, que é foco deste projeto de pesquisa, tem sido estudada com certo sucesso através da representação de redes de adjacência de palavras que conectam apenas as palavras mais próximas. O objetivo deste projeto é estender a modelagem tradicional, escolhendo-se a janela de conexão ótima para o problema, para um dado conjunto de treinamento. Além disso, pretende-se utilizar informação de conectividade de palavras funcionais para complementar a caracterização de estilo de autores. Finalmente, pretende-se criar classificadores híbridos que sejam capazes de combinar fatores tradicionais com as propriedades fornecidas pela análise topológica de redes complexas. Através da adaptação, combinação e aperfeiçoamento da modelagem, pretendemos não apenas melhorar o desempenho dos sistemas de caracterização estilística textual e reconhecimento de autoria, mas também entender melhor quais são os fatores quantitativos textuais (medidos via redes) que podem ser utilizados na área de estilometria. Os avanços obtidos durante este projeto podem ser úteis para estudar aplicações relacionadas, como é o caso de análise de inconsistências estilísticas e plagiarismos. (AU) | |
Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
Mais itensMenos itens | |
TITULO | |
Matéria(s) publicada(s) em Outras Mídias ( ): | |
Mais itensMenos itens | |
VEICULO: TITULO (DATA) | |
VEICULO: TITULO (DATA) | |