Busca avançada
Ano de início
Entree

Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas

Processo: 15/05676-8
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de julho de 2015
Data de Término da vigência: 31 de julho de 2017
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Acordo de Cooperação: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Vanessa Queiroz Marinho
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):15/23803-7 - Atribuição de autoria através do uso de métodos tradicionais e redes complexas, BE.EP.MS
Assunto(s):Processamento de linguagem natural   Processamento de texto   Teoria dos grafos   Reconhecimento de padrões   Redes complexas
Palavra(s)-Chave do Pesquisador:Processamento de texto | Reconhecimento de Padrões | Redes Complexas | teoria dos grafos | Processamento de Línguas Naturais

Resumo

A modelagem de grafos e redes complexas vem sendo aplicada com sucesso em diferentes domínios, sendo objeto de estudo de distintas áreas que incluem, por exemplo, a matemática e a computação. A descoberta de que métodos derivados do estudo de redes complexas podem ser utilizados para analisar textos em seus distintos níveis de complexidade proporcionou grandes avanços em tarefas de processamento de línguas naturais. Exemplos de aplicações analisadas com os métodos e ferramentas de redes complexas são a detecção de conceitos relevantes, a criação de sumarizadores extrativos automáticos e reconhecedores de autoria. Esta última tarefa, que é foco deste projeto de pesquisa, tem sido estudada com certo sucesso através da representação de redes de adjacência de palavras que conectam apenas as palavras mais próximas. O objetivo deste projeto é estender a modelagem tradicional, escolhendo-se a janela de conexão ótima para o problema, para um dado conjunto de treinamento. Além disso, pretende-se utilizar informação de conectividade de palavras funcionais para complementar a caracterização de estilo de autores. Finalmente, pretende-se criar classificadores híbridos que sejam capazes de combinar fatores tradicionais com as propriedades fornecidas pela análise topológica de redes complexas. Através da adaptação, combinação e aperfeiçoamento da modelagem, pretendemos não apenas melhorar o desempenho dos sistemas de caracterização estilística textual e reconhecimento de autoria, mas também entender melhor quais são os fatores quantitativos textuais (medidos via redes) que podem ser utilizados na área de estilometria. Os avanços obtidos durante este projeto podem ser úteis para estudar aplicações relacionadas, como é o caso de análise de inconsistências estilísticas e plagiarismos. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (7)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CORREA JR, EDILSON A.; MARINHO, VANESSA Q.; AMANCIO, DIEGO R.. Semantic flow in language networks discriminates texts by genre and publication date. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 557, . (15/05676-8, 16/19069-9)
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL. Labelled network subgraphs reveal stylistic subtleties in written texts. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 4, p. 620-638, . (15/05676-8, 14/20830-0, 15/23803-7, 16/19069-9)
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R.. Paragraph-based representation of texts: A complex networks approach. INFORMATION PROCESSING & MANAGEMENT, v. 56, n. 3, p. 479-494, . (17/13464-6, 15/22308-2, 16/19069-9, 11/50761-2, 15/05676-8)
DE ARRUDA, HENRIQUE FERRAZ; SILVA, FILIPI NASCIMENTO; MARINHO, VANESSA QUEIROZ; AMANCIO, DIEGO RAPHAEL; COSTA, LUCIANO DA FONTOURA. Representation of texts as complex networks: a mesoscopic approach. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 1, p. 125-144, . (16/19069-9, 11/50761-2, 15/05676-8, 14/20830-0, 15/08003-4)
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL; IEEE. Authorship attribution via network motifs identification. PROCEEDINGS OF 2016 5TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS 2016), v. N/A, p. 6-pg., . (15/05676-8, 14/20830-0, 15/23803-7)
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; LIMA, THALES S.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. An image analysis approach to text analytics based on complex networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 510, p. 110-120, . (16/19069-9, 11/50761-2, 15/22308-2, 15/05676-8)
CORREA, EDILSON A., JR.; MARINHO, VANESSA Q.; DOS SANTOS, LEANDRO B.; BERTAGLIA, THALES F. C.; TREVISO, MARCOS V.; BRUM, HENRICO B.; IEEE. PELESent: Cross-domain polarity classification using distant supervision. 2017 6TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS), v. N/A, p. 6-pg., . (15/05676-8)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
MARINHO, Vanessa Queiroz. Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas. 2017. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.

OSZAR »