
handle: 1822/79649
Nos dias de hoje, no âmbito da investigação e da prática lexicográfica, a utilização de corpora tem-se revelado muito recorrente, principalmente pelo facto de ser considerada como a metodologia mais fiável para alcançarmos exemplos representativos das línguas naturais. Embora as ferramentas de Processamento de Língua Natural (PLN) tenham conseguido grandes avanços na anotação morfossintática de textos, continua a faltar uma anotação semântica exaustiva e sistematizada. Esta carência evidencia-se principalmente quando se fala em lexicografia e gramática de valências, pois na bibliografia teórica (cf. Domínguez, 2011) aponta-se para o facto de a valência semântica ser fulcral para a delimitação de argumentos que acompanham um lexema considerado como portador de valência. Daí surge, no contexto desta investigação, a necessidade de uma aproximação à anotação semântica de corpora, em que se preste atenção especial aos argumentos no nível da frase nominal e ao seu comportamento semântico, para além da etiquetagem morfossintática com a qual contamos normalmente. A gramática e lexicografia de valências, assim como a semântica léxica, constituem, portanto, o ponto de partida teórico da presente dissertação de mestrado. No que diz respeito à metodologia, o presente trabalho cingir-se-á à análise das estruturas argumentais de três nomes do campo semântico da comunicação em alemão (Bericht, Diskussion e Frage) e, através de metodologia de PLN, desenhar-se-á um API script que possibilite o cruzamento de dados de corpora com alguns pacotes lexicais delimitados e criados no âmbito dos projetos PORTLEX, MultiGenera e MultiComb. Esta metodologia permitir-nos-á analisar, a posteriori, a fiabilidade do script desenvolvido, e conduzirá para a extração de conclusões relativas ao valor que poderia trazer consigo a anotação semântica sistematizada de corpora.
Anotação semântica, Corpora, Semantische annotation, Nominale valenz, Korpora, Lexikalisches paket, Valência nominal, Pacote lexical, PLN, NLP
Anotação semântica, Corpora, Semantische annotation, Nominale valenz, Korpora, Lexikalisches paket, Valência nominal, Pacote lexical, PLN, NLP
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
