Downloads provided by UsageCounts
doi: 10.21814/lm.10.1.263
handle: 10347/17691 , 1822/61071
Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).
Lexicometry, Kullback-Leibler divergence, Language and Literature, lexicometria, P, P1-1091, Kullback–Leibler divergence, Divergência lexical, Computational Linguistics, Divergencia de Kullback-Leibler, lexical divergence, lexicometry, divergência lexical, Lexicometria, Divergência de Kullback-Leibler, Philology. Linguistics, Lexical divergence, divergencia de Kullback-Leibler, Natural Language Processing
Lexicometry, Kullback-Leibler divergence, Language and Literature, lexicometria, P, P1-1091, Kullback–Leibler divergence, Divergência lexical, Computational Linguistics, Divergencia de Kullback-Leibler, lexical divergence, lexicometry, divergência lexical, Lexicometria, Divergência de Kullback-Leibler, Philology. Linguistics, Lexical divergence, divergencia de Kullback-Leibler, Natural Language Processing
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 4 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
| views | 19 | |
| downloads | 7 |

Views provided by UsageCounts
Downloads provided by UsageCounts