Actions
  • shareshare
  • link
  • cite
  • add
add
auto_awesome_motion View all 3 versions
Publication . Article . 2022

Kuidas ära tunda adjektiivi? : Korpuskäitumise mustrite analüüs

Maria Tuulik; Ene Vainik; Geda Paulsen; Ahti Lohk;
Open Access
Estonian
Published: 15 Jun 2022
Publisher: Uppsala universitet, Finsk-ugriska språk
Country: Sweden
Abstract

Artiklis uurime adjektiivi morfosüntaktilisi tunnuseid jaselgitame, kuivõrd on prototüüpsele adjektiivile omistatavad tunnused(nt ühildumine, võrrete moodustamine) adjektiiviklassile eriomased.Loome neile tunnustele tuginedes parameetrid, mille abil eristamekorpuse andmete põhjal adjektiive teistest sõnaliikidest. Tüüpiliseadjektiivi korpusprofiili tuvastamise kaugem eesmärk on rakenduseloomine, mis võimaldaks leksikograafidel ebaselgete juhtumite puhulkontrollida sõna adjektiviseerumise astet. Tutvustame kuue parameetritestimise tulemust 12 sõnarühma peal, millest igaühte kuulub 10 sõna.Sõnavalikul arvestame adjektiiviklassi piiripealseid juhtumeid ja leksikograafilisi kitsaskohti. Analüüsime, mil määral hälbivad erinevadtestrühmad testitud parameetrite põhjal prototüüpsest adjektiiviklassi esindajast ning vaatleme ka variatsiooni adjektiiviklassi sees.Kõrvale kaldeanalüüs võimaldab välja selgitada parima eristusvõimegaparameetrid. Eukleidilise kauguse mõõtmine eristab hästi adjektiivisarnased sõnad ja rühmad nendest, mis sarnanevad prototüüpseleadjektiivile vähem. In the article, we examine the morphosyntactic features characteristic of the adjective class and test different parameters in the corpora to differentiate adjectives from other word classes. We provide an overview of the test results of six parameters. In the study, we analysed 12 groups of 10 words each. The test groups and test words were chosen manually, with consideration given to the problematic cases outlined by the lexicographers (Paulsen, Vainik, and Tuulik 2019). We compared different types of adjectives or near to adjectives (the test groups) as well as different word classes (the control groups). To analyse the parameters’ capability to set adjectives apart, a deviation study was conducted. The groups of particular focus (regular verb participles vs. adjectives) were best differentiated by three parameters. Among all groups, the comparative form parameter was the most accurate in the deviation study at setting prototypical adjectives apart from other test groups. A Euclidean distance analysis was able to differentiate adjective-like test words and test groups from others that do not behave similarly to prototypical adjectives. As all tested parameters produced meaningful results and were able to differentiate some word classes from adjectives, they can be input for a new digital tool that would show a word’s deviation from prototypical word class representatives to help lexicographers with word-class-related decisions. 

Subjects

parts of speech, morphosyntax, lexicography, language technology, Estonian, sõnaliigid, morfosüntaks, leksikograafia, keeletehnoloogia, eesti keel, Language Technology (Computational Linguistics), Språkteknologi (språkvetenskaplig databehandling), Linguistics and Language, Education, Language and Linguistics

Related Organizations
moresidebar