Käesoleva magistritöö eesmärgiks on välja selgitada otstarbekad meetodid krediidiriski hindamiseks, kui argumenttunnused on valdavalt kategoriaalsed. Töös võrreldakse nelja erinevat prognoosimudelit – logistilist regressiooni, LASSO regressiooni, klassifitseerimispuud ning gradient boosting algoritmi. Töös kasutatav andmestik sisaldab infot väikelaenu saanud isikute kohta ning uuritavaks tunnuseks on laenu staatus, mis kirjeldab, kas laen on krediidiasutusele tagastatud või mitte.
LASSO regressioon, credit risk, logistic regression, logistiline regressioon, kategoriaalsed tunnused, krediidirisk, klassifitseerimispuu, gradient boosting, LASSO regression, categorical variables, classification tree
