
Рассмотрены проблемы использования социально-демографической информации о пользователях при прогнозировании кликов в рекламной сети методами машинного обучения. Предложены варианты предварительной подготовки социально-демографических факторов для максимизации извлекаемой из них информации о кликах, среди которых использовались построение регрессии и кластеризация пользователей. Произведено сравнение предложенных вариантов с использованием метрики, основанной на правдоподобии обученной модели.
The present article considers the problems of exploiting the sociodemographic data about users in predicting clicks in a banner system via machine learning methods. Several variants of pre-processing sociodemographic data to maximize retrievable information about clicks are proposed, among which are: regression model and user clistering. Comparison of those is done using a metric based on the likelihood of the trained models.
ИНТЕРНЕТ-РЕКЛАМА, ПРОГНОЗИРОВАНИЕ КЛИКОВ, МАШИННОЕ ОБУЧЕНИЕ, СОЦИАЛЬНО-ДЕМОГРАФИЧЕСКИЕ ПРИЗНАКИ, РЕГРЕССИЯ, КЛАСТЕРИЗАЦИЯ
ИНТЕРНЕТ-РЕКЛАМА, ПРОГНОЗИРОВАНИЕ КЛИКОВ, МАШИННОЕ ОБУЧЕНИЕ, СОЦИАЛЬНО-ДЕМОГРАФИЧЕСКИЕ ПРИЗНАКИ, РЕГРЕССИЯ, КЛАСТЕРИЗАЦИЯ
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
