Powered by OpenAIRE graph
Found an issue? Give us feedback
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

Прогноз качества вина на основе Ñ Ð¸Ð¼Ð¸Ñ‡ÐµÑÐºÐ¸Ñ ÐºÐ¾Ð¼Ð¿Ð¾Ð½ÐµÐ½Ñ‚Ð¾Ð² и отзывов клиентов

выпускная квалификационная работа бакалавра

Прогноз качества вина на основе Ñ Ð¸Ð¼Ð¸Ñ‡ÐµÑÐºÐ¸Ñ ÐºÐ¾Ð¼Ð¿Ð¾Ð½ÐµÐ½Ñ‚Ð¾Ð² и отзывов клиентов

Abstract

Цель работы – разработка системы прогнозирования качества вина на основе его химических характеристик и отзывов клиентов с применением методов машинного обучения. Это позволит виноделам улучшить качество продукции и оптимизировать бизнес-процессы. Задачи, которые решались в ходе работы: 1. Сбор и предварительная обработка данных. 2. Построение и обучение модели случайного леса для прогнозирования качества вина. 3. Оценка эффективности модели с использованием различных метрик. 4. Разработка веб-приложения для демонстрации работы модели и прогнозирования качества вина на основе пользовательских данных. Построенная модель случайного леса показала высокую точность и стабильность предсказаний, что подтверждается значением средней recall на уровне 0.92 и тестовой recall на уровне 0.95. Модель случайного леса учитывает нелинейные зависимости между химическими параметрами вина и его качеством, что позволяет достичь более точных предсказаний. Матрица конфузии показала, что модель правильно классифицировала большинство образцов, минимизируя как ложноположительные, так и ложноотрицательные результаты. Для визуализации и анализа данных использовались библиотеки Pandas и Matplotlib. Приложение предоставляет производителям возможность своевременно реагировать на прогнозы, включая усиление маркетинговых усилий в случае низкого качества продукции. Например, если прогноз показывает, что качество вина ниже ожидаемого, производитель может вложить больше средств в рекламные кампании, чтобы повысить продажи. Кроме того, анализ данных позволяет выявлять ключевые факторы, влияющие на качество вина, и вносить соответствующие изменения в процесс производства. Это способствует улучшению общей эффективности бизнеса и помогает производителям оставаться конкурентоспособными на рынке.

The aim of the work is to develop a system for predicting the quality of wine based on its chemical characteristics and customer reviews using machine learning methods. This will allow winemakers to improve product quality and optimize business processes. Tasks addressed during the work: 1. Data collection and preprocessing. 2. Building and training a random forest model for predicting wine quality. 3. Evaluating the effectiveness of the model using various metrics. 4. Developing a web application to demonstrate the models functionality and predict wine quality based on user input. The constructed random forest model demonstrated high accuracy and stability in predictions, as evidenced by an average recall of 0.92 and a test recall of 0.95. The random forest model accounts for nonlinear dependencies between the chemical parameters of wine and its quality, enabling more accurate predictions. The confusion matrix showed that the model correctly classified most samples, minimizing both false positives and false negatives. Pandas and Matplotlib libraries were used for data visualization and analysis. The application provides producers with the opportunity to respond promptly to predictions, including enhancing marketing efforts in the event of low product quality. For example, if the prediction indicates that the wine quality is below expectations, the producer can invest more in advertising campaigns to boost sales. Additionally, data analysis allows identifying key factors affecting wine quality and making appropriate adjustments to the production process. This contributes to improving overall business efficiency and helps producers remain competitive in the market.

Keywords

Pandas, случайный лес, wine quality, качество вина, Matplotlib, Flask, machine learning, машинное обучение, random forest

  • BIP!
    Impact byBIP!
    citations
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
citations
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
Upload OA version
Are you the author? Do you have the OA version of this publication?