<script type="text/javascript">
<!--
document.write('<div id="oa_widget"></div>');
document.write('<script type="text/javascript" src="https://www.openaire.eu/index.php?option=com_openaire&view=widget&format=raw&projectId=undefined&type=result"></script>');
-->
</script>
Цель работы – разработка ÑиÑтемы Ð¿Ñ€Ð¾Ð³Ð½Ð¾Ð·Ð¸Ñ€Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ñ‡ÐµÑтва вина на оÑнове его химичеÑких характериÑтик и отзывов клиентов Ñ Ð¿Ñ€Ð¸Ð¼ÐµÐ½ÐµÐ½Ð¸ÐµÐ¼ методов машинного обучениÑ. Ðто позволит виноделам улучшить качеÑтво продукции и оптимизировать бизнеÑ-процеÑÑÑ‹. Задачи, которые решалиÑÑŒ в ходе работы: 1. Сбор и Ð¿Ñ€ÐµÐ´Ð²Ð°Ñ€Ð¸Ñ‚ÐµÐ»ÑŒÐ½Ð°Ñ Ð¾Ð±Ñ€Ð°Ð±Ð¾Ñ‚ÐºÐ° данных. 2. ПоÑтроение и обучение модели Ñлучайного леÑа Ð´Ð»Ñ Ð¿Ñ€Ð¾Ð³Ð½Ð¾Ð·Ð¸Ñ€Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ñ‡ÐµÑтва вина. 3. Оценка ÑффективноÑти модели Ñ Ð¸Ñпользованием различных метрик. 4. Разработка веб-Ð¿Ñ€Ð¸Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð´Ð»Ñ Ð´ÐµÐ¼Ð¾Ð½Ñтрации работы модели и Ð¿Ñ€Ð¾Ð³Ð½Ð¾Ð·Ð¸Ñ€Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ñ‡ÐµÑтва вина на оÑнове пользовательÑких данных. ПоÑÑ‚Ñ€Ð¾ÐµÐ½Ð½Ð°Ñ Ð¼Ð¾Ð´ÐµÐ»ÑŒ Ñлучайного леÑа показала выÑокую точноÑть и ÑтабильноÑть предÑказаний, что подтверждаетÑÑ Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸ÐµÐ¼ Ñредней recall на уровне 0.92 и теÑтовой recall на уровне 0.95. Модель Ñлучайного леÑа учитывает нелинейные завиÑимоÑти между химичеÑкими параметрами вина и его качеÑтвом, что позволÑет доÑтичь более точных предÑказаний. Матрица конфузии показала, что модель правильно клаÑÑифицировала большинÑтво образцов, Ð¼Ð¸Ð½Ð¸Ð¼Ð¸Ð·Ð¸Ñ€ÑƒÑ ÐºÐ°Ðº ложноположительные, так и ложноотрицательные результаты. Ð”Ð»Ñ Ð²Ð¸Ð·ÑƒÐ°Ð»Ð¸Ð·Ð°Ñ†Ð¸Ð¸ и анализа данных иÑпользовалиÑÑŒ библиотеки Pandas и Matplotlib. Приложение предоÑтавлÑет производителÑм возможноÑть Ñвоевременно реагировать на прогнозы, Ð²ÐºÐ»ÑŽÑ‡Ð°Ñ ÑƒÑиление маркетинговых уÑилий в Ñлучае низкого качеÑтва продукции. Ðапример, еÑли прогноз показывает, что качеÑтво вина ниже ожидаемого, производитель может вложить больше ÑредÑтв в рекламные кампании, чтобы повыÑить продажи. Кроме того, анализ данных позволÑет выÑвлÑть ключевые факторы, влиÑющие на качеÑтво вина, и вноÑить ÑоответÑтвующие Ð¸Ð·Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Ð² процеÑÑ Ð¿Ñ€Ð¾Ð¸Ð·Ð²Ð¾Ð´Ñтва. Ðто ÑпоÑобÑтвует улучшению общей ÑффективноÑти бизнеÑа и помогает производителÑм оÑтаватьÑÑ ÐºÐ¾Ð½ÐºÑƒÑ€ÐµÐ½Ñ‚Ð¾ÑпоÑобными на рынке.
The aim of the work is to develop a system for predicting the quality of wine based on its chemical characteristics and customer reviews using machine learning methods. This will allow winemakers to improve product quality and optimize business processes. Tasks addressed during the work: 1. Data collection and preprocessing. 2. Building and training a random forest model for predicting wine quality. 3. Evaluating the effectiveness of the model using various metrics. 4. Developing a web application to demonstrate the models functionality and predict wine quality based on user input. The constructed random forest model demonstrated high accuracy and stability in predictions, as evidenced by an average recall of 0.92 and a test recall of 0.95. The random forest model accounts for nonlinear dependencies between the chemical parameters of wine and its quality, enabling more accurate predictions. The confusion matrix showed that the model correctly classified most samples, minimizing both false positives and false negatives. Pandas and Matplotlib libraries were used for data visualization and analysis. The application provides producers with the opportunity to respond promptly to predictions, including enhancing marketing efforts in the event of low product quality. For example, if the prediction indicates that the wine quality is below expectations, the producer can invest more in advertising campaigns to boost sales. Additionally, data analysis allows identifying key factors affecting wine quality and making appropriate adjustments to the production process. This contributes to improving overall business efficiency and helps producers remain competitive in the market.
Pandas, ÑлÑÑайнÑй леÑ, wine quality, каÑеÑÑво вина, Matplotlib, Flask, machine learning, маÑинное обÑÑение, random forest
Pandas, ÑлÑÑайнÑй леÑ, wine quality, каÑеÑÑво вина, Matplotlib, Flask, machine learning, маÑинное обÑÑение, random forest
citations This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |