
Высоконагруженным системам требуется мониторинг для обеспечения удовлетворенности пользователей сервисом, уровнем обслуживания, причем в реальном режиме. Исследование проводилось на пяти действующих системах различного назначения (процессинг платежей, торговые площадки, биллинг, медиасервисы, IaaS-платформы) в период с сентября 2023 по апрель 2024 года. Используются методы системного анализа, доказательный подход к метрикам учета требований пользователей. Для детектирования аномалий применялся критерий Ирвина, для прогнозирования пропускной способности — адаптированная логистическая модель Ферхюльста. Результаты: проанализированы возможности проактивного и предиктивного мониторинга; предложены процедуры выявления аномалий и ранжирования факторов по их потребительской значимости; разработана математическая модель пропускной способности системы, апробированная на тестовом примере. Разработанная процедура матричной оценки SLA-факторов включает четыре этапа и была проверена на практике. Экспериментально подтверждено снижение количества инцидентов на 68% и сокращение времени восстановления (MTTR) на 74–75% по сравнению с реактивным мониторингом. Результаты внедрены в двух коммерческих проектах. Указаны практические возможности применения результатов для проектирования и эксплуатации высоконагруженных платформ и микросервисных архитектур.
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
