Powered by OpenAIRE graph
Found an issue? Give us feedback
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

Разработка сервиса для оценки сложности Ð½Ð°ÑƒÑ‡Ð½Ñ‹Ñ ÑÑ‚Ð°Ñ‚ÐµÐ¹ и Ð½Ð¾Ð²Ð¾ÑÑ‚Ð½Ñ‹Ñ ÑÑ‚Ð°Ñ‚ÐµÐ¹ Ñ€Ð°Ð·Ð½Ñ‹Ñ Ð²ÑƒÐ·Ð¾Ð² РФ

выпускная квалификационная работа бакалавра

Разработка сервиса для оценки сложности Ð½Ð°ÑƒÑ‡Ð½Ñ‹Ñ ÑÑ‚Ð°Ñ‚ÐµÐ¹ и Ð½Ð¾Ð²Ð¾ÑÑ‚Ð½Ñ‹Ñ ÑÑ‚Ð°Ñ‚ÐµÐ¹ Ñ€Ð°Ð·Ð½Ñ‹Ñ Ð²ÑƒÐ·Ð¾Ð² РФ

Abstract

Тема выпускной квалификационной работы: «Разработка сервиса для оценки сложности научных статей и новостных статей вузов РФ». Цель работы - создать корпус данных для сервиса оценки сложности ста-тей. Для этого поставлены следующие задачи: определение подходящих источников, автоматизированный сбор данных, классификация данных, а также разработка прототипа сервиса. Были рассмотрены различные источники, включая "Политех Наука и ин-новации", "Архив Проекты Лаборатория ПСПОД" и новостные статьи СПбПУ из раздела "Наука и Инновации". Для автоматизированного сбора данных разработан процесс, включающий сборщики данных, специально разработанные для каждого источника. Сборщики извлекают нужные данные (заголовки, ссылки, метаданные, текст статей) и сохраняют их структурированно. Реализована отказоустойчивая архитектура с планировщиком задач. Так-же решена задача классификации данных, которая помогает отделить статьи по их сложности. Алгоритм основан на существующих метриках и интегрирован в прототип сервиса. Результаты исследования показывают успешность автоматизированно-го сбора данных. Собранные данные отражают основную целевую аудиторию статей, состоящую из студентов старших курсов. Таким образом, контент сер-виса больше подходит для людей с более высоким уровнем компетенции. Важно обратить внимание авторов источников на разработку материалов для начинающих студентов. Это способствует привлечению новых людей в науку и мо-жет заинтересовать молодежь в изучении научных дисциплин. Результаты сбора данных являются ценным вкладом в дальнейшее развитие сервиса. Они будут использованы для анализа и улучшения качества опре-деления уровня сложности статей.

Topic of the graduation qualification work: «Development of a service for assessing the complexity of scientific articles and news articles of Russian universities» The aim of the work is to create a data corpus for the article complexity assessment service. To achieve this, the following tasks were set: identification of suitable sources, automated data collection, data classification, and development of a service prototype. Various sources were considered, including "Polytech Science and Innova-tion," "Archive Projects Laboratory PSPOD," and news articles from SPbPUs "Science and Innovation" section. For automated data collection, a process was developed, including data crawlers specifically designed for each source. The crawlers extract relevant data (headings, links, metadata, article text) and store them in a structured manner. A fault-tolerant architecture with a task scheduler has been implemented. The task of data classification has also been solved, which helps differentiate articles based on their complexity. The algorithm is based on existing metrics and integrated into the service prototype. The research results demonstrate the success of automated data collection. The collected data reflect the main target audience of the articles, consisting of senior students. Thus, the content of the service is more suitable for individuals with a higher level of competence. It is important to draw the attention of source authors to the development of materials for beginner students. This contributes to attracting new people to science and may interest young people in studying scientific disciplines. The data collection results are a valuable contribution to the further development of the service. They will be used for analysis and improvement of the qual-ity of article complexity determination.

Keywords

удобочитаемость текста, data collection, text complexity assessment, сбор данныÑ, data collection automation, оценка сложности текста, text readability, автоматизация сбора данныÑ

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
Beta
sdg_colorsSDGs:
Related to Research communities
Upload OA version
Are you the author of this publication? Upload your Open Access version to Zenodo!
It’s fast and easy, just two clicks!