Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Adaptivni Sistemi Av...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

Data recognition in documents and classification algorithm

Data recognition in documents and classification algorithm

Abstract

Об’єктом дослідження є процес переведення державних публічних послуг в електронну форму, який пов’язаний із необхідністю переходу від моделі послуги, яка орієнтована на документи, до моделі послуги, яка орієнтована на дані. При моделюванні державних публічних послуг використовується загальна модель даних опису публічних послуг, які надаються державою. В основі цієї моделі лежить використання базових словників, які необхідні для класифікації даних та сутностей, пов’язаних із даною предметною областю. Таким чином, в статті розглядається актуальна задача аналізу документів для розпізнавання даних, які мають бути класифіковані з використанням базових словників. Для вирішення поставленої задачі розроблено алгоритм, який дозволяє на основі аналізу документів здійснити розпізнавання наявних в них даних. Для сформованої таким чином множини даних, пов’язаної із документом, на другому етапі роботиалгоритму здійснюється класифікація із використанням базових словників. При створенні алгоритму враховувались результати аналізу досліджень в розпізнаванні та класифікації даних. В статті розглянуто ілюстративний приклад та наведено результати класифікації даних для базового словника «Core Person Vocabulary». Практична цінність розробленого алгоритму полягає в тому, що він використовується в алгоритмічному забезпеченні інформаційної системи для розпізнавання та класифікації даних в документах, що дає можливість перейти до нової моделі представлення публічних послуг орієнтованої на дані. Використання інформаційної системи для розпізнавання та класифікації даних в документах є важливим в процесах реінжинірингу публічних послуг, при створенні нових послуг та при переведенні публічних послуг в електронний вигляд. Це дозволяє підвищити ефективність в цілому системи надання державних публічних послуг. Бібл. 5, іл. 4, табл. 1

The object of the study is the process of transferring state public services into electronic form, which is associated with the need to transfer from a document-based service model to a data-based service model. When modeling state public services, a common data model for describing public services offered in administration is being used. This model is based on the use of "Core Vocabularies" that are necessary for the classification of data and entities related to this subject area. Thus, the article considers the actual task of analyzing documents to recognize data that should be classified using "Core Vocabularies". To solve the stated problem, an algorithm has been developed that allows recognizing the data contained in documents based on document analysis. The data set associated with the document formed as a result of the analysis is classified using "Core Vocabularies" at the second stage of the algorithm. When creating the algorithm, the results of the analysis of research in data recognition and classification were taken into account. The article discusses an illustrative example and presents the results of data classification for the "Core Person Vocabulary". The practical worth of the developed algorithm is that it is being used in the algorithmic software developed for an information system for recognizing and classifying data in documents, which makes it possible to transfer to a new model of data-based representation of public services. The use of an information system for recognizing and classifying data in documents is of high importance in the processes of reengineering state public services, creating new public services, and transferring public services to electronic form. This leads to drastic increase in the efficiency of the state public service system. Ref. 5, pic. 4, tabl. 1

Keywords

інформаційна система для розпізнавання та класифікації, document analysis, розпізнавання даних, класифікація даних, text mining techniques, data recognition, методи розпізнавання тексту, data classification, аналіз документів, information system for data recognition and classification

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
gold