Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Наукові журнали Наці...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

A METHOD FOR OPTIMIZING THE BASIC WAVELET FUNCTION BY THE CRITERION OF MINIMIZING THE ERROR OF APPROXIMATION OF SPEECH SIGNALS

A METHOD FOR OPTIMIZING THE BASIC WAVELET FUNCTION BY THE CRITERION OF MINIMIZING THE ERROR OF APPROXIMATION OF SPEECH SIGNALS

Abstract

The paper presents a developed method for selecting adaptive wavelet features for speech signal recognition based on optimizing the base wavelet function by the criterion of minimizing the approximation error. To build the base wavelet function, it was proposed to use a genetic algorithm, in which the accuracy of speech signal classification by the support vector method is the objective function. The main advantage of the constructed adaptive wavelet function using the proposed method is the fact that it takes into account the dynamics of the speech signal throughout time, since a wavelet function is built at each scale that depends on the entire signal and contains information about all its changes, which directly affects the improvement of the resolution of wavelet features of speech recognition. The analysis of speech signals by the proposed method will consist of the following steps: 1) determination of the speech signal metaclass; 2) selection of the optimal pair “adaptive wavelet function - classifier”; 3) wavelet analysis of the speech signal using the constructed adaptive wavelet function; 4) final classification of adaptive wavelet features for speech signal recognition. It is shown that the use of the basic wavelet functions generated on the basis of the presented method for the selection of adaptive wavelet features for speech signal recognition allows to obtain a steady increase in classification accuracy. In particular, in comparison with the mel-frequency capstral coefficients, the accuracy improvement ranges from 4.1 to 8.3 % for different phonemes of the Ukrainian language. It has been shown that the convolved adaptive wavelet function has the property of preserving information about dynamic processes in the speech signal, and, as a result, the dimensionality of adaptive wavelet recognition features is reduced by 1.5 times without loss of classification accuracy. It is shown that the use of the proposed method allows achieving better speech phoneme classification characteristics than using the classical analysis based on mel-frequency cepstral coefficients by a factor of 1.4. В роботі представлено розроблений метод виділення адаптивних вейвлет-ознак розпізнавання мовних сигналів на основі оптимізації базової вейвлет-функції за критерієм мінімізації помилки апроксимації. Для побудови базової вейвлет-функції було запропоновано використовувати генетичний алгоритм, у якому в якості цільової функції виступає точність класифікації мовних сигналів методом опорних векторів. Головною перевагою побудованої адаптивної вейвлет-функції за допомогою запропонованого методу є той факт, що вона враховує динаміку мовного сигналу впродовж всього часу, оскільки на кожному масштабі будується вейвлет-функція, яка залежить від усього сигналу та містить у собі інформацію про всі його зміни, що безпосередньо впливає на покращення роздільної здатності вейвлет-ознак розпізнавання мови. Аналіз мовних сигналів запропонованим методом буде складатися із наступних кроків: 1) визначення метакласу мовного сигналу; 2) вибір оптимальної пари «адаптивна вейвлет-функція - класифікатор»; 3) вейвлет-аналіз мовного сигналу з використанням побудованої адаптивної вейвлет-функції; 4) підсумкова класифікація адаптивних вейвлет-ознак розпізнавання мовних сигналів. Показано, що використання базових вейвлет-функцій, згенерованих на основі представленого методу для виділення адаптивних вейвлет-ознак розпізнавання мовних сигналів дає змогу отримати стійке підвищення точності класифікації. Зокрема, в порівнянні з мел-частотними кепстральними коефіцієнтами покращення точності становить від 4.1 до 8.3 % для різних фонем української мови. Показано, що згенерована адаптивна вейвлет-функція має властивість збереження інформації про динамічні процеси в мовному сигналі, і, як наслідок, у 1.5 рази скорочується розмірність адаптивних вейвлет-ознак розпізнавання без втрати точності класифікації. Показано, що використання запропонованого методу дає змогу досягти кращих характеристик класифікації фонем мови, ніж з використанням класичного аналізу на основі мел-частотних кепстральних коефіцієнтів у 1.4 рази.

Keywords

мінімізація помилки апроксимації, support vector method, wavelet function optimization, мовні сигнали, метод опорних векторів, генетичний алгоритм, adaptive wavelet features for speech recognition, оптимізація вейвлет-функції, genetic algorithm, minimization of approximation error, адаптивні вейвлет-ознаки розпізнавання мови, вейвлет-перетворення, wavelet transform, speech signals

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average