
The paper presents a developed method for selecting adaptive wavelet features for speech signal recognition based on optimizing the base wavelet function by the criterion of minimizing the approximation error. To build the base wavelet function, it was proposed to use a genetic algorithm, in which the accuracy of speech signal classification by the support vector method is the objective function. The main advantage of the constructed adaptive wavelet function using the proposed method is the fact that it takes into account the dynamics of the speech signal throughout time, since a wavelet function is built at each scale that depends on the entire signal and contains information about all its changes, which directly affects the improvement of the resolution of wavelet features of speech recognition. The analysis of speech signals by the proposed method will consist of the following steps: 1) determination of the speech signal metaclass; 2) selection of the optimal pair “adaptive wavelet function - classifier”; 3) wavelet analysis of the speech signal using the constructed adaptive wavelet function; 4) final classification of adaptive wavelet features for speech signal recognition. It is shown that the use of the basic wavelet functions generated on the basis of the presented method for the selection of adaptive wavelet features for speech signal recognition allows to obtain a steady increase in classification accuracy. In particular, in comparison with the mel-frequency capstral coefficients, the accuracy improvement ranges from 4.1 to 8.3 % for different phonemes of the Ukrainian language. It has been shown that the convolved adaptive wavelet function has the property of preserving information about dynamic processes in the speech signal, and, as a result, the dimensionality of adaptive wavelet recognition features is reduced by 1.5 times without loss of classification accuracy. It is shown that the use of the proposed method allows achieving better speech phoneme classification characteristics than using the classical analysis based on mel-frequency cepstral coefficients by a factor of 1.4. В роботі представлено розроблений метод виділення адаптивних вейвлет-ознак розпізнавання мовних сигналів на основі оптимізації базової вейвлет-функції за критерієм мінімізації помилки апроксимації. Для побудови базової вейвлет-функції було запропоновано використовувати генетичний алгоритм, у якому в якості цільової функції виступає точність класифікації мовних сигналів методом опорних векторів. Головною перевагою побудованої адаптивної вейвлет-функції за допомогою запропонованого методу є той факт, що вона враховує динаміку мовного сигналу впродовж всього часу, оскільки на кожному масштабі будується вейвлет-функція, яка залежить від усього сигналу та містить у собі інформацію про всі його зміни, що безпосередньо впливає на покращення роздільної здатності вейвлет-ознак розпізнавання мови. Аналіз мовних сигналів запропонованим методом буде складатися із наступних кроків: 1) визначення метакласу мовного сигналу; 2) вибір оптимальної пари «адаптивна вейвлет-функція - класифікатор»; 3) вейвлет-аналіз мовного сигналу з використанням побудованої адаптивної вейвлет-функції; 4) підсумкова класифікація адаптивних вейвлет-ознак розпізнавання мовних сигналів. Показано, що використання базових вейвлет-функцій, згенерованих на основі представленого методу для виділення адаптивних вейвлет-ознак розпізнавання мовних сигналів дає змогу отримати стійке підвищення точності класифікації. Зокрема, в порівнянні з мел-частотними кепстральними коефіцієнтами покращення точності становить від 4.1 до 8.3 % для різних фонем української мови. Показано, що згенерована адаптивна вейвлет-функція має властивість збереження інформації про динамічні процеси в мовному сигналі, і, як наслідок, у 1.5 рази скорочується розмірність адаптивних вейвлет-ознак розпізнавання без втрати точності класифікації. Показано, що використання запропонованого методу дає змогу досягти кращих характеристик класифікації фонем мови, ніж з використанням класичного аналізу на основі мел-частотних кепстральних коефіцієнтів у 1.4 рази.
мінімізація помилки апроксимації, support vector method, wavelet function optimization, мовні сигнали, метод опорних векторів, генетичний алгоритм, adaptive wavelet features for speech recognition, оптимізація вейвлет-функції, genetic algorithm, minimization of approximation error, адаптивні вейвлет-ознаки розпізнавання мови, вейвлет-перетворення, wavelet transform, speech signals
мінімізація помилки апроксимації, support vector method, wavelet function optimization, мовні сигнали, метод опорних векторів, генетичний алгоритм, adaptive wavelet features for speech recognition, оптимізація вейвлет-функції, genetic algorithm, minimization of approximation error, адаптивні вейвлет-ознаки розпізнавання мови, вейвлет-перетворення, wavelet transform, speech signals
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
