Análisis y estudio de ronquidos para la detección de trastronos respiratorios durante el sueño

El Síndrome de Apnea-Hipoapnea del Sueño (SAHS) es un trastorno bastante común, con una prevalencia del 2% al 7% de la población. Se estima que el 90% de los enfermos no están diagnosticados, ya que la prueba diagnóstica de Polisomnografía es cara y limitada por el número de camas disponibles en la Unidad del Sueño de los Hospitales. El SAHS presenta un alto impacto social y económico debido a la falta de un descanso adecuado durante el sueño que produce estados de somnolencia durante la vigilia que pueden provocar descenso en la productividad en el trabajo y accidentes en el manejo de maquinaria y vehículos. Así mismo, la situación de hipoxia durante el sueño puede inducir diversas enfermedades circulatorias, neurocognitivas y metabólicas en función de su severidad. Por lo tanto, el poder disponer de un sistema de recomendación de diagnóstico de SAHS de bajo coste, sencillo y que alcance a un gran porcentaje de la población sería de gran utilidad para los Servicios Médicos implicados en el diagnóstico y tratamiento del SAHS. En este Trabajo de Fin de Máster se ha propuesto un método de análisis de los sonidos respiratorios durante el sueño (silencio – respiración – ronquido), registrados fuera de un entorno controlado de laboratorio. Los registros nocturnos fueron realizados por voluntarios en sus domicilios, utilizando sus propios Smartphones o un grabador MP3, sin supervisión directa. De los registros nocturnos, se extrajeron segmentos de audio con los sonidos de actividad respiratoria que contuvieran poco ruido de fondo (ruidos de vehículos, conversaciones, cantos de pájaros, sonidos de mecanismos), siempre que fuera posible. Estos segmentos se dividieron a su vez en ventanas de 100 ms, que fueron clasificadas manualmente en tres clases: Silencio – Respiración – Ronquido. Así mismo, para cada ventana se extrajeron cuatro características a partir de la señal de audio: Zero Crossing Rate, Short Time Energy, Coeficiente de autocorrelación normalizado a 1 ms de retardo y Primer Coeficiente predictor de análisis LPC (Linear Prediction Coding) de 12 polos. Se ha diseñado un método para calcular una recomendación de diagnóstico de SAHS basado en las cuatro características de audio expuestas. Se han evaluado distintos métodos de clasificación, buscando el que mejor rendimiento ofreciera en este problema de clasificación. En este caso, un modelo de RandomForest aplicado a las características extraídas de la señal de audio de los registros nocturnos proporciona una clasificación correcta del diagnóstico SAHS / No-SAHS del 97.33%, con una sensibilidad del 0.973, una especificidad de 0.973 y una AUC (área bajo la curva ROC) de 0.996. Así mismo, las características de audio registradas permiten una clasificación on-line de los eventos respiratorios, ya sean Respiración/Silencio/Ronquido, o No-ronquido/Ronquido. En ambos casos, el modelo de clasificación con mejor rendimiento de los evaluados es RandomForest. La clasificación correcta de Respiración/Silencio/ronquido se produce con un 85.26% de éxito, con una sensibilidad de 0.853, una especificidad de 0.892 y una AUC de 0.944. La clasificación correcta en Ronquido/No-ronquido se produce con un 92.84% de éxito, una sensibilidad de 0.928, una especificidad de 0.859 y AUC de 0.959. Adicionalmente, se ha comprobado que la incorporación de datos biométricos de los voluntarios recogidos mediante formularios STOP-BANG al modelo de clasificación mejora los resultados. En la clasificación de eventos respiratorios Respiración/Silencio/Ronquido se obtiene un 87.09% de éxito con una sensibilidad de 0.871, una especificidad de 0.903 y AUC de 0.953 al añadir el peso, altura y edad del voluntario. En la clasificación de eventos Noronquido/ Ronquido, se mejora la clasificación con RandomForest hasta un 93.54% de éxito, con especificidad de 0.935, sensibilidad de 0.867 y AUC de 0.962 al añadir también peso, altura y edad. Respecto a la clasificación de diagnóstico SAHS/No-SAHS, usando RandomForest de obtiene un 97.95% de éxito, con sensibilidad de 0.98, especificidad de 0.979 y AUC de 0.997 al añadir el género del paciente. Debido al bajo número de voluntarios (7), no se pudieron evaluar todos los datos biométricos recogidos, por lo que habrá que seguir estudiando su aporte en futuros trabajos cuando se disponga de una población de experimentación mayor. Los resultados de diagnóstico de SAHS constituyen un primer paso para el desarrollo futuro de una aplicación de Smartphone que puede ser distribuida como una herramienta de cribado entre la población, de manera que analice los sonidos respiratorios durante el sueño y realice una recomendación de visita al médico especialista si se calcula una alta probabilidad de sufrir SAHS. Los resultados de la clasificación de eventos respiratorios abren la puerta a desarrollar sistemas que estimulen al usuario cuando ronca para intentar evitar que se produzca este hecho. Algunos tipos de apneas son posicionales (se ronca en posición supino), por lo que se podría estimular al paciente cuando ronca para que realizara un cambio de postura a una lateral o prono. Actualmente se realiza con métodos físicos, como por ejemplo, colocando pelotas de tenis cosidas a lo largo de la espalda en una camiseta y poniéndosela para dormir, pero es rechazada por un elevado número de pacientes por ser incómoda. En las apneas posicionales se podría llegar a eliminar totalmente el problema manteniendo la postura adecuada. Todos los datos recogidos y generados a lo largo de este TFM, se incorporaron a una base de datos relacional diseñada exprofeso. El motor de base de datos elegido es PostgreSQL 9.4. Se decidió crear una base de datos con los siguientes objetivos: • Almacenamiento de los datos y resultados de una forma estructurada • Automatización de la entrada de datos y su validación • Posibilitar la carga de datos desde la futura aplicación que se desarrolle para dispositivos móviles • Acceso concurrente a los datos por distintos investigadores • Facilitar el manejo de los datos y su extracción para la realización de análisis • Facilitar la incorporación de nuevos métodos de análisis de la señal de audio y nuevos atributos o características en el futuro • Posibilidad de escalado del sistema en el futuro • Facilitar la copia de seguridad de los datos • Controlar los privilegios de acceso a los datos, así como disponer de una auditoria de accesos, para cumplir con los requisitos de la LOPD en cuanto a tratamiento de datos de carácter personal. Se ha implementado la infraestructura necesaria para que todas las herramientas utilizadas en el análisis, transformación y clasificación de los datos obtenidos puedan acceder directamente a la base de datos. Se han desarrollado varios módulos para automatizar los procesos de análisis y transformación de los datos en Matlab®. Para el análisis de los datos se ha utilizado la herramienta WEKA. Por último, para la validación de los métodos y resultados obtenidos para su aplicación clínica, y la generación automática de patrones de entrenamiento, se han iniciado contactos con diversos hospitales de la Comunidad de Madrid.

The Obstructive Sleep Apnea (OSA) is a fairly common sleep disorder, with a prevalence of 2% to 7% of the population. It is estimated that 90% of patients are not diagnosed. The diagnostic test, nocturnal polysomnography (PSG), is expensive and limited by the number of beds available in the Hospital Sleep Unit. OSA has a high social and economic impact due to lack of adequate rest during sleep, thus producing sleepiness states during the vigil that can cause decreased productivity at work and accidents in the handling of machinery and vehicles. Likewise, the situation of hypoxia during sleep can induce various circulatory, neurocognitive and metabolic diseases according to their severity. Therefore, the possibility to have a low cost, simple OSA diagnostic recommendation system, able to reach a large percentage of the population, would be useful for medical services involved in the diagnosis and treatment of OSA. This Master Thesis proposes a method for analyzing breath sounds during sleep (silent - breathing - snoring), recorded outside of a controlled laboratory environment in order to make a recommendation of OSA diagnostic. Night recordings were conducted by volunteers at their homes, using their own smartphones or a MP3 recorder, without direct supervision. Audio segments containing the desired sounds were extracted, trying that segment contained few background sounds (noise of cars, conversations, bird songs, sounds of mechanisms), whenever possible. These segments were divided in turn in 100 ms windows, which were manually classified into three classes: Silence - Breathing – Snore. Also, for each window, four features were calculated from the extracted audio signal: Zero Crossing Rate, Short Time Energy, autocorrelation coefficient normalized to 1 ms delay, and first predictor coefficient of LPC (Linear Prediction Coding) analysis with 12 poles. To issue a recommendation for OSA diagnosis, a method for analyzing the audio signal based on the four described audio features has been developed. Different classification methods were evaluated, seeking to offer the best performance in this problem. A RandomForest model applied to features extracted from the audio signal of nocturnal records allowed a correct classification of OSA / No-OSA of 97.33% with a sensitivity of 0.973, specificity of 0.973 and an AUC (area under the curve) of 0.996. The registered audio features allow online classification of respiratory events, whether Breathing / Silence / Snore, or Non-snore / Snore. In both cases, the classification model with the best performance is a RandomForest. The correct classification of Breathing / Silence / Snore occurs with 85.26% success rate, with a sensitivity of 0.853, specificity of 0.892 and an AUC of 0.944. The classification into Snore / Non-snore occurs with 92.84% success rate, sensitivity of 0.928, specificity of 0.859 and AUC of 0.959. Additionally, the inclusion of volunteers’ biometric data collected through STOP-BANG forms to the classification improved the results. Classification of respiratory events Breathing / Silence / Snore improves to 87.09% of success rate, with sensitivity of 0.871, specificity of 0.903 and AUC of 0.953 by adding the weight, height and age of the volunteer. In the classification of events Non-Snore / Snore, the RandomForest classification improves to a 93.54% success rate, with specificity of 0.935, sensitivity of 0.867 and 0.962 AUC also by adding weight, height and age. Regarding the OSA diagnostic classification on OSA / No-OSA, the RandomForest improves to 97.95% success rate, with sensitivity of 0.98, specificity of 0.979 and 0.997 AUC by adding the gender of the volunteer. Due to the low number of volunteers (7), we were unable to evaluate all collected biometric data, so we will have to continue studying their contribution in future works, when a larger experimentation population will be available. Results from diagnosis of OSA allow the future development of a Smartphone application that could be distributed as a screening tool among the population to analyze respiratory sounds and issue a recommendation to visit the doctor if a high probability of suffering OSA is estimated. The results from the classification of respiratory events open the door to develop systems that deliver stimuli to the user to try to prevent snoring. Some types of apnea are positional (snoring is produced in supine position). It is possible to stimulate the patient when snoring to conduct a change to a lateral or prone posture. Currently this is done with physical methods, such as placing tennis balls sewn on the back in a shirt. However, this is discarded by a large number of patients because it is uncomfortable. Positional apnea can be fully eliminated by maintaining proper posture. All data collected and generated during this TFM were incorporated into a relational database designed ad-hoc. The chosen database engine is PostgreSQL 9.4. The data base was designed with the following requirements: • Storage of data and results is done in a structured way • Automating data entry and validation is automatized • The system will facilitate the loading of data from the future application that will be developed for mobile devices • Concurrent access to data by different researchers • The system facilitates data management and extraction for the analysis • The system allows the introduction of new methods of analysis of the audio signal and new attributes or features in the future. • Possibility of scaling the system in the future • The system allows backup of data • The system incorporates access control privileges to data and have access audit, to meet the requirements of the Data Protection Act regarding treatment of personal data. All necessary infrastructure was implemented to allow the direct access of the database by the tools used in the analysis, processing and classification of data Several modules have been developed in Matlab® to automate the analysis process and data transformation. WEKA was used for data analysis. Finally, to validate the methods and results for clinical application, we have initiated contacts with various hospitals at Comunidad de Madrid.

Máster Universitario en Investigación e Innovación en Tecnologías de la Información y las Comunicaciones

Country

Spain

Related Organizations

Autonomous University of Madrid
Spain

Keywords

Informática, Sistemas de reconocimiento de formas, Biometría, Síndromes de las apneas del sueño

Impact byBIP!

	selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).	0
	popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.	Average
	influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).	Average
	impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.	Average

Found an issue? Give us feedback

0

Average

Green