El profesor asistente Yuya Hosoda del Centro de Educación Basada en TI (CITE) de la Universidad Tecnológica de Toyohashi desarrolló un método para analizar el tono de las vibraciones de las cuerdas vocales de los humanos a partir del audio de las llamadas. En este método, el tono se mide integrando las cantidades de características extraídas de los espectros de amplitud y fase del habla en el plano complejo.
A través de experimentos se ha demostrado que el método propuesto no solo es eficiente para audios telefónicos cuya banda de frecuencia está restringida por los estándares de comunicación, sino que también funciona de manera robusta en un entorno con ruido de fondo. Para evitar el agravamiento de enfermedades neurodegenerativas como la enfermedad de Parkinson es deseable el diagnóstico precoz de la disartria, que es un síntoma temprano de esta dolencia y también es común en la ELA, la enfermedad de Lyme y otras.
¿Qué es la disartria?
Es un trastorno que se caracteriza por temblores en la voz y respiración alterada. Aunque las pruebas clínicas diagnostican los síntomas a partir de la voz del paciente, requieren mucho tiempo y trabajo. Además, es difícil realizar entrevistas cara a cara en lugares remotos. Por lo tanto, en esta investigación, el objetivo es desarrollar un sistema que diagnostique automáticamente la disartria a través de la telemedicina mediante la realización de rondas de sala a través de dispositivos de comunicación.
En pacientes con disartria se producen anomalías durante la vocalización, en la que la voz se produce por las vibraciones de las cuerdas vocales generadas por el aire liberado de los pulmones en la garganta y la cavidad oral. En este estudio, el propósito reside en analizar el periodo de vibración (tono) para diagnosticar un trastorno en las vibraciones de las cuerdas vocales.
Un método para extraer información adicional de los audios y detectar precozmente el párkinson
Hasta ahora, se ha ideado un método de medición de tono que es robusto contra el ruido de fondo basado en las cantidades de características del espectro de amplitud obtenidas a través del análisis de frecuencia del habla. Sin embargo, debido a los estándares de comunicación, los audios telefónicos carecen del espectro de amplitud deseado para encontrar señales de párkinson. Por lo tanto, extraer cantidades de características de un espectro de amplitud con información reducida puede generar errores en la estimación del tono.
En esta investigación se propone un método para extraer cantidades de características adicionales del espectro de fase, un subproducto del análisis de frecuencia, además del espectro de amplitud. Derivando una ecuación relacional entre el cambio de fase y el tono en las direcciones de tiempo y frecuencia, se ha verificado que el tono se puede estimar aplicando el cambio de fase observado a la ecuación relacional.
Una mejora de la calidad aun con ruido de fondo
Con base en este hallazgo, se extrajeron nuevas cantidades de características del espectro de fase para evaluar cuantitativamente el grado de ajuste a la ecuación relacional. Finalmente, al integrar las cantidades de características extraídas del espectro de amplitud en el plano complejo, se compensó la escasez de características en la estimación del tono del audio mientras se mantenía la robustez contra el ruido de fondo.
En estudios previos que usaban solo el espectro de amplitud, dado que la cantidad de información se reducía por la limitación de banda, se estimó que el tono era más alto que el valor original.
Sin embargo, en el método propuesto, el tono se estima con precisión a partir del audio utilizando las cantidades de características relacionadas con los espectros de amplitud y fase. Además, el error de tono bruto (GPE), un índice de evaluación que indica el porcentaje de segmentos en los que se produjeron errores, mejoró hasta el 9,5% en el método propuesto, frente al 42,2% del estudio anterior. Además, incluso para audio de llamadas con ruido de fondo, este método logró un GPE del 15,2%, lo que demuestra robustez.
Perspectiva de futuro
Aunque este estudio se centró en la estimación del tono para detectar anomalías en las vibraciones de las cuerdas vocales, las anomalías respiratorias y orales también causan disartria. Para detectar estos síntomas, se han ideado métodos que extraen cantidades características del espectro de amplitud. Sin embargo, el uso del espectro de fase no ha sido suficientemente validado. En el futuro, también se trabajará en la extracción de cantidades de características relevantes de los espectros de fase para los otros casos. Además, al analizar exhaustivamente estas cantidades de características, el objetivo es desarrollar un sistema de diagnóstico de disartria que pueda funcionar de manera efectiva con la telemedicina.
Artículo de referencia: Complex-Domain Pitch Estimation Algorithm for Narrowband Speech Signals
Recordamos que SALUD A DIARIO es un medio de comunicación que difunde información de carácter general relacionada con distintos ámbitos sociosanitarios, por lo que NO RESPONDEMOS a consultas concretas sobre casos médicos o asistenciales particulares. Las noticias que publicamos no sustituyen a la información, el diagnóstico y/o tratamiento o a las recomendaciones QUE DEBE FACILITAR UN PROFESIONAL SANITARIO ante una situación asistencial determinada.
SALUD A DIARIO se reserva el derecho de no publicar o de suprimir todos aquellos comentarios contrarios a las leyes españolas o que resulten injuriantes, así como los que vulneren el respeto a la dignidad de la persona o sean discriminatorios. No se publicarán datos de contacto privados ni serán aprobados comentarios que contengan 'spam', mensajes publicitarios o enlaces incluidos por el autor con intención comercial.
En cualquier caso, SALUD A DIARIO no se hace responsable de las opiniones vertidas por los usuarios a través de los canales de participación establecidos, y se reserva el derecho de eliminar sin previo aviso cualquier contenido generado en los espacios de participación que considere fuera de tema o inapropiados para su publicación.
* Campos obligatorios