Acoustic and Aerodynamic Analysis of Speech Production by Patients with Unilateral Vocal Fold Paralysis (Análise Acústica e Aerodinâmica da Produção de Fala por Pacientes com Paralisia Unilateral das Pregas Vocais)

Luís Jesus, Anna Barney, António Teixeira, Margarida Santos, Aníbal Ferreira, André Araújo, Helena Vilarinho, Ricardo Santos and Cátia Pinho

Fundação para a Ciência e a Tecnologia, Portugal R&D Project (Projecto de I&D) PTDC/SAU-BEB/67384/2006

English

The focus of our study will be sounds that are produced by the interaction of two simultaneous aerodynamic sources, which have a very different nature (one is periodic and the other aperiodic). To measure properties of sounds such as (voiced) fricatives, stops or affricates we will collect acoustic, aerodynamic and electroglographic recordings. We'll try to characterize fricatives and stops in terms of their production mechanisms based on two approaches: volume velocity and pressure measurements, time- or frequency-domain parameters derived from the acoustic signal.

The far-field acoustic signal is the result of the excitation of the vocal tract transfer function by the source (for unvoiced) or sources (for voiced fricatives and stops). If the noise source is distributed, poles and zeros of the transfer function corresponding to back-cavity resonances tend nearly to cancel. Uncancelled poles correspond to front cavity resonances, and their spectral prominence will depend on both the losses (especially radiation losses) and the noise source strength. The noise source spectrum depends on the shape of the constriction, the tract downstream of it, and the flow velocity through it. The noise source spectrum envelope has its highest amplitude at low frequencies and falls off smoothly. The noise source is weaker in voiced fricatives and stops than their unvoiced counterparts. The frication source location can be constant as in most examples of /s/ and /S/, or it can be changing over time as in any fricative or stop which is surrounded by different vowels.

We are then interested in the source type, since that not only differentiates voiced and unvoiced versions, but, in indicating whether the source is localized or distributed, offers clues to the place. Our goal is to describe the acoustic and aerodynamic variation caused by the context or the way in which a particular fricative or stop is spoken. Aerodynamic measurements are paramount to this research because if we were to restrict ourselves to the far-field acoustic spectrum, it would not always be possible to differentiate source and filter characteristics unambiguously. The aerodynamic characteristics of fricatives and stops can be related to specific properties of the transfer function and source spectrum during the production of these sounds.

When speech is impaired due to organic lesions of the vocal folds, phonation clearly changes, because the dynamic patterns of closed and open phases of the vibratory cycle are quite irregular. These difficulties to maintain modal vibration present a rich experimental scenario and can be the basis of models of voicing over the normal speaking range. Vocal fold paralysis results from injury to the superior laryngeal nerve (SLN) or the recurrent laryngeal nerve (RLN), causing abnormalities in the fundamental frequency (F0) of voicing, breathy weak dysphonia, hoarseness and limitations in speech loudness. Effortful phonation, excessive air pressure to produce speech, displophonia, stridor and shortness of breath with exertion are also often reported. Unilateral vocal fold paralysis (UVFP) occurs from a dysfunction of the RLN causing the paralysis in the paramedian position or limited motion of one vocal fold. UVFP can be diagnosed using endoscopy, radiology (fluoroscopy, RT, CT or MRI), electromyography, and voice evaluation by a speech and language therapist (SLT). This is helpful to determine the degree of compensatory behaviour, the baseline voice quality and ability, and the most adequate treatment. The evaluation by a SLT often includes aerodynamic and laryngeal efficiency analysis of speech production. Voice therapy by a SLT is often the only treatment required for an individual with UVFP, but can also be part of a combined treatment with surgical medialization. The SLT usually works on F0 modification, increasing breath support and loudness, and finding the optimal head and neck posture for voicing (ASHA).

We propose to study the conditions for initiating and maintaining UVFP patient's weak voicing. We will do this directly by measuring the strategies they use from aerodynamic, acoustic and EGG data, and by measuring weak voicing in normal people (e.g. during voiced fricative production). Looking at when/why normal speakers devoice will help us to develop new strategies/treatments to aid UVFP patients.

The work plan presented here is part of a much broader effort to collect a database of organic and non-organic pathological voices, to relate properties of biomedical signals to medical diagnosis of voice pathologies, and to have a better understanding of voice, frication and aspiration phenomena, and to integrate this knowledge into working theories that relate to speech production and perception.

Portuguese

O objectivo principal deste projecto é o estudo de sons gerados através da interacção de duas fontes aerodinâmicas simultâneas de natureza antagónica (uma periódica, outra aperiódica). As propriedades de consoantes fricativas, oclusivas e africadas serão caracterizadas com base em recolhas de dados acústicos, aerodinâmicos e de electroglotografia (EGG). Os mecanismos de produção das fricativas e das oclusivas serão tipificados com recurso a duas fontes de informação: medições da velocidade de volume e da pressão, e parâmetros no domínio do tempo ou frequência extraídos do sinal acústico.

O sinal acústico resulta da excitação da função de transferência do tracto vocal por uma ou duas fontes. A fonte de ruído depende da forma da constrição, do tracto vocal anterior, e da velocidade do volume de ar que a atravessa. O envelope da fonte de ruído tem uma amplitude máxima nas frequências mais baixas e decresce progressivamente. A fonte de ruído é menos intensa em fricativas e oclusivas vozeadas. A localização da fonte de ruído pode ser constante, ou pode variar ao longo do tempo, como por exemplo nos casos em que uma fricativa ou uma oclusiva estão rodeadas de vogais diferentes.

O interesse em estudar o tipo de fonte, prende-se com o facto das suas características permitirem diferenciar os sons vozeados dos não vozeados, e em determinar se esta é localizada ou distribuída, sendo que este facto está relacionado com o ponto de articulação. O objectivo é descrever a variação acústica e aerodinâmica resultante de diferentes contextos vocálicos. As medidas aerodinâmicas a recolher são cruciais para este estudo, uma vez que nem sempre é possível diferenciar, duma forma inequívoca, as características das fontes e do filtro, analisando unicamente o espectro acústico. As características aerodinâmicas das fricativas e das oclusivas podem ser relacionadas com propriedades específicas da função de transferência e do espectro da fonte durante a produção destes sons.

Quando existe uma disfonia resultante de lesões orgânicas das pregas vocais, o processo de fonação é alterado porque os padrões de vibração durante a fase de abertura e fecho são irregulares. Estas dificuldades em manter vibração modal representam um terreno experimental muito rico e podem ser a base de modelos de vozeamento dentro duma vasta extensão vocal. A paralisia das pregas vocais resulta duma lesão do nervo laríngeo superior (NLS) ou do nervo laríngeo recorrente (NLR), causando irregularidades no traçado da frequência fundamental (F0), voz fraca e soprada, rouquidão e limitações na intensidade dos sons da fala. Frequentemente observa-se uma fonação forçada, pressões de ar excessivas durante a produção de fala, diplofonia, estridor e ciclos respiratórios muito curtos. A paralisia unilateral das pregas vocais (PUPV) decorre duma disfunção do NLR que causa paralisia na região paramediana ou que resulta numa limitação da mobilidade duma prega vocal. A PUPV pode ser diagnosticada através de laringoestroboscopia, radiologia, electromiografia, e avaliação da qualidade vocal por um terapeuta da fala (TF). Estas técnicas permitem determinar o grau de compensação usado pelo paciente, estabelecer uma linha de base da qualidade vocal e escolher o plano de intervenção mais adequado. A avaliação por um TF inclui muitas vezes uma análise aerodinâmica e da eficácia laríngea durante a produção de fala. A terapia da fala é muitas vezes o único tipo de tratamento necessário para pacientes com PUPV, mas pode também ser combinada com técnicas cirúrgicas de medialização. O TF normalmente intervém ao nível da modificação de F0, na melhoria do suporte respiratório e no aumento da intensidade da fala, e ainda tentando encontrar a melhor postura de cabeça e pescoço para permitir um vozeamento eficaz (ASHA).

Propõe-se estudar as condições para iniciar e manter o vozeamento fraco dos pacientes com PUPV, duma forma directa, registando as estratégias de vozeamento por eles usadas através de dados aerodinâmicos, acústicos e de EGG, e também duma forma indirecta, através de medidas de vozeamento fraco em informantes normais. Uma análise de quando e porquê os informantes normais desvozeiam permitirá desenvolver novas estratégias de intervenção para pacientes com PUPV.

A proposta de trabalho apresentada faz parte dum projecto mais vasto que tem como objectivo a criação duma base de dados de patologias de voz, procurando relacionar as propriedades de sinais biomédicos com o diagnóstico médico de diferentes patologias. Esta investigação visa entender melhor as fontes de vozeamento e as fontes de ruído de turbulência, e integrar os conhecimentos adquiridos em teorias e sistemas que modelem a produção e percepção de fala.


Last updated 28/9/2009
lmtj@ua.pt
Luís Jesus

Back to Homepage