Um Método de Investigação dos Distúrbios da Fala e Voz: A Espectrografia Vocal

Publicado em
01/03/2001 por

I - OBJETIVO

A voz humana

1.1 - Conceito

A voz humana é o resultado da ação de um conjunto de estruturas do trato vocal que formam um sistema versátil e intricado para produção de sons, cujas partes mais intimamente associadas à produção são os pulmões, a traquéia, a laringe, a faringe as cavidades nasais e a cavidade oral. A qualidade vocal é, em nossos dias, considerada o mais completo atributo de um indivíduo, e sua avaliação fornece indícios sobre os parâmetros físicos, psicológicos, sociais e culturais.

Raymond H. Stentson, pioneiro no estudo da fala, escreveu que a fala é um movimento sonoro audível (STENTSON - 1928). O movimento dos órgãos da fala - estruturas como: língua, lábios, mandíbula, véu palatino e o trato vocal - gera padrões sonoros auditivamente perceptíveis.

Segundo Read e Kent pode-se dividir a fala em três grandes áreas de estudo: fisiológica (ou fisiologia fonética), acústica (ou fonética acústica), e perceptiva. A compreensão da fala exige o estudo de cada uma dessas áreas, relacionando-as entre si.

Para esta proposta, ênfase será dada à área de fonética acústica. A análise acústica possibilita a identificação de padrões fisiológicos e físicos entre o produtor dos sinais acústicos (sons) e o ouvinte. Ressalte-se o aspecto unificador que o sinal acústico exerce nesse processo.

1.2 - A técnica fonoaudiológica

A avaliação da função vocal iniciou-se no século XIX, compreendendo, basicamente, a avaliação subjetiva da voz, ainda amplamente utilizada na rotina clínica fonoaudiológica. Não requer aparelhagem sofisticada e exige somente o ouvido humano como instrumento de avaliação. Idealmente, o processo técnico de avaliação da voz se decompõe em cinco etapas: anamnese, observação, avaliação clínica subjetiva, avaliação acústica e integração destas informações para a definição do tratamento.

A avaliação clínica subjetiva da voz é realizada através da determinação de como o falante habitualmente utiliza sua voz e sua qualidade vocal: loudness e picth ( MORRISON & RAMMAGE, 1994). A escala de avaliação perceptiva mais aplicada é a de GRBAS, proposta por ISSHIKI (1969) e HIRANO (1981). Parâmetros de rouquidão voz, soprosidade, astenia e tensão, bem como o grau de alteração são aferidos.

Luria (1975), ao descrever o papel da fala, amplia o seu conceito ao considerá-la como fator de desenvolvimento e organização do próprio pensamento. Também, segundo Luria e Christensen, a investigação da percepção da fala deve incluir a compreensão da palavra, da sentença e das estruturas lógico-gramaticais.

1.3- Análise acústica computadorizada ou Laboratório computadorizado da voz

Os avanços da tecnologia de computação e o desenvolvimento de softwares e aplicativos propiciaram transformar o processo de avaliação de subjetivo em objetivo, estabelecendo padrões comparáveis entre indivíduos e, mais importante, no tempo, ao longo de uma proposta de tratamento clínico. Surgiram, então, osLaboratórios Computadorizados de Voz e a Análise Acústica Computadorizada.

objetivo do Centro de Diagnóstico em Laringe Voz e Fala é possibilitar, através do exame da espectrografia vocal, a quantificação de vozes através de prática tecnológica capaz de arquivar e produzir comparações entre padrões pré-estabelecidos. A sua aplicação oferece melhor compreensão acústica do sinal vocal, possibilitando a associação entre as análises perceptivo-auditiva e acústica. Permite ainda monitorizar a eficácia de um tratamento clínico, comparando os resultados de diferentes procedimentos terapêuticos. Possibilita registrar a voz, antes e depois, de pacientes a serem submetidos à microcirurgia de laringe.

O conceito de qualidade vocal é, além de complexo, subjetivo, variando entre diferentes culturas.

Para SATALOFF (1991) dizer ao paciente que sua voz mudou e sua qualidade vocal melhorou sem mostrar o resultado da avaliação acústica seria o mesmo que dizer a um indivíduo que sua audição melhorou sem mostrar o exame audiométrico que evidencia essa melhoria.

análise acústica computadorizada apresenta a medida da alteração da freqüência fundamental, as medidas de instabilidade fonatória (Jita, Jitter, ShdB, PPq, APQ ) e de ruído no sinal ( NHR ).

O núcleo ou centro de estudo ideal de um laboratório computadorizado da voz seria formada por médicos laringologistas, neuropediatras, cirurgiões de cabeça e pescoço, fonoaudiólogos, lingüistas e o cientista da voz. Trata-se, portanto, de um ambiente multidisciplinar de trabalho.

 

II - FUNDAMENTOS E JUSTIFICATIVAS

 

Acústica da fala

 

2.1 - Produção dos sons

 

A produção sonora requer dois elementos indispensáveis: uma fonte de energia e um elemento vibratório. Na fala a principal fonte de energia é o ar proveniente do aparelho respiratório. As pregas vocais da laringe formam os elementos vibratórios. Contudo, é de se observar que a conversão do fluxo de ar em som pode ocorrer quase em todos os locais ao longo do trato vocal. Assim, ao se constrigir o trato vocal em algum ponto de sua extensão, a corrente de ar pode ficar turbulenta para produzir ruídos fricativos.

 

A qualidade dos sons da fala é também influenciada pela configuração das propriedades acústicas do trato vocal, principalmente na forma da cavidade oral.

 

Assim, o análogo físico do mecanismo da fala deve consistir em uma fonte de energia, elementos vibratórios, sistemas de válvulas e filtro.

 

2.2 - Caracterização da acústica da fala

 

A análise acústica é essencial no processo de compreensão da fisiologia fonética. A fonética é uma área da lingüística que estuda a geração e a estrutura sonora dos fonemas.

 

O estudo da voz humana requer a definição de conceitos ou propriedades dos sons produzidos que identificam as estruturas sonoras: harmônicos, ressonância e formantes.

 

Todo o som complexo pode ser decomposto em uma combinação de sons mais simples, harmonicamente relacionados, ou seja, numa série de tons puros, semelhantes ao de um diapasão, e com freqüências que são múltiplos inteiros de uma freqüência fundamental. Quando quebramos um determinado som em seus componentes simples, estamos realizando uma análise espectral.

 

Cada tom puro corresponde fisicamente a um tipo de oscilação - movimento harmônico simples.

 

ressonância é o fenômeno segundo o qual um sistema físico, excitado por outro sistema vibrante, passa a oscilar de forma semelhante à este. No aparelho fonador humano, o trato vocal pode ser visto, por uma seqüência de pequenos tubos cilíndricos que formam ressoadores.

 

O trato vocal supraglótico, acima portanto das pregas vocais, se inicia no nível da laringe, prolongando-se até a última fronteira dos lábios e da narina. Esta "tubulação" de diâmetro variável funciona com uma cadeia de ressoadores, respondendo, seletivamente, à diversas freqüências contidas no som produzido pela fonte sonora. Assim, se o trato vocal numa determinada "forma" responde simpática e naturalmente a determinados sons, digamos aos de freqüência próximas a 330, 800 e 2200 Hz, por exemplo, podemos afirmar que estes são os primeiros formantes daquela configuração vocal.( FUKS, L. 2000)

 

Modificando-se os formantes do trato vocal, através de alterações em sua forma, pode-se esculpir o som básico gerado pela glote, numa rica paleta de timbres sonoros, mensuráveis e comparáveis.

 

2.3 - Freqüência Fundamental

 

Os movimentos vibratórios são de sons da fala. O epitelio de cobertura das pregas vocais, em uma fala normal, vibra a uma freqüência aproximadamente de 150 vezes por segundo, a eclosão de ar é liberada no trato vocal a cada 1/150 segundos. O efeito de cada uma dessas eclosões transitórias de energia é excitar a coluna de ar supraglótioca. A amplitude das vibrações são amortecidas, mas a sucessão rápida de eclosões de energia serve para manter a coluna de ar em vibração.

 

Três parâmetros podem representar parcialmente os movimentos vibratórios:freqüência, intensidade e duração - que, isoladamente, têm muito pouco significado na produção da fala da maneira que conhecemos. As vibrações geradas pelas pregas vocais no trato vocal podem ser modificadas pelas estruturas do trato vocal. Essas modificações podem ser responsabilizadas pelo princípio de ressonância e sua antítese, o amortecimento.

 

Quase todo sistema, em condições apropriadas, quando energizadas por uma força externa, vibra em uma freqüência natural própria. A freqüência das pregas vocais vibrantes, energizadas por uma corrente de ar, é uma função direta da tensão e uma função inversa da massa. Por exemplo: a laringe de um tenor que esteja produzindo a nota mi2 (freqüência fundamental de 330 Hz) de forma contínua e regular, estará produzindo os tons puros de 660 (mi4), 990 (si4), 1320 (mi5 ), 1650 (sol#5), 1980 (si5), 2310 Hz (re6), etc. Estes valores correspondem exatamente aos múltiplos da freqüência fundamental de 330 Hz. Esta série harmônica tem a freqüência fundamental no primeiro harmônico e nos outrosovertones.(FUKS, L.2000)

 

2.4 -Teoria fonte-filtro da produção da fala

 

O modelo matemático da produção da fala, base da teoria fonte-filtro desenvolvida por Fant ( 1970 ), é expressa como:

 

[P (f)] = [U (f)] . [H (f)] . [R (f)]

 

O sinal da pressão sonora P(f) atuando, à certa distância, sobre os lábios é o produto do espectro da velocidade de volume de ar gerado pela fonte U(f), da função freqüência-ganho seletivo de transmissão vocal H(f), e da característica de propagação dos lábios R(f).

 

 

 

 


Figura 4 - Ilustração do esquema do espectro voz-fonte. (The acoustic of the Singing Voice, Johan Sunderberg - 1977 Scientific American, Inc.)

 

 

 

O esquema apresentado na Figura 4 é uma representação gráfica da teoria fonte-filtro. A amplitude dos harmônicos diminui uniformemente com a variação da freqüência. Isso representa o espectro da fonte para os sons sonoros.

 

III - MATERIAS E MÉTODOS

 

O instrumental mínimo para um laboratório computadorizado de voz é composto por computador, com capacidade para armazenar sons vocais, e softwares aplicativos, impressora e microfone.

 

O computador adequado seria um Pentium III 733 , com uma boa placa de vídeo e áudio, memória RAM de no mínimo 128 Mb, Hard Disk de 40 Gb, CD-Rom 24X Slim, Placa combo 3Com; 56bps & 10/1000 Mbits, Monitor 15", Microsoft Windows 2000, teclado com teclas de atalho, software antivirus tipo Norton Anti-Virus 2000.

 

Impressora HP ou Epson, com 2880 X 720 dpi, ultra rápida, 12 ppm em preto e 9 ppm em cores, compatível com Windows, com qualidade fotográfica de impressão.

 

Gravador profissional digital ( DAT machines - Digital Audio Tapes ), equipado com microfone profissional, condensador estéreo minidirecional, sensitividade de 60 dB, deslocado do corpo da unidade de gravação para evitar captação de ruído do equipamento.

 

Diversos softwares aplicativos em Laboratórios de Voz são internacionalmente reconhecidos pelos centros de excelência do mundo. Outro mais sofisticado, aconselhável para centros de pesquisa, é o MULTI-SPEECH, modelo 3700, que gera espectogramas acústicos. Baseado em ambiente Windows, o software dispõe de interfaces para aquisição, reprodução, edição e análise ( sonogramas, LPC, PITCH, intensidade, FFT, filtros digitais, transcrição IPA). O opcional MULTI-DIMENSIONAL VOICE PROGRAM, modelo 5105, calcula 22 diferentes parâmetros da voz e os compara com uma base de dados, gerando gráficos e protocolos. Foi desenvolvido pela KAY ELEMETRICS CORPORATION estando em uso há vários anos no Voice and Speech Laboratory no Massachusetts Eye and Ear Infermary da Harvard Medical School de Boston, EUA. No Brasil, o Instituto de Otorrinolaringologia da Escola Paulista de Medicina, São Paulo, faz uso deste, há cinco anos, para pesquisas científicas, teses acadêmicas, e na aplicação clínica em tratamentos.

 

O registro de áudio de voz requer gravações ambientes com baixo nível de ruído.

 

IV - EXAMES COMPLEMENTARES

 

Exames complementares que integram um Centro de Diagnóstico em Laringe, Voz e Fala, sendo imprescindíveis para o seu funcionamento em nível de excelência. Tratam-se de:

 

Laringoscopia indireta: Método em prática desde o início do século XIX, desenvolvido por Garcia e outros autores, fazendo uso, à época, de espelho. A técnica foi aprimorada com a utilização de fibras óticas fixas, de 70 ou 90 graus, hoje o instrumental de melhor precisão para visualização das pregas vocais, da mucosa, coaptação e vibração das mesmas.

Nasofaringolaringoscopia: Exame realizado através de fibras ópticas flexíveis, de diâmetro de 3,2 a 4,0 mm, que são introduzidas nas fossas nasais, com ou sem anestésico, e que revelam a anatomia e a função do cavum, do volume das adenóides, do esfíncter velofaríngeo, da faringe, da passagem aérea entre a língua, faringe e amígdalas palatinas, da hipofaringe e da laringe. As assimetrias, paresias, hipertonias, constrições, golpe de glote e alterações funcionais podem ser avaliadas pelo método. Permite, ainda, superar o grande obstáculo representado pela náusea, sendo, particularmente, indicado para crianças menores e pacientes neurológicos.

Videolaringoestroboscopia: Exame que oferece parâmetro da simetria dos movimentos, periodicidade das vibrações, fechamento glótico e qualidade da onda das pregas vocais. Devido ao preciso diagnóstico videolaringoscópico, as afecções laríngeas puderam receber tratamento mais adequado e os casos de câncer serem mais precocemente diagnósticos.

Eletroglotografia: Método não invasivo, que através de eletrodos de superfície no pescoço mede a variação de tempo de contato da mucosa das pregas vocais, durante o ciclo vibratório, através da transmissão de uma corrente elétrica entre as duas alas da cartilagem tireóidea. E é ainda mais interessante quando diretamente acopladas à estroboscopia, por oferecer simultaneamente, a imagem glótica e a onda do pulso glótico, permitindo duas informações complementares sobre a coaptação glótica.

 

 

V - CONCLUSÃO

A voz, usada na comunicação humana é uma das funções essenciais para o convívio social. É uma das características mais fortes da personalidade humana. Oferece informações físicas até o grau de formação educacional dos indivíduos.

Assim diversos distúrbios de integração social são atribuídos à desordens vocais. Além disso, numerosos são aqueles que dependem profissionalmente de uma boa impostação vocal: locutores, cantores, professores, atendentes de telemarketing, etc.. Há pesquisas (Garcia, A.A - 1995) que relatam, por exemplo, que a maioria dos docentes (74,62%) apresentam prematuramente sintomas de alteração vocal. Os sintomas vocais mais relatados passam por pigarro e tosse - 62,88% das queixas; rouquidão temporária - 42,26%; desconforto vocal - 38,14%; ressecamento na garganta - 34,02% e cansaço vocal - 31,95%. Os sintomas mais severos e impeditivos para docência, como rouquidão permanente, tremor e afonia têm freqüência de 6,0%.

A prática da clínica fonoaudiológica depara-se, freqüentemente, com casos de crianças e adultos que apresentam distúrbios clínicos de comunicação da fala.

A maioria dos distúrbios da fonação - disfonias - é estudada na otorrinolaringologia e/ou fonoaudiologia. As disfonias podem ocorrer por conta de afecções primitivas ( orgânicas ou funcionais ) do trato vocal, capazes de produzir alterações na elaboração dos sons que serão posteriormente articulados. Há, ainda, ocorrências clínicas de pacientes com as disacusias, distúrbios de deglutição atípica, distúrbios da palavra chamados de dislalias.

Na neurologia interessam as disfonias secundárias, as lesões motoras periféricas ou supranucleares - disartrofonias.

A espectrografia vocal e os exames complementares, imprescindíveis nos grandes centros de laringologia, são indicados pelas dificuldades no diagnóstico e no manejo de pacientes disfônicos, no controle do tratamento clínico-cirúrgico e fonoterapia, na avaliação pré e pós-microcirurgias da laringe, nas paralisias laríngeas e nos casos com suspeita de lesão pré-maligna ou tumor inicial. A avaliação dos profissionais da voz, do diagnóstico diferencial nos quadros neurológicos ou psicogênicos e na reavaliação ou avaliação mais apurada nos quadros funcionais.

Em nossos dias, um centro moderno de tratamento ou pesquisa da voz não pode prescindir de instrumental técnico como um Centro de Diagnóstico em Laringe e Voz. Para ilustração, apresenta-se, em anexo, informações sobre o funcionamento de um centro referência - o Massachusetts Eye and Ear Infirmary da Harvard Medical School de Boston, EUA.

 

BIBLIOGRAFIA

 

ANTÔNIO, R. P. Análise acústica computadorizada da voz e configuração glótica em crianças do sexo feminino, São Paulo, 1997, 96p. ( tese de Mestrado - UNIFESP - EPM).

 

ARAÚJO, R.B. PRACOWNIK, SOARES, L.S.D. Fonoaudiologia Atual. Rio de Janeiro, RJ. Editora Revinter, 1997. ( capítulo de Mara Behlau - Considerações sobre Análise Acústica em Laboratórios Computarizados de Voz).

 

ARNALD, G.E. Vocal Nodules and Polyps: Laryngeal Tissue Reaction to Habitual Hyperkinetic Dysphonia. Journal Speech and Hearing Disorders 27 (3): 205-17,1962.

 

ASH, J.E. & SCHWARTZ,L. The Laryngeal ( Vocal Cord ) Node. Transactions American Academy of Ophthalmology and Otolaryngology, October 10 (13): 323-332,1943.

 

BEHLAU,M. PONTES,P. Avaliação e Tratamento das Disfonias. São Paulo: Lovise, 1995.

 

BOONE, D, MCFARLANE,S. The Voice and The Voice Therapy. 4. ed. Englewood Cliffs, Prentice - Hall, 1988.

 

BRASIL, O.O.C. & MEINÃO, F. Microcirurgia da Laringe. In: Histopatogeneza Nodulidor Vocali. Revue Chirurgique Otorrinolaringologia 29 (3) : 227 - 230, 1984.

 

BRETING, E.M. & BURKHARDT, A. Pseudo Tumors of the Larynx. In: Tumors of the larynx: 169-171 Springer - Verlag, Heidelberg, Berlin - Germany, 1988.

 

BENJAMIN, B ,FRACS,FAAP. Vocal Nodules in Children. From the Royal Alexandra Hospital for Children, Sydney, Australia. Present at the meeting of Americal Laryngological Associantion, Denver, Aphril 25-26, 1987.

 

CARRARA-DE ANGELIS, E.; CARVALHO, V.A. ; VALE,L. P. ; BUSCH, R. ; ABRAHÃO, M. 7 CERVANTES, O . Valores de jitter, shimmer e proporção ruído-harmônico em indivíduos brasileiros adultos do sexo masculino. Anais do XVI Congresso Brasileiro de Cirurgia de Cabeça e Pescoço e I Congresso de Fonoaudiologia do Cone Sul-Reabilitação.

 

CARRARA-DE ANGELIS, E. ; SANTOS, C.R. ; FUKUDA, Y. ; CERVANTES, O.; KOWALSKI, L. P. ; ABRAHÃO, M. ; FÚRIA, C. ; MOURÃO, L. ; BRANDÃO, ª P. e MARTINS, N. Avaliação objetiva da voz após tratamento radioterápico de tumores T1 e T2 glóticos . Anais do 34 Congresso Brasileiro de Otorrinolaringologia. Porto Alegre, 1998.

 

CECCON, F . P. Contribuição ao estudo da voz alaríngea: análise acústica, temporal e perceptiva da voz traqueosofágica, São Paulo, 1997, 74p. (Tese de Mestrado - UNIFESP - EPM ).

 

CARVALHO, V. A. ; CARRARA-DE ANGELIS, E. ; VALE, L. P. ; BUSCH, R. ; BRANDÃO, ª P. ; ABRAHÃO, M ; CERVANTES, º ; FUKUDA, Y. - Avaliação comparativa das medidas acústicas de voz em mulheres com lesão benignas de pregas vocais. Anais do 34 congresso brasileiro de Otorrinolaringologia. Porto Alegre, 1998.

 

CASIMIRES, M .C. B. Laboratório de Voz: caracterização de um grupo de usuários.Dissertação de Mestrado do PUC-SP, São Paulo,1998.

 

COLTON. R. & CASPER, J. Conduta médica e cirúrgica dos distúrbios vocais. In: _ Compreendendo os problemas de voz, Porto Alegre, Artes médicas, 1996, 234 - 259.

 

CHRISTENSEN, A . Luria's Neuropsychological Investigation. Spectrum publications . New York : 1975.

 

FUKS, L. SUNDGERG, J : Blowing pressures in reed woodwind instruments.Quarttely Program Status Report, Royl Institute of Tecnology, QPSr - TMH-KTH, 3/1996; 41-56, Stockholm.

 

FUKS, L. SUNDBERG, J. Using respiratory inductive plethysmography for monitoring professional reed instrument performance. Medical Problems of Performing artists. Hanley 7 Belfus, Inc., Philadelphia, PA, 1999.

 

GARCIA, A. A. Conduta vocal de professores. Anais do 3 Congresso de Laringologia e Voz. Rio de Janeiro, Brasil, 1995.

 

GOMES, L. P. M. Aspectos Laringoscópicos e Análise Acústica da Voz em Indivíduos Portadores de Pólipo de Pregas Vocais Submetidos à Microcirurgia de laringe. Tese de Doutorado da Universidade Federal de São Paulo, São Paulo, 1999.

 

HIRANO, M . Clinical examination of voice. Viena, springer-veriag, 1981. 312p.

 

ISSHIKI, N ; OKAMURA, H ; TANABE, M. ; MORIMOTO, M . Diferential diagnosi of horseness. Folia Phoniatr., 21:9-19, 1969.

 

JACKSON,C. & JACKSON,C.L. In: Benign Tumors of the Larynx Diseases of the Nose, Throat and Ear - Including Bronchoscopy and Esophagoscopy : 587 - 588, W.B. Saunders Company - USA, 1945.

 

JACOBSON,B. Objective Voice Analysis: The Clinical Voice Laboratory. In: BENNINGER, MS,JACOBSON,BH,JOHNSON,AF. Vocal arts medicine. The care and prevention of professional voice disorders. New York, Thieme, 1994,pp 135 - 52.

 

LANCER,J.M.; SYDER,D;JONES, A .S.& LE BOUTILIER, A Vocal Cord Nodules: a Review. Clinical Otolaryngology 13 (1) : 43-51, February, 1988.

 

LEHMAMNN,W; PIDOUX,J. M. & WIDMANN, J.J. Pseudotumors. In: Larynx - Microlaryngoscopy and Histopathology : 68-69, Inpharzam Medical Publications. Switzerland, 1981.

 

LADEFOGED, PETER. Elements of Acoustic Phonetics, Chicago University Press. 1995.

 

LURIA, AR . The mentally retarded child. Perganon Press. Londres: 1963.

 

MOTA MAIA, ELEONORA. No reino da fala. Editora Àtica, 1986.

 

MORRISON E RAMAGE . The management of voice disorders, CALIFORNIA, Singular Publishing Group, 1994, 266p.

 

KENT, Ray D. e READ C. The Acoustic Analysis of Speech. San Diego, California. Singular Publishing Group, 1992.

 

READ,C,BUDER,EH e KENT, RD. Speech Analysis Systems: Evaluation. Journal. Speech Hear. Res, 35: 314 - 32,1992.

 

RUBIN,H.J.& LEHROFF,I. Pathogenesis and Treatment of Vocal Nodules .Journal of Speech and Hearing Disorders, 27 (2): 150-161, MAY,1962.

 

RUSSO, Iêda C.P. Acústica e Psicoacústica Aplicadas à Fonoaudiologia Atual. São Paulo, SP. Editora Lovise, 1999.

 

RUSSO, I. & BEHLAU, M. Percepção da Fala: Análise Acústica . São Paulo, SP. Editora Lovise, 1993.

 

SATALOFF RT, HEUER RJ, EMERICH KA, BARODY MM, RULNICK RK, HAWKSHAW M..Clinical Voice Laboratory. In: SATALOFF, R. T. eds. Professional Voice : the science and art of clinical care - 2nd ed. San Diego, California, 1997. P.215 - 243.