Laryngorhinootologie 2011; 90(12): 753-759
DOI: 10.1055/s-0031-1275279
Originalie

© Georg Thieme Verlag KG Stuttgart · New York

Zur objektiven Beurteilung der Zischlautbildung

The Objective Evaluation of SibilantsS. Meyer1 , M. Ptok1
  • 1Medizinische Hochschule Hannover, Klinik für Phoniatrie und Pädaudiologie, Hannover
Further Information

Publication History

eingereicht 19.01.2011

akzeptiert 02.03.2011

Publication Date:
09 June 2011 (online)

Zusammenfassung

Hintergrund: Die häufigste Lautfehlbildung ist die inkorrekte Produktion der sog. „S-Laute“, d. h. der Sibilanten. Da Therapien dieser Störung häufig durchgeführt werden, ist eine objektive Befundung für Diagnostik und Beurteilung der Therapieeffizienz dringend erforderlich. Schallspektrografische Analysen ermöglichen eine solche objektive Dokumentation des Sprachschallsignals. Diese Analysen können mit geringem apparativem Aufwand durchgeführt werden.

Methodik: Anhand von Beispielen wird aufgezeigt, wie eine schallspektrografische Analyse von Sibilanten durchgeführt werden kann und welche Bedingungen Einfluss auf das Messergebnis haben. Insbesondere wird die Wahl der temporalen und spektralen Fenster hinsichtlich der Bestimmung der sogenannten Spektralmomente beschrieben.

Ergebnisse: Sibilanten zeichnen sich schallspektrografisch durch ein Bandpassrauschen aus. Zur Beschreibung von Rauschsignalen eignet sich grundsätzlich die Bestimmung der Spektralmomente. Die Wahl der Zeit- bzw. Frequenzfenster hat allerdings z. T. erheblichen Einfluss auf die Messergebnisse.

Diskussion: Leider existiert kein allgemein akzeptierter „Goldstandard“ für die schallspektrografische Analyse der Sprachlaute, hier der Sibilanten. Für die klinische Routine wird vorgeschlagen, dass die Spektralmomentsberechnung basierend auf einem 40 ms Fenster um den zeitlichen Mittelpunkt aus Wort- bzw. Satzebene extrahierter Laute vorgenommen werden sollte. Wichtig ist, dass z. B. prä- und posttherapeutisch die gleichen Aufnahmebedingungen respektive Analyseparameter gewählt werden.

Abstract

The objective evaluation of sibilants

Background: The inaccurate production of ‘s-sounds’, i. e. sibilants represents the most common speech disorder. An objective description of such inaccurate speech sound production is mandatory. Several tools have been proposed and might be of great value, amongst them spectral analysis. The latter can nowadays be performed easily without the need for expensive equipment.

Method: Different sibilants were uttered either as isolated speech sounds or embedded in test words and sentences. These were then digitized and spectral analysis was performed. Since several protocols have been put forward on how to execute the spectral analysis of sibilants, we replicated those protocols and evaluated how they exert influence on the analysis results. The selection of time windows or frequency bands regarding the computation of spectral moments will be considered in particular.

Results: Sibilants are characterised by a band-pass noise. Usage of power spectral density functions for the extraction of features from temporal and spatial signals is a standard approach. Thus, we calculated spectral moments to describe noise signals derived from sibilant productions. We demonstrate differing results based on varying frequency and time analysis windows.

Conclusion: Unfortunately to date there is no generally accepted “gold standard” for the spectro analysis of speech sounds. For clinical routine, we recommend using a time window of 40 ms around the temporal midpoint, extracted from utterances or words. It is important, however, that recording conditions and analysis parameters are identical pre- and post therapy.

Literatur

  • 1 Stevens KN. Airflow and turbulence noise for fricative and stop consonants: static considerations.  JASA. 1971;  1180-1192
  • 2 Shadle CH. Articulatory-acoustic relationships in fricative consonants.. In: W. J. Hardcastle, A. Marchal, Hrsg. Speech production and speech modelling Kluwer Academic Press, Dordrecht; 1990: S187-S209
  • 3 Shadle CH. The effect of geometry on source mechanisms of fricative consonants.  J Phonetics. 1991;  19 409-424
  • 4 Grassegger H.. Phonetik – Phonologie. Schulz-Kirchner, Idstein 2001; 
  • 5 Petursson M, Neppert JMH. Elementarbuch der Phonetik.. Buske, Hamburg; 2002
  • 6 Fuchs S, Brunner J, Busler A. Temporal and spatial aspects concerning the realizations of the voicing contrasts in German alveolar and postalveolar fricatives.  Adv Speech Lang Pathol. 2007;  9 (1) 90-100
  • 7 Fox AV. Kindliche Aussprachestörungen. Schulz-Kirchner Verlag GmbH, Idstein; 2007
  • 8 Roach P. English Phonetics and Phonology. Cambridge University Press, Cambridge; 2000
  • 9 Stone M, Shawker TH, Talbot TL, Rich AH. Cross-sectional tongue shape during the production of vowels.  J Acoust Soc Am. 1988;  83 1586-1596
  • 10 Tabain M. Variability in fricative production and spectra: implications for the hyper- and hypo- and quantal theories of speech production.  Lang Speech. 2001;  44 57-94
  • 11 Stevens KN. Acoustic phonetics. The MIT Press, Cambridge; 1998
  • 12 Tabain M. Non-sibilant fricatives in English: spectral information above 10 kHz.  Phonetica. 1998;  55 107-130
  • 13 Ellis AW. Reading, writing and dyslexia – a cognitive analysis.  Hove 1993; 
  • 14 Lorenzen R. Eine Akustisch-Phonetische Untersuchung Zur Stimmverstellung. : Masterarbeit.  Christian-Albrechts-Universität Kiel 2004; 
  • 15 Statista . 11.01.2011: http://de.statista.com/statistik/lexikon/definition/138/varianz/
  • 16 Hoy L, Vaske B. Das Statistikprogramm SPSS, Statistische Methoden, Auswerten Mit SPSS 16 Und 17.  6. Auflage 2009; 
  • 17 Boersma P, Weenink D. Praat: Doing Phonetics by Computer (Version 5.1.25).  http://www.praat.org 2010; 
  • 18 Flipsen Jr P, Shriberg L, Weismer G, Karlsson H, McSweeny J. Acoustic characteristics of /s/ in adolescents.  J Speech Lang Hear Res. 1999;  42 663-677
  • 19 Jongman A, Wayland R, Wong S. Acoustic characteristics of English fricatives.  J Acoust Soc Am. 2000;  108 1252-1263
  • 20 Forrest K, Weismer G, Milenkovic P, Dongall RN. Statistical analysis of word-initial voiceless obstruents: preliminary data.  J Acoust Soc Am. 1988;  84 115-123
  • 21 Fuchs S, Koenig LL. Simultaneous measures of electropalatography and intraoral pressure in selected voiceless lingual consonants and consonant sequences of German.  J Acoust Soc Am. 2009;  126 1988-2001
  • 22 Nittrouer S. Children learn separate aspects of speech production at different rates: evidence from spectral moments.  J Acoust Soc Am. 1995;  520-530
  • 23 Li F, Edwards J, Beckman ME. Contrast and covert contrast: the phonetic development of voiceless sibilant fricatives in English and Japanese toddlers.  J Phon. 2009;  37 111-124
  • 24 Nittrouer S, Studdert-Kennedy M, McGowan RS. The emergence of phonetic segments: evidence from the spectral structure of fricative-vowel syllables spoken by children and adults.  J Speech Hear Res. 1989;  32 120-132
  • 25 Nissen SL, Fox RA. Acoustic and spectral characteristics of young children's fricative productions: a developmental perspective.  J Acoust Soc Am. 2005;  118 2570-2578

1 Neben der Betrachtung der FFT sind auch noch weitere Analysearten beschrieben worden. Diese spielen aber für die klinische Routine eine untergeordnete Rolle und werden hier nicht weiter beschrieben.

2 Die FFT kann nach verschiedenen Vorgaben respektive Parametern erfolgen. Für die weiter unten beschriebenen Beispiele wurden folgende Parameter eingestellt: Die gewählten Zeitfenster wurden über ein Kaiserfenster (Kaiser2, Dauer 2) extrahiert und zu Spektren transformiert [17]. Aus diesen Spektren wurden, ggf. nach einer Frequenzfilterung die Spektralmomente ermittet.

3 Die Autoren S.M. und M.P. sprachen die Proben auf.

4 Die Zeitfenster werden anhand der oszillografischen Kurve festgelegt.

5 Test für unabhängige Stichproben: Mann-Whitney-Test und Wilcoxon-Test

Korrespondenzadresse

Simone Meyer

Medizinische Hochschule

Hannover

Klinik für Phoniatrie und

Pädaudiologie

Carl-Neuberg-Straße 1

30625

Hannover

Email: meyer.simone@mh-hannover.de

    >