Summary
In 1986, we started an extensive investigation into the nonverbal information transmitted in human speech. As part of this investigation, we had designed a study of healthy subjects -stratified according to sex, age and education - in order to gain valuable insights into the “typical” nonverbal activities of a speaker. The specific design of this study with 3 different types of texts and 2 repeated measurements at an interval of 14 days was used to test the stability of speech parameters over time as well as their sensitivity to form and content of text. In a first approach, we directed our efforts towards a set of major scalar quantities which earlier investigators had described as playing a key role in modelling affect in terms of directly measurable speech parameters.
Based on a sample of 97 persons and with the help of a fully computerized digital approach to speech processing, we found that the four major speech parameters “mean vocal pitch”, “time duration of pauses”, “time duration of utterances”, and “energy” are sufficiently reproducible under constant experimental conditions, whereas some significant differences showed up with regard to the sensitivity of these parameters to form and content of the spoken text. No substantial impact originated from the external factors sex, age and education, except for the tonal shift of one octave between males and females.
On the other hand, the overwhelming variety of individual voice patterns obviously excludes any simple model (which applies in general) of the nonverbal component of human speech. However, our analyses offered some important clues as to how appropriate models may be derived by means of adaptive procedures.
Wir begannen im Jahre 1986 eine umfangreiche Studie, die sich mit den nonverbalen Anteilen der menschlichen Sprache beschäftigt. Im Rahmen dieser Untersuchungen wurde auch eine Studie mit gesunden Versuchspersonen - stratifiziert nach Geschlecht, Alter und Ausbildung -durchgeführt, um einen Überblick über »typische« nonverbale Aktivitäten von Sprechern zu erhalten. Der spezifische Aufbau dieser Studie mit drei verschiedenen Texten und zwei im Abstand von 14 Tagen wiederholten Messungen ermöglichte zum einen die Überprüfung der Stabilität von Sprachparametern über die Zeit und zum andern die Untersuchung der Sensitivität dieser Parameter in bezug auf Unterschiede in Form und Inhalt der gewählten Texte. Das Hauptaugenmerk galt dabei einer Reihe skalarer Parameter, die in der Literatur als wesentliche Faktoren im Hinblick auf ein mögliches Affektmodell auf der Basis direkt meßbarer Sprachparameter beschrieben wurden.
Ausgehend von einer Stichprobe von 97 Personen und unter Benutzung eines vollcomputerisierten digitalen Verfahrens der Sprachanalyse fanden wir, daß die vier wichtigsten Sprachparameter »mittlere Sprechstimmlage«, »Pausendauer«, »Sprechabschnittsdauer« und »Energie« unter konstanten experimentellen Bedingungen ausreichend reproduzierbar sind. In bezug auf die Sensitivität der Parameter für Unterschiede in Form und Inhalt der Texte ergaben sich allerdings einige signifikante Unterschiede, während die Stratifizierungsvariablen Geschlecht, Alter und Ausbildung offensichtlich keinen substantiellen Einfluß haben, ausgenommen die Tatsache, daß Frauen sehr genau eine Oktave höher als Männer sprechen.
Darüber hinaus zeigte unsere Studie auch die ungeheure Vielfalt individueller Sprachmuster, die es sicherlich nicht erlaubt, die nonverbale Komponente der menschlichen Sprache durch ein einfaches, allgemein anwendbares Modell zu erfassen. Aufgrund der vorliegenden Ergebnisse unserer Untersuchungen und der dabei gewonnenen praktischen Erfahrungen ergeben sich aber wichtige Anhaltspunkte dafür, wie durch adaptives Vorgehen ein geeignetes, wahrscheinlich multivariables Modell konstruiert werden kann.
Key-Words:
Affective State - Speech Parameters - Reproducibility - Sensitivity
Schlüssel-Wörter:
Affektiver Zustand - Sprachparameter - Reproduzierbarkeit - Sensitivität