Zum Silbenbegriff in der Schrift-, Laut- und Gebärdensprache - Versuch einer mediumübergreifenden Fundierung _____________________________________________________________________ Abstract The following paper examines modality independent and modality specific properties of the syllable in a comparative study of written language, oral language and sign language. It is argued that the main modality independent property is an alternation structure with specific syllable defining characteristics. The differences between the three different modalities are captured by examining the specific properties of the linguistic sub- stance: phonetic sound, gestural sign, written letter. The graphemic syllable is the main concern in the present paper, since it is a concept which has been most often called into doubt. Some linguists have argued that the graphemic syllable is an epiphenomenon of the sound syllable. Evidence from past research as well as evidence to be presented in the current paper suggest an alternative model of the interaction between the three modalities. Instead of deriving one modality specific system from another, an underlying more abstract, modality independent structure is posited. The sound system, the sign system, and the graphemic system are treated as interface phenoma which result from the interaction between the underlying modality independent system and the articulatory-auditive, the gestural-visual and the writing-visual system respectively. _____________________________________________________________________ 1. Einleitung Der Untersuchungsgegenstand dieses Aufsatzes 1 ist eine Strukturebene zwischen der Ebene der linear nicht weiter zerlegbaren Einheiten, den Segmenten, und der Ebene der lexikalischen Einheiten oder Wörter. Diese suprasegmentale Struktureinheit ist die Silbe. Der Silbenbegriff wurde für die Phonologie der Lautsprachen entwickelt und am eingehendsten erforscht. Er spielt aber auch in neueren Ansätzen zur Schrift- und Gebärdensprache eine zentrale Rolle. Die wichtigste Motivation für suprasegmentale Repräsentationen sind die Regeln der jeweiligen Sprachmodalitäten: Laut-, Schrift- oder Gebärdensprache. So bilden die Silbe und ihre Konstituenten die Domäne für die Anwendung phonologischer, graphematischer und gebärdensprachlicher Regeln bzw. Distributionsbeschränkungen. Das gilt sowohl für suprasegmentale Erscheinungen (z. B. Akzentzuweisung oder Worttrennung nach Silben) als auch für segmentbezogene Phänomene (z. B. die lautsprachliche Auslautverhärtung, die 1 Ich danke Ursula Bredel, Daniela Happ, Antonia Hohenberger, Moritz Neugebauer, drei anonymen Gutachtern der "Zeitschrift für Sprachwissenschaft" und besonders Helen Leuninger für wertvolle Hinweise und kritische Kommentare.
57
Embed
Zum Silbenbegriff in der Schrift-, Laut- und ...idsl1.phil-fak.uni-koeln.de/fileadmin/IDSLI/dozentenseiten/artikel_primus/Primus... · In diesem Modell sind die drei modalitätsspezifischen
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Zum Silbenbegriff in der Schrift-, Laut- und Gebärdensprache -
The following paper examines modality independent and modality specific properties of the syllable in acomparative study of written language, oral language and sign language. It is argued that the main modalityindependent property is an alternation structure with specific syllable defining characteristics. The differencesbetween the three different modalities are captured by examining the specific properties of the linguistic sub-stance: phonetic sound, gestural sign, written letter. The graphemic syllable is the main concern in the presentpaper, since it is a concept which has been most often called into doubt. Some linguists have argued that thegraphemic syllable is an epiphenomenon of the sound syllable. Evidence from past research as well as evidenceto be presented in the current paper suggest an alternative model of the interaction between the three modalities.Instead of deriving one modality specific system from another, an underlying more abstract, modalityindependent structure is posited. The sound system, the sign system, and the graphemic system are treated asinterface phenoma which result from the interaction between the underlying modality independent system andthe articulatory-auditive, the gestural-visual and the writing-visual system respectively._____________________________________________________________________
1. Einleitung
Der Untersuchungsgegenstand dieses Aufsatzes1 ist eine Strukturebene zwischen der Ebene
der linear nicht weiter zerlegbaren Einheiten, den Segmenten, und der Ebene der lexikalischen
Einheiten oder Wörter. Diese suprasegmentale Struktureinheit ist die Silbe. Der Silbenbegriff
wurde für die Phonologie der Lautsprachen entwickelt und am eingehendsten erforscht. Er
spielt aber auch in neueren Ansätzen zur Schrift- und Gebärdensprache eine zentrale Rolle.
Die wichtigste Motivation für suprasegmentale Repräsentationen sind die Regeln der
jeweiligen Sprachmodalitäten: Laut-, Schrift- oder Gebärdensprache. So bilden die Silbe und
ihre Konstituenten die Domäne für die Anwendung phonologischer, graphematischer und
gebärdensprachlicher Regeln bzw. Distributionsbeschränkungen. Das gilt sowohl für
suprasegmentale Erscheinungen (z. B. Akzentzuweisung oder Worttrennung nach Silben) als
auch für segmentbezogene Phänomene (z. B. die lautsprachliche Auslautverhärtung, die
1 Ich danke Ursula Bredel, Daniela Happ, Antonia Hohenberger, Moritz Neugebauer, drei anonymenGutachtern der "Zeitschrift für Sprachwissenschaft" und besonders Helen Leuninger für wertvolle Hinweise undkritische Kommentare.
2
graphematische Distribution von Dehnungszeichen, die gebärdensprachliche Distribution von
sekundären Bewegungen). Während der laut- und gebärdensprachliche Silbenbegriff
inzwischen als etabliert gelten, wird der Schreibsilbe auch weiterhin mit Skepsis begegnet
(vgl. Ossner 1996, 2001). Der vorliegende Beitrag wird sich zentral mit dem graphematischen
Silbenbegriff auseinander setzen und Gemeinsamkeiten wie Unterschiede zum laut- und
gebärdensprachlichen Begriff herausarbeiten.
Es gibt mindestens zwei Gründe für die Skepsis gegenüber dem Schreibsilbenbegriff: ein
systematischer und ein empirischer. Der systematische Grund ergibt sich aus der phono-
logisch derivationellen Perspektive, der zufolge der Schrift ein abgeleiteter Status zukommt
(Ableitbarkeitshypothese). Dieser Annahme entsprechend werden graphematische Repräsen-
tationen aus phonologischen abgeleitet. Dasselbe gilt für Einheiten wie Graphem oder
Schreibsilbe. Wie Eisenberg (1985) zutreffend feststellt, benötigen diese Ansätze gar keine
schriftsprachspezifischen Begriffe. In diesem Forschungsparadigma ist bspw. ein Graphem
eine schriftsprachliche Variante eines Phonems und somit selbst nicht distinktiv. Wenn es
genuin graphematische Regularitäten gibt, dann haben sie einen peripheren Status.
Der zweite Grund für die skeptische Behandlung der Schreibsilbe ist empirisch-metho-
discher Natur und betrifft die Schwierigkeiten, ein schreibmotorisches oder graphisch-
visuelles Korrelat des Silbenbegriffs und des silbenstrukturell relevanten Sonoritätsbegriffs zu
finden. Während sich der Graphembegriff relativ unproblematisch graphematisch autonom
definieren und durch seine graphische Substanz autonom motivieren lässt (vgl. Eisenberg
1985, Augst 1985, Günther 1988 u. v. m.), bietet der graphematische Silbenbegriff größere
Schwierigkeiten. Im Gegensatz zur lautsprachlichen Silbe, deren phonetische Substanz
inzwischen gut untersucht und abgesichert ist, fehlt nach Ansicht vieler Wissenschaftler der
graphematischen Silbe eine solche natürliche substanzielle Motivation (vgl. Butt/Eisenberg
1990). Daraus wird oft der voreilige Schluss gezogen, dass die Schriftsilbe ein fragwürdiger
Begriff sei.
Eine andere der Ableitbarkeitshypothese konträre Sicht wurde etwas irreführend als
autonomistisch oder zutreffender als Korrespondenzhypothese bezeichnet. Dieser zweiten
Forschungstradition ist der vorliegende Beitrag verpflichtet. Wenn man eine
Korrespondenztheorie der Graphematik verfolgt, müssen zentrale Begriffe wie Graphem,
graphematische Silbe und graphematisches Wort ohne Bezug zur Phonologie definiert und
durch genuin graphematische Regeln, die sich auf diese Begriffe beziehen, motiviert werden.
Korrespondenzregeln zwischen der graphematischen und phonologischen Repräsentation
werden in einem solchen Modell berücksichtigt, ohne den phonologisch basierten
3
Korrespondenzen einen Sonderstatus zuzuordnen.
Folgende Annahmen bzw. Beobachtungen motivieren und präzisieren diese Konzeption:
- Es gibt nicht nur phonologisch basierte, sondern auch graphematisch basierte Ableitungs-
regeln sowie bidirektionale, d. h. eineindeutige Korrespondenzen (vgl. Primus 2000).
- Die phonologisch basierten Ableitungsregeln sind weder einfacher noch allgemeiner als die
graphematisch basierten (vgl. Primus 2000, Neef/Primus 2001).
- Es gibt autonome Einheiten und Regeln bzw. Beschränkungen des Schriftsystems, die keine
Entsprechung in der Lautsprache haben (vgl. Abschnitt 5 dieses Beitrags).
- Es gibt nicht-vorhersagbare graphematische Information im Lexikon. M.a.W. enthält das
Lexikon eine graphematische Komponente (vgl. Neef/Primus 2001).
- Es gibt psycholinguistische Evidenz für die Korrespondenztheorie.
Der folgende Beitrag wird einige der o. g. Annahmen untermauern. Auf psycholinguistische
Evidenz sei hier nur kurz verwiesen. Die schriftsprachliche Kompetenz kann unabhängig von
der mündlichen Sprachkompetenz gestört sein (vgl. de Bleser et al. 1987, de Bleser 1991,
Badecker 1996, Sucharowksi 1996). Beim Lesen wird nicht immer phonologisch rekodiert
(vgl. Günther 1988, de Bleser 1991). Die Ableitbarkeitshypothese geht beim Schriftsprach-
erwerb davon aus, dass er eine unabhängig entwickelte phonologische Kompetenz und
insbesondere die Fähigkeit voraussetzt, Wörter in Phoneme zu segmentieren und Phoneme zu
identifizieren. Aber mehrere Studien demonstrieren im Sinne der Korrespondenztheorie, dass
diese Aspekte der phonologischen Kompetenz die Folge und nicht die Voraussetzung des
Schriftspracherwerbs sind (vgl. z. B. Morais et al. 1987, Wimmer et al. 1991). Die Ableit-
barkeitshypothese wird auch dadurch in Frage gestellt, dass im Schriftspracherwerb laut-
basierte Ableitungsregeln viel fehlerträchtiger sind als schriftsysteminterne Beschränkungen
(vgl. Neef/Primus 2001).
Das zu lösende Problem ist, dass die silbischen Erscheinungen in den verschiedenen
Modalitäten Gemeinsamkeiten, aber auch Unterschiede aufweisen. Der Versuch, die
Gemeinsamkeiten dadurch zu erklären, dass man die silbischen Erscheinungen einer
Modalität aus einer zugrunde liegenden Modalität, nämlich der lautsprachlichen, ableitet, ist
für das Schriftsystem aufgrund der oben angeführten Bedenken problematisch und auf die
Gebärdensprache nicht übertragbar. Die hier vorgeschlagene alternative Lösung ist das
folgende verzweigende Schnittstellenmodell:2
2 Gedanken in dieser Richtung finden sich in der Gebärdensprachenforschung, vgl. Brentari (1998), Sandler(2000), Leuninger et al. (2001).
4
modalitätsunabhängiges System
|¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯|¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯|schreibmotorisches/visuelles artikulatorisches/auditives gestisches/visuellesSystem | System | System |
Die weitere Vorgehensweise in diesem Beitrag ist Folgende. Im nächsten Abschnitt wird
der Silbe als mediumübergreifendes Strukturprinzip eine Alternationsstruktur zugrunde
gelegt, die bestimmte charakteristische Eigenschaften aufweist. Im dritten Abschnitt werden
die modalitätsneutralen wie substanzspezifischen Eigenschaften der Silbe in der Gebärden-
sprache in ihren Grundzügen dargestellt. Obwohl die Gebärdensprache nicht im Zentrum
3 Die Gebärdensprache kann Korrespondenzen sowohl mit der Lautsprache als auch mit der Schriftspracheaufweisen, allerdings kann beim jetzigen Forschungsstand eine klare Trennung zwischen diesenKorrespondenzen nicht geleistet werden.4 Dieser Ansatz lässt erwarten, dass jede Sprache über eine silbische Organisation verfügt. Pompino-Marschall(1995: 229) u.a. argumentiert für die Universalität der silbischen Strukturierung und sieht Gegenbeispiele aus derphonologischen Literatur (z.B. Gokana in der Analyse von Hyman 1990) im Beschreibungsmodell begründet.
5
dieses Beitrags steht und deshalb auch recht knapp behandelt wird, soll dieser Auftakt dazu
dienen, von der eingefleischten Phonologisierung der Begrifflichkeit Abstand zu gewinnen.
Danach werden im vierten Abschnitt die modalitätsneutralen und substanzdeterminierten
Eigenschaften der lautsprachlichen Silbe vorgestellt. Der fünfte Abschnitt bildet das
Kernstück des Beitrags und ist der Schreibsilbe gewidmet. Hinsichtlich aller drei Modalitäten
wird zunächst gezeigt, dass sich die zugrunde liegende Alternationsstruktur als medium-
unabhängige Charakteristik der Silbe manifestiert. Danach werden die substanzdeter-
minierten, modalitätsspezifischen Erscheinungen hervorgehoben. Lediglich im Abschnitt über
die schriftsprachliche Silbe wird von vornherein die graphische Substanz der Silbe
mitberücksichtigt. Der letzte Abschnitt fasst die Ergebnisse zusammen.
2. Die Silbe als mediumübergreifende Alternationsstruktur
Die suprasegmentale silbische Schicht wird durch eine Alternations- bzw. Oszillationsstruktur
charakterisiert. Solche Strukturen entstehen, wenn man mindestens zwei Einheiten oder zwei
Werte einer Eigenschaft (z. B. Tonhöhe oder Leuchtsignale) in einem wiederkehrenden
Wechsel alternieren lässt. Mit Hilfe der abstrakten Werte " " und " " ließen sich
Alternationen wie in (1) erzeugen:
(1) a. ...
b. ...
Es ist plausibel anzunehmen, dass einfache Alternationsstrukturen, die durch eine Alternation
von nur zwei Einheiten bzw. zwei Werten eines binären Merkmals und die durch ein
einzelnes Vorkommen dieser Einheiten entstehen, bevorzugt sind, vgl. Bsp. (1a).
Im lautlichen Medium nennt man eine solche Alternationsstruktur auch Rhythmus oder
Prosodie. Wie wichtig eine solche Alternationsstruktur für die Verarbeitung von Sprache ist,
haben Phonetiker für die Lautsprache betont. Nach Ansicht Tillmanns (1980) und Pompino-
Marschalls (1993, 1995) – deren Ausführungen zur Phonetik der Silbe ich folge - stellt die
phonetische Silbe als Artikulationsbewegung von der artikulatorischen Engebildung zur
vokalischen Öffnung eine elementare phonetische Produktionseinheit dar. Dem entspricht
eine akustisch-auditive, durch einen raschen Pegelanstieg/-abfall bzw. Lautheitsanstieg/-abfall
6
gekennzeichnete Einheit. Wie wichtig diese rhythmische Struktur für die Identifizierung von
Schallereignissen als Sprachereignisse ist, zeigt sich für Tillmann und Pompino-Marschall
darin, dass das wahrnehmende Subjekt phonetische Ereignisse von anderen Schallereignissen
aufgrund der prosodischen Strukturierung der menschlichen Rede unterscheidet. Unter dem
Gesichtspunkt der Sprachwahrnehmung kommt somit dem silbischen Sprachrhythmus eine
gewichtige Rolle zu: Er strukturiert den Analyseprozess im Bereich der Zeit.
Damit eine Alternationsstruktur silbisch genannt werden kann, muss sie weitere Bedin-
gungen erfüllen, die ich zunächst an der lautsprachlichen Silbe erläutere. Wie Tillmann
(1980) mittels eines einfachen Wahrnehmungsexperiments zeigt, hängt die lautsprachliche
silbische Rhythmusstruktur von der Geschwindigkeit der Alternation ab. Wenn man eine
bestimmte Eigenschaft (z. B. Tonhöhe, Lautstärke oder Klangfarbe) sehr langsam zwischen
zwei Werten alternieren lässt, nimmt man die Eigenschaft selbst in ihrer Veränderung wahr
(A-Prosodie). Eine solche langsame Modulation liegt im Fall der Satzintonation vor. Wenn
die Alternation sehr schnell ist, wird nicht die Veränderung bzw. die Alternation als solche
wahrgenommen, sondern es entsteht der Eindruck einer neuen Eigenschaft (C-Prosodie).
Diese Modulation charakterisiert die segmentale Ebene, z. B. einen vibrierenden ("gerollten")
[r]-Laut. Dazwischen liegt die für die Silbenstruktur charakteristische mittlere Stufe, auf der
weder die sich ändernde Eigenschaft noch eine neue Eigenschaft wahrgenommen wird,
sondern die Oszillation selbst (B-Prosodie).
Modalitätsneutral formuliert, wird die Alternationsstruktur erst bei einer bestimmten
temporalen Geschwindigkeit oder räumlichen Ausdehnung der Oszillation als solche wahr-
genommen. Genau diese Bedingung erfüllt die suprasegmentale Alternation, die hier der laut-,
schrift- und gebärdensprachlichen Silbe als strukturelle Charakteristik zugrunde gelegt wird.
Vereinfacht ausgedrückt handelt es sich bei der Silbenoszillation um eine Alternation, bei der
die jeweils wiederkehrenden identischen Eigenschaften bzw. Werte eine bestimmte zeitliche
oder räumliche Distanz aufweisen müssen. Die Oszillationsstruktur darf sich über ein
Segment hinaus, nicht jedoch über ein Wort hinaus ausbreiten.
Die silbische Alternationsstruktur unterliegt neben der spezifischen ("mittleren") zeit-
lichen bzw. räumlichen Ausdehnung noch einer weiteren Bedingung. Eine Einheit dieser
Struktur ist prominenter als die anderen und ist konstitutiv für die Silbe, deren obligatorische
Konstituente sie bildet. Es ist der Nukleus bzw. Silbengipfel. In der Lautsprache wird der
Nukleus als sonorster Laut, als lautlicher Sonoritätsgipfel der relevanten Lautsequenz
substanziiert. Konstitutiv zu sein ist eine strukturelle Eigenschaft, sonor zu sein ist eine
substanzbasierte Lauteigenschaft. Wenn man die abstrakte strukturelle Eigenschaft des
7
Nukleus modalitätsneutral konkretisieren möchte, so bieten sich allgemeinere kognitive
Begriffe an, die Clements (1990) für den phonologischen und Perlmutter (1992) für den
gebärdensprachlichen Sonoritätsbegriff anbieten. Sonorität korreliert in dieser Auffassung mit
Wahrnehmungsprominenz bzw. Salienz. Für die Lautsprache leuchtet diese Interpretation
unmittelbar ein, weil sonorere Laute, z. B. Vokale, tatsächlich leichter wahrnehmbar, auffäl-
liger sind als weniger sonore, z. B. Konsonanten. Wir werden sehen, dass diese Interpretation
auch für die Schrift- und Gebärdensprache aufrecht erhalten werden kann.
Die bisherigen Annahmen lassen sich in der Notation der autosegmentalen CV-
Phonologie,5 das auf die anderen Modalitäten übertragen wird, wie folgt darstellen:
(2) ω Wortknoten|σ Silbenknoten
|¯¯¯¯¯¯|¯¯¯¯¯|O N K Silbenteilkonstituenten O= Onset, N= Nukleus, K= Koda | | |(Cn) V (Cn) Skelettpositionen | | |[...] [...] [...] Segmente bzw. Merkmalstrukturen | | |[b i n] phonologisches Beispiel6
(2) trägt als prosodischer Hierarchiebaum der Tatsache Rechnung, dass die Silbe eine
Struktureinheit "mittlerer" Größe zwischen Segment und Wort ist. Sie berücksichtigt auch die
Tatsache, dass die Silbe einen konstitutiven Bestandteil hat, nämlich V als Gipfel bzw.
Nukleus. Die C-Bestandteile sind fakultativ und können mehrfach vorkommen (Cn). In
diesem Beitrag wird die interessante Frage vernachlässigt, ob beides relevant ist, nämlich CV-
und Konstituentenschicht (vgl. dazu Lenerz 2000). Hier wird schon aus rein illustrativen
Gründen beides benötigt. Die CV-Skelettschicht verdeutlicht, dass die Silbe eine Alternation
von C und V ist. Die Konstituentenschicht hilft, verschiedene C-Skelettpositionen zu
identifizieren. Aus der Alternationshypothese folgt, dass eine perfekte Silbe neben genau
5 Diese Notation bedient sich der schriftsprachlichen Modalität und ist somit streng genommen nur für diesegeeignet. Eine modalitätsneutrale Notation gibt es prinzipiell nicht, so dass man zwangsläufig notationelleUngenauigkeiten in Kauf nehmen muss. Die drei Modalitäten werden notationell dadurch unterschieden, dassder Silbenknoten und das Beispielmaterial für die Lautsprache in eckigen Klammern, für die Gebärdensprache ingeschweiften Klammern und für die Schriftsprache in spitzen Klammern erscheinen. DazwischenliegendeKnoten werden aus Lesbarkeitsgründen nicht eingeklammert.6 Im Folgenden wird der Unterschied zwischen zugrunde liegenden und oberflächenorientierten lautsprach-lichen Repräsentationen nicht immer notationell durch schräge vs. eckige Klammern festgehalten. Wenn dieseUnterscheidung irrelevant oder nicht eindeutig zu treffen ist, werden die eckigen Klammern benützt. Außerdemwird die Vokalquantität im Deutschen nicht segmental durch Ungespanntheit, z. B. i - !, e - ", sondernsuprasegmental repräsentiert (vgl. Abschnitt 4 unten).
8
einer V-Position auch genau eine C-Position aufweist (vgl. die einfachste Alternationsstruktur
(1a) oben). In (3)-(4) wird diese mediumneutrale Charakteristik zusammengefasst:
(3) Gipfel-Beschränkung: Jede Silbe hat genau eine segmental assoziierte V-Position.
(4) Rand-Beschränkung: Jede Silbe hat genau eine segmental assoziierte C-Position.
Dabei ist es wichtig festzuhalten, dass V und C keine segmentale, d. h. auf inhärenten
Segmentmerkmalen basierende Klassifizierung darstellt, sondern eine rein silbenstrukturelle
Unterscheidung trifft. Die V-Position kann grundsätzlich mit einem nicht-prominenten
Segment (z. B. Konsonanten in der Lautsprache) und eine C-Position kann mit einem
prominenten Segment (z. B. Vokal) assoziiert sein. Die Assoziation zwischen Skelett- und
Segmentschicht ist jedoch nicht beliebig, sondern unterliegt folgenden
Prominenzbeschränkungen:
(5) Voraussetzung für beliebige Segmente S1 und S2: S1 ist prominenter als S2 (S1 > S2);
a. Prominenzbeschränkung für Gipfel (V-Position): In jeder Sprache dominiert das Verbot
der Gipfelplatzierung von S2 das Verbot der Gipfelplatzierung von S1 (*S2 >> *S1).
b. Prominenzbeschränkung für Ränder: In jeder Sprache dominiert das Verbot der
Randplatzierung von S1 das Verbot der Randplatzierung von S2 (*S1 >> *S2).
Der Dominanzbegriff (Abk. >>) und die hier vertretene Auffassung, dass Beschränkungen
verletzbar sind, entstammt der Optimalitätstheorie, in der verletzbare Beschränkungen in einer
Dominanzhierarchie angeordnet sind (vgl. Abschnitt 5.2 dieser Arbeit).
Die Prominenzbeschränkungen in (5) sind keine einzelnen Beschränkungen, sondern
Meta-Beschränkungen, die jeweils mehrere Beschränkungen zusammenfassen und eine
universelle Dominanzhierarchie garantieren (vgl. Prince/Smolensky (1993) für universelle
Dominanzhierarchien auf der Grundlage der Sonoritätsskala). Da die
Prominenzbeschränkungen für die Lautsprache bestens bekannt sind, sollen sie zur ersten
Illustration dienen. Wenn man sich zunächst mit der Unterscheidung zwischen Vokalen und
Konsonanten begnügt und annimmt, dass Vokale prominenter (in diesem Fall sonorer) als
Konsonanten sind, dann besagt die erste Beschränkung, dass in jeder Sprache das Verbot
gegen einen Konsonanten im Gipfel das Verbot gegen einen Vokal im Gipfel dominiert. Eine
solche Dominanzbestimmung schließt Sprachen, die nur Konsonanten im Gipfel aufweisen
sowie Sprachen, die Vokale und Konsonanten unterschiedslos im Gipfel zulassen, aus. Die
9
Prominenzbeschränkungen setzen eine Prominenzunterscheidung zwischen den Segmenten
voraus, aber schränken diese selbst nicht ein und können auf einzelsprachliche wie
modalitätsspezifische Prominenzhierarchien angewandt werden.
Die silbische Alternationsstruktur teilt mit syntaktischen Strukturen die Eigenschaft,
genau ein konstitutives Element, den Gipfel bzw. Kopf, aufzuweisen. Die Dependenz-
Phonologie (vgl. Anderson/Ewen 1987) und in noch größerem Maße die Government-
Phonologie (vgl. Kaye/Lowenstamm/Vergnaud 1990) tragen dieser Tatsache Rechnung,
indem sie die Silbenstrukturen den syntaktischen Strukturen angleichen. Wie im Falle des
Verhältnisses zwischen den drei modalitätsspezifischen Silbenbegriffen ist es verfänglich, die
Gemeinsamkeiten dadurch zu erklären, dass man eine Alternative der anderen überstülpt.
Vielversprechender erscheint auch hier die Annahme, dass den syntaktischen und silbischen
Strukturtypen ein abstrakteres Aufbauprinzip zugrunde liegt, das genau ein konstitutives,
wahrnehmungsprominentes Element verlangt. Diese Elemente werden in silbischen und
syntaktischen Strukturen ganz unterschiedlich serialisiert, was auf die Verschiedenartigkeit
der Strukturierungstypen hinweist. In silbischen Alternationsstrukturen werden benachbarte
Nuklei (Hiatbildung) gemieden, in syntaktischen Strukturen werden benachbarte Köpfe
bevorzugt. Syntaktische Strukturen unterliegen nämlich dem Kopfserialisierungsprinzip,
wonach alle Köpfe einer Phrase im optimalen Fall am selben Rand der Phrase platziert sind.
Bei Befolgung dieses Prinzips ergeben sich entweder links- oder rechtsperipher benachbarte
Köpfe. Diese Eigenschaft ist keine Folgeerscheinung der größeren Erstreckung syntaktischer
Phrasen. So vermeidet auch die rhythmische Struktur der Phrasen- und Satzebene (Tillmanns
o. g. A-Prosodie) benachbarte starke Akzente (vgl. Uhmann 1991).7 Ein weiterer Unterschied
zwischen den beiden Strukturtypen ist die Projektivität syntaktischer Köpfe bzw. die Endo-
zentrizität syntaktischer Phrasen. Köpfe vererben ihre flexionsmorphologischen und
syntaktischen Merkmale an den Mutterknoten und umgekehrt. Ein silbischer Gipfel hat keine
vergleichbare Projektivität. Nicht er allein, sondern die Alternation zwischen ihm und einem
anderen Element, identifiziert den Mutterknoten. Ich meine, dass sich diese Unterschiede aus
dem Alternationscharakter silbischer Strukturen ableiten lassen.
Die Annahmen dieses Abschnitts sollen zunächst an der Silbe in der Gebärdensprache
überprüft werden. Sie ist über jeden Verdacht erhaben, dass es sich um eine Gebärdenkopie
der phonologischen Silbe im Sinne einer Ableitbarkeitshypothese handelt. Sie ist deswegen
7 Auf syntaktischer Ebene finden wir somit beide Strukturierungsprinzipien: in der phrasalen Akzentzuweisungund Intonation eine rhythmische Alternationsstruktur und im genuin syntaktischen Aufbau der Phrasen einspezifisches syntaktisches Strukturierungsprinzip.
10
besonders geeignet, auch diejenigen Leserinnen und Leser von der Notwendigkeit eines
mediumübergreifenden Silbenbegriffs zu überzeugen, die noch fest daran glauben, dass
Silben nur in der Lautsprache einen Sinn machen.
3. Die Silbe in der Gebärdensprache
Gebärdensprachen sind auf den hier zur Diskussion stehenden Ebenen analog strukturiert wie
Laut- und Schriftsprachen. Es gibt lexikalisch distinktive, jedoch nicht bedeutungstragende
Einheiten, die nach bestimmten Gesetzmäßigkeiten zu Silben miteinander kombiniert werden.
Silben bilden ihrerseits Gebärden (lexikalische Einheiten bzw. Wörter). Eine Gebärde setzt
sich aus vier distinktiven manuellen8 Komponenten zusammen: dem Ausführungsort der
Gebärde, der Handform, der Bewegung der Hände bei Ort- und Handformwechsel und der
Handorientierung. Aus einer Kombination dieser Elemente resultieren alle Gebärden einer
Sprache. Dass diese kleinsten Einheiten lexikalisch distinktiv sind, soll anhand folgender
Minimalpaare aus der Amerikanischen Gebärdensprache (ASL, engl. American Sign
Language) und dem Ausführungsortmerkmal illustriert werden.
Abb. I Minimalpaare hinsichtlich des Ausführungsorts in ASL (Klima/Bellugi 1979: 42)
SUMMER UGLY DRY
Die drei illustrierten Gebärden unterscheiden sich nur hinsichtlich des Ausführungsortes;
Handform, Bewegung und Orientierung sind identisch.
Eine Vielzahl von Forschern argumentiert für eine Struktureinheit oberhalb der
Segmentebene und unterhalb der Gebärdenebene, die der phonologischen Silbe entspricht (u.
11
a. Sandler 1989, 2000, Brentari 1990, 1998, Wilbur 1990, Perlmutter 1992). Im Folgenden
wird der einflussreiche Ansatz von Perlmutter (1992) referiert. Perlmutter klassifiziert die
gebärdensprachlichen Segmente in zwei Typen: Bewegung (engl. movement, M) und Position
(P, bei anderen Autoren location, vgl. Liddell/Johnson (1989)).
Die meisten lexikalischen Einheiten sind einsilbig. Folgende Segmentsequenzen sind in
ASL in einer lexikalischen Einheit möglich: PMP, MP, PM, M und P. Andere, wie etwa *MM
oder *PP, sind ausgeschlossen. Wie diese Sequenztypen aufzufassen sind, soll am Beispiel
einer MP-vs. PM-Sequenz erläutert werden. Vgl. Abb. IIa und IIb (Perlmutter 1992: 409):
Abb. IIa MP: SICK Abb. IIb PM: TAKE OFF
Bei der Gebärde für SICK findet eine Bewegung statt, der eine Positionierung der aus-
führenden Hand an die Stirn folgt. Die Positionierung der Hand vor der Bewegung spielt
keine Rolle. Die Gebärde für TAKE-OFF beginnt mit einer Positionierung der ausführenden
Hand auf der anderen Hand und endet mit einer Bewegung. Weil die ausführende Hand am
Ende der Gebärde keine bestimmte Position einnehmen muss, gibt es kein finales P-Segment.
Unter Berücksichtigung weiterer Evidenz, die im Anschluss diskutiert wird, trifft
Perlmutter folgende Annahmen:
(a) M-Segmente sind sonorer, d. h. wahrnehmungsprominenter, als P-Segmente. M-Segmente
entsprechen den Vokalen in Lautsprachen und P-Segmente den Konsonanten in
Lautsprachen.
8 Wie in der einschlägigen Literatur bleiben nicht-manuelle Komponenten wie Mimik und Körperhaltung hierunberücksichtigt.
12
(b) Jede Silbe hat einen Nukleus; Onset und Koda sind fakultativ.
1995). Am deutlichsten repräsentiert wird sie in der CV-Phonologie (vgl. Clements/Keyser
1983) und in Vennemanns (1994) Nuklearphonologie. Bei Vennemann besteht die silbische
Alternationsstruktur aus zwei Werten der Energiekontur bzw. des Silbenschnitts, nämlich
Crescendo und Decrescendo. Ich bleibe bei der Methode der CV-Phonologie, da sie sich einer
breiteren Popularität erfreut und deshalb hier nicht näher motiviert werden braucht. Ich habe
sie auch für die Gebärden- und Schriftsprache übernommen.10
Die modalitätsneutrale Alternationsstruktur der Silbe erklärt die ersten wichtigen laut-
sprachlichen Silbenstrukturbeschränkungen. Die optimale Alternationsstruktur besteht aus
einer einfachen binären Alternation, die durch die Nukleus- und Randbeschränkung (3) und
9 Vgl. Leuninger et al. (2001) für ihre Auswirkung bei Selbstkorrekturen.10 Den Leserinnen und Lesern, die mit neueren phonologischen Silbentheorien nicht vertraut sind, dienenfolgende Hinweise. Einflussreiche Arbeiten zu phonologischen Silbenstrukturbeschränkungen sind Jakobson(1962), Hooper (1976), Vennemann (1982, 1988), Cairns/Feinstein (1982), Selkirk (1984) und dieoptimalitätstheoretische Arbeit von Prince/Smolensky (1993). Die Sonoritätshierarchie wird schon bei Sievers(1901) behandelt. Neuere Gesamtdarstellungen der Silbenphonologie des Deutschen sind Wiese (2000),
18
(4) erfasst wurde. Dass diese modalitätsunabhängige Charakteristik auch für die laut-
kungen, die in neueren phonologischen Silbentheorien konsensfähig sind:
(10) Gipfel-Beschränkung: Jede Silbe hat genau eine segmental assoziierte V-Position.
(11) Rand-Beschränkungen:11
a. Onset-Gebot: Jede Silbe hat genau eine segmental assoziierte Onset-Position.
b. Koda-Verbot: Jede Silbe hat eine leere Koda (d. h. keine Silbe hat eine segmental
assoziierte Koda).
Die modalitätsunabhängigen Prominenzbeschränkungen (vgl. (5) oben) werden in der
modalitätsspezifischen Ausprägung als Sonoritätsbeschränkungen in der Phonologie allge-
mein akzeptiert (vgl. für eine genaue Formalisierung im Rahmen der Optimalitätstheorie
Prince/Smolensky 1993):
(12) Voraussetzung für beliebige Segmente S1 und S2: S1 ist sonorer als S2 (S1 > S2);
a. Sonoritätsbeschränkung für Gipfel (V-Position): In jeder Sprache dominiert das
Verbot der Gipfelplatzierung von S2 das Verbot der Gipfelplatzierung von S1 (*S2 >>
*S1).
b. Sonoritätsbeschränkung für Ränder: In jeder Sprache dominiert das Verbot der
Randplatzierung von S1 das Verbot der Randplatzierung von S2 (*S1 >> *S2).
So kann im Deutschen und anderen Sprachen in der V-Position der phonologischen Silbe
jeder Vokal stehen. Konsonanten erscheinen dort nur unter bestimmten Bedingungen, nämlich
nur in einer Reduktionssilbe und nur wenn es in der Silbe keinen Vokal gibt und der
Konsonant eine relativ große Sonorität aufweist und zur Gruppe der Sonoranten gehört. Die
zweite Silbe der folgenden Beispiele hat einen Sonoranten in der V-Position:
Eisenberg (1998) und Ramers (1998a). Eine allgemeine Einführung in die suprasegmentale Phonologie ist z. B.Goldsmith (1990).11 Aus der modalitätsneutralen Alternationsstruktur (vgl. (3)-(4) oben) folgt lediglich, dass eine optimale Silbeüber je eine segmental besetzte C- und V-Position verfügt. Eine Erklärung für die Tatsache, dass lautsprachlicheSilben den Onset anstelle der Koda bevorzugen, bietet Pompino-Marschall (1993). Er weist nach, dass derSonoritätsanstieg des Onsets einen stärkeren Einfluss auf den "Rhythmuspunkt" der Silbe ausübt als derSonoritätsabfall der Koda.
19
(13) σ|¯¯|O N| |C V| |
[a t m] <Atem>[e d l ] <edel>[e d n] <Eden>
Mit der Zulassung von Sonoranten in der V-Position sind wir schon bei den substanz-
determinierten Besonderheiten der lautsprachlichen Silbe angekommen.
In der Lautsprache haben wir zeitlich kontinuierliche, simultane Artikulations- bzw.
Schallereignisse, d. h. Ereignisse, die aus mehreren sich überlappenden und ineinander über-
gehenden Teilereignissen bestehen. Letzteres wird in der Phonetik als Koartikulation und
Steuerung bezeichnet (vgl. Menzerath/de Lacerda 1933, Kohler 1977 und Heike 1992 unter
besonderer Berücksichtigung der Silbe). Dass in der Phonetik von Einzellauten und
Segmenten gesprochen wird, führen Tillmann (1980: 56) und Pompino-Marschall (1995: 227)
auf das Alltagsverständnis einer alphabetisch literalen Gesellschaft zurück, womit sie diese
Vorgehensweise als schriftinduziert erklären.
Realisiert man die abstrakte Alternationsstruktur der Silbe durch lautsprachliche Signale,
so ergeben sich die wichtigsten charakteristischen Eigenschaften der phonologischen Silben-
struktur. Dem Silbenrand entspricht ein artikulatorischer Verschluss, dem Silbengipfel eine
artikulatorische Öffnung. Das auditivphonetische Korrelat ist ein Lautheitsanstieg bzw.
-abfall. Durch die Charakteristik lautsprachlicher Artikulationsvorgänge handelt es sich um
ein graduelles, kontinuierliches Öffnen und Schließen (vgl. Eisenberg 1998, Kap. 4 für eine
detaillierte Darstellung). Die phonologische Entsprechung dieser substanziellen Gegebenheit
ist eine graduelle, skalare Anordnung der Laute entlang einer sehr differenzierten Sonoritäts-
hierarchie bzw. -skala. Die wichtigsten Sonoritätsunterschiede für das Deutsche illustriert
folgende Skala (durch Komma getrennte Segmente haben dieselbe Sonorität):
(14) ----- abfallende Sonorität ---->
a, e > i, u > r > l > m, n, N > v, z, J > f, s, š, ç, x, h, > p, t, kb, d, g
In der phonologischen Komponente des Lexikons des Deutschen muss also vermerkt werden,
ob ein Vokalmonophthong in einer Vollsilbe mit der nuklearen C-Position assoziiert ist oder
nicht, weil diese Information nicht vorhersagbar ist, d. h. aus silbenstrukturellen Beschrän-
kungen nicht abgeleitet werden kann; vgl. die Spezifikationen in (19), in denen die doppelt
durchgestrichene Linie - wie in der Autosegmentalen Phonologie üblich - eine verbotene
Assoziation darstellt:
(19) CN CN
| f a l <fahl> f a l <Fall>
Die Assoziationen mit den anderen silbenstrukturellen Positionen ergeben sich aus den unten
diskutierten Silbenstrukturbeschränkungen von selbst und müssen nicht lexikalisch markiert
werden. Vokalquantität wird in Anlehnung an neueren phonologischen Theorien
suprasegmental repräsentiert, und zwar dadurch, dass ein Langvokal im Gegensatz zu einem
Kurzvokal zwei Skelettpositionen besetzt (vgl. schon Clements/Keyser 1983).
Das Deutsche scheint eine Silbenschnittsprache zu sein (vgl. Vennemann 1994, Becker
1996), deren silbenstrukturelle Besonderheit die in (16) genannte Beschränkung für die
Besetzung der nuklearen C-Position ist. Dieser Beschränkung zufolge bildet schon der
Nukleus einer Vollsilbe eine minimale segmental obligatorisch zu besetzende VC-
Alternationsstruktur, deren phonetisches Korrelat tatsächlich prosodischer, und nicht wie
22
vielfach angenommen ausschließlich quantitativer Natur ist (vgl. Spiekermann 2000). Diese
nukleare Alternationsstruktur charakterisiert die Vokalopposition im Deutschen: Langvokale
bzw. Vokale mit sanftem Schnitt werden mit beiden Nukleuspositionen assoziiert (vgl. fahl),
Kurzvokale bzw. scharf geschnittene Vokale nur mit der V-Position (vgl. Fall). Im Folgenden
wird weiterhin aus rein praktischen terminologischen Gründen von Vokalquantität, Lang- und
Kurzvokal gesprochen.
Da eine minimale Vollsilbe im Deutschen zwei besetzte Nukleuspositionen aufweist,
muss einem Kurzvokal ein Konsonant (vgl. fall) oder ein weiterer Vokal in der zweiten
Nukleusposition folgen, womit sich ein Diphthong ergibt (z. B. rau). Das Verzweigungsgebot
erklärt auch, warum im Standarddeutschen ein Langvokal, ein Diphthong und die Folge
Kurzvokal + Konsonant phonotaktisch äquivalent sind: nach Kurzvokal kann genau ein
Konsonant mehr in der Silbe auftreten als nach Langvokal oder Diphthong. Alle diese Ein-
heiten besetzen nämlich genau zwei nukleare Skelettpositionen (V und C). Diese minimale
Alternationsstruktur wird durch die Besetzung eines Silbenrandes, bevorzugt des Onsets,
erweitert. Insoweit folgt auch das Deutsche der allgemeinen Rand-Gipfel-Konfiguration CV.
Im Deutschen muss man allerdings zwischen Nukleus im weiteren Sinn und V-Silbengipfel
unterscheiden. Im V-Silbengipfel muss der Sonoritätsgipfel liegen (vgl. (22) unten). Die
unmittelbar folgende C-Position genießt einen Sonderstatus. Ihre segmentale Besetzung ist in
Vollsilben obligatorisch, was für ihren nuklearen Status spricht. Anderseits unterscheidet sie
sich vom V-Silbengipfel dadurch, dass sie weniger sonore Segmente beherbergen kann und
der Auslautverhärtung (vgl. ab [ap]) unterliegt. Der Sonderstatus der nuklearen C-Position
wird sich auch in der deutschen Schriftsprache zeigen.
Wie bereits erwähnt, folgt aus dem Verzweigungsgebot, dass in Vollsilben mit Kurzvokal
die zweite Nukleusposition durch ein anderes Segment besetzt sein muss. Das gilt auch für
wortinterne Kurzvokale wie bei fallen. Das Verzweigungsgebot und das bereits genannte
Onset-Gebot (11a) rechtfertigen die Annahme von ambisilbischen Konsonanten oder
Gelenkkonsonanten wie bei fallen. Vgl. die silbenstrukturelle Darstellung des Minimalpaares
fahlen - fallen:
23
(20) (a) [ω] (b) [ω]|¯¯¯¯¯¯¯| |¯¯¯¯¯¯¯|σ σ σ σ
|¯¯¯| |¯¯|¯¯| |¯¯¯| |¯¯|¯¯|O N O N K O N O N K| /\ | | | | /\ | | |C V C C V C C V C C V C| \/ | | | | | \/ | |
[f a l ´ n] [f a l ´ n]
Die zweite Silbe dieser Beispiele ist eine nicht betonbare Reduktionssilbe, die über einen
einfachen Nukleus verfügt. Gelenkkonsonanten stiften segmental diffuse Silbengrenzen und
könnten sich als Mediumspezifikum erweisen, da die phonetische Substanz der Lautsprache
keine diskreten Einheiten hat. In der Schriftsprache, die über diskrete Einheiten verfügt, gibt
es keine Gelenkkonsonanten.
Eine weitere Erscheinung, die der graduellen, kontinuierlichen Substanz der Lautsprache
entspricht, ist die Tatsache, dass Vokale mit geringerer Sonorität, also die hohen Vokale [u],
[y] oder [i], in gipfeladjazenten C-Positionen erscheinen können (vgl. Wiese 2000). Zum
einen finden wir sie in der nuklearen C-Position im Diphthong (vgl. bspw. die phonologische
Form von leiten, lauten oder läuten). Zum anderen kommen solche Vokale z. B. im Onset der
zweiten Silben von Ferien, Nation und graduell vor, wenn die Wörter zweisilbig ausge-
sprochen werden. (21) illustriert die zweisilbige Struktur von Nation:12
(21) [ω]|¯¯¯¯¯¯¯¯¯|σ σ
|¯¯¯| |¯¯¯¯|¯¯|O N O N K| /\ /\ /\ |C V C C C V C C| \/ /\ | \/ |
[n a t s i o n]
Solche Segmente werden von vielen Phonologen nicht als Vokale im engeren Sinn, sondern
als Glides klassifiziert (vgl. Ramers/Vater 1995, Ramers 1998a). Die Einführung dieses neuen
Segmenttyps erweist sich bei Berücksichtigung silbenstruktureller Gegebenheiten als
überflüssig, weil die konsonantenähnlichere Realisation dieser Vokale eine Folgeerscheinung
12 Dass nur der Vokal [o], nicht aber auch [a] lang artikuliert wird, liegt an der Tatsache, dass oberflächen-realisierte Vokallänge mit Betonung korreliert (vgl. Wiese 2000 und Becker 1996, der diese Korrelationaußerdem als grundlegend betrachtet und das Verzweigungsgebot auf Tonsilben einschränkt).
24
ihrer C-Position und der Sonoritätssequenzbeschränkung ist, der wir uns nun widmen. Vgl.
(22):
(22) Sonoritätssequenzbeschränkung: In einer phonologischen Silbe muss die Sonorität der
Segmente zur V-Position hin stetig zunehmen und von der V-Position weg stetig
abnehmen.
Diese Beschränkung erklärt u. a., dass Vokale nicht nur im Silbengipfel, d. h. in der V-
Position, sondern auch in einer benachbarten C-Position, d. h. in der Silbengipfelschale, vor-
kommen, hier aber nur, wenn sie weniger sonor sind als der Vokal im Silbengipfel.
Die Wirkung der Sonoritätssequenzbeschränkung zeigt sich auch darin, dass in (23) nur
die ersten beiden einsilbigen Formen akzeptabel sind (vgl. Vennemann 1982 für eine
eingehendere Diskussion):
(23) [trik], [hort], *[rtik], *[hotr]
Nur extrasilbische Elemente wie [št] oder [šp] in Stau und Spaten, die i. d. R. nur am Rande
phonologischer Wörter vorkommen, werden von dieser Beschränkung nicht erfasst (vgl.
Vennemann 1982, Wiese 2000).
Die Sonoritätssequenzbeschränkung setzt im Gegensatz zur mediumneutralen Prominenz-
beschränkung (5) bzw. (12) mehrgliedrige graduelle Prominanzabstufungen voraus. Auf eine
binäre Vokal-Konsonant-Skala angewandt, kann die Sonoritätssequenzbeschränkung die
soeben besprochenen Restriktionen im Deutschen nicht erfassen. Sie ist somit eine weitere
mediumspezifische Erscheinung, die sich aus dem kontinuierlichen, graduellen Charakter
phonetischer Ereignisse erklären lässt und weder in der Gebärdensprache noch im Schrift-
system eine exakte Entsprechung findet.
Die Relevanz gradueller Sonoritätsabstufungen zeigt sich auch bei der lautsprachlichen
Syllabierung. Die einschlägige Beschränkung ist (24):
(24) Syllabierungsbeschränkung: Bei einer lautsprachlichen internuklearen Konsonanz
beginnt der nächste Onset mit dem letzten Sonoritätsminimum.
(24) trifft über die Sonoritätssequenzbeschränkung (22) hinaus eine Differenzierung zwischen
Onset und Koda und verlangt das Sonoritätsminimum im Onset und nicht in der Koda. Aus
25
diesem Grund wird die Beschränkung auch als Onset-Maximierung bezeichnet. Die
Onsetcluster, die (24) verlangt, müssen natürlich anderen gleich- oder höherrangigen
Beschränkungen genügen. Eine einschlägige Beschränkung ist das Verzweigungsgebot für
Vollsilben, die die Besetzung der nuklearen C-Position verlangt (vgl. (16) oben) und
zusammen mit den Onsetgeboten (24) und (11a) eine Gelenkbildung erzwingt (vgl. (20b)
oben). Eine weitere intervenierende Beschränkung ist, dass die wortmedialen Onsetcluster
auch wortinitial zugelassen sein müssen (vgl. das Initialgesetz von Vennemann 1982). Die
Beispiele in (25a, b) befolgen alle intervenierenden Beschränkungen. Die Beispiele in (25c)
verletzen das Initialgesetz (wenn man Eigennamen wie Gmund sinnvollerweise außer
Betracht lässt). Im Falle eines solchen Regelkonflikts gibt es schwankende Intuitionen und
auch schwankende normative Festlegungen (vgl. Muthmann 1996: 487f.):
(25) a. [ma:$l´], [ty:$r´]
b. [vi:$driç], [e:$kliç], [duN$kl´]
c. [a:$dl´r], [ra:$dl´r], [re:$dn´r], [ma:$gma]
Ich fasse zusammen. Die grundlegende modalitätsneutrale Alternationsstruktur manifestiert
sich auch in der lautsprachlichen Silbe des Deutschen dadurch, dass die CV-Silbe die ideale
Konfiguration ist. Aufgrund der charakteristischen Substanz der Lautsprache - kontinuierliche
sich überlappende Schallereignisse bzw. feinmotorische Artikulationsvorgänge - können sehr
fein abgestufte Sonoritätsskalen an Relevanz gewinnen. Infolgedessen nehmen die laut-
sprachlichen Prominenzbeschränkungen auf solche Feinabstufungen Bezug und ergeben viel
differenziertere Restriktionen als in den anderen untersuchten Modalitäten. Aus der binären
CV-Alternation kann - wie am Beispiel der deutschen Lautsprache gezeigt - eine durch die
Sonoritätssequenzbeschränkung erfasste graduelle Alternation entstehen. Das sind modalitäts-
unabhängige wie allgemein lautsprachliche Merkmale, die sich in der deutschen Lautsprache
manifestieren. Mindestens fünf Erscheinungen des Deutschen demonstrieren die substanzielle
Charakteristik der lautsprachlichen Silbe. In der V-Position von Reduktionssilben erscheinen
nicht nur Vokale, sondern auch die sonorsten Konsonanten (Sonoranten). Ferner gibt es
Silbengrenzen mit Gelenkkonsonanten, die nicht genau segmentiert werden können, d. h. sich
segmental überlappen. Außerdem sind in C-Positionen nicht nur Konsonanten, sondern
weniger sonore, hohe Vokale zugelassen. Desweiteren gibt es in der Lautsprache eine
Sonoritätssequenzbeschränkung, die mehr als zwei Abstufungen zwischen den einzelnen
26
Skelettpositionen vornimmt. Schließlich nimmt die Zerlegung der Wörter in Silben auf den
graduellen Begriff des Sonoritätsminimums Bezug.
5. Die Silbe in der Schriftsprache
Die Rolle silbischer Einheiten in der Graphematik wurde in früheren Arbeiten auf die Wort-
trennung am Zeilenende beschränkt (vgl. Hofrichter 1980, 1989 unter der Bezeichnung
"graphisches Wortsegment"). In neueren Ansätzen wird die Rolle der Schreibsilbe als eigen-
ständige graphematische Einheit deutlicher herausgearbeitet (z. B. Eisenberg 1989, 1995,
die sich mit den kleinsten Buchstabenteilen und ihrer Kombinatorik beschäftigt. Allerdings
wurden solche Merkmale kaum hinsichtlich ihrer Funktion im Sprachsystem untersucht (vgl.
jedoch Naumann 1989 und Primus 2001). Die vorliegenden Überlegungen beziehen sich auf
rezeptionsorientierte, visuelle Merkmale, die im Gegensatz zu den produktionsorientierten
Merkmalen weniger Variationen unterliegen.13
Für die Silbe ist die Spatiumeinteilung der Kleinbuchstaben14 relevant. Die Buchstaben
und ihre distinktiven Teile werden auf der Grundlage vier übereinander liegender Spatien
bestimmt:
Jeder Großbuchstabe hat unabhängig von seiner internen Struktur eine gleiche Länge, die sich
auf die Spatien 2-4 erstreckt. Kleinbuchstaben unterscheiden sich systematisch in der Länge
von Großbuchstaben und sind in ihrer Länge variabel. Brekle (1994) hat nachgewiesen, dass
für die Buchstabenformen der westlichen Alphabetschriften (beginnend mit den Phönizi-
schen) die Ausformung einer geraden vertikalen Linie, die er Hasta und Watt (1983, 1988)
Vexillum nennt, charakteristisch ist. Besonders deutlich ist dieses Hasta- bzw. Vexillum-
prinzip in den modernen römischen Kleinbuchstabenalphabeten, unserem zentralen Unter-
suchungsgegenstand, manifest. Den buchstabendifferenzierenden Teil nennt Brekle Coda und
Watt Augment. Aufgrund der folgenden Beschränkung kann das Mittelspatium, das aus den
13 Watt (1983, 1988) und Günther (1988) betonen das Primat der rezeptionsbasierten Merkmale in Schrift-systemen. Wichtig für unsere Überlegungen zur graphematischen Silbe ist jedoch die Tatsache, dass sich dieseEinheit auch in der Schreibproduktion nachweisen lässt (vgl. Will et al. 2001, Nottbusch/Weingarten 2001).14 Das System der Kleinbuchstaben ist das grundlegende System, aus dem die Großschreibung (die Initial-großschreibung wie die durchgehende Großschreibung) durch Regeln abgeleitet werden kann (vgl. Gallmann1985, Günther 1988)
A B a b c p e
28
inneren Spatien 2 und 3 besteht, als Wahrnehmungszentrum der Buchstabenschrift aufgefasst
werden.
(26) Mittelspatiumbeschränkung: Die Kleinbuchstaben haben ihr buchstabendifferenzieren-
des Augment im Mittelspatium (Ausnahme "g" vs. "q"). Viele Kleinbuchstaben über-
schreiten das Mittelspatium nicht.
Hinsichtlich der Länge der Kleinbuchstaben wird folgende Festlegung getroffen:
(27) Kleinbuchstaben, die nur das Mittelspatium füllen, sind [-lang], solche, die es
überschreiten, sind [+lang].
Mit dem graphetischen Längenkontrast korreliert die graphematisch relevante Klassifizierung
der Segmente (Buchstaben und Grapheme) in V- und C-Segmente. (28) zeigt, dass native V-
Buchstaben im Gegensatz zu C-Buchstaben das Mittelspatium nie überschreiten dürfen:15
(28) V-Buchstaben [-lang]: a, e, i, o, u
C-Buchstaben [+lang]: b, d, f, g, h, j, k, l, p, q, ß, t
C-Buchstaben [-lang]: c, m, n, r, s, v, w, x, z
Die Buchstaben mit Trema, d. h. ä, ö, ü, sind komplexe Grapheme (vgl. Gallmann 1985).
Grapheme sind lexikalisch distinktive Buchstaben oder Buchstabencluster wie z. B. <ch> und
<sch> in <tauchen> bzw. <tauschen>, die silbenstrukturell eine unzerlegbare Einheit bilden
(vgl. Eisenberg 1985, Augst 1985). Die Klassifizierung in V und C gilt auch für Grapheme.
Komplexe Grapheme, die einen C-Buchstaben enthalten und somit das Mittelspatium
überschreiten dürfen, sind C-Grapheme (z. B. <qu>).
Die Unterscheidung zwischen V- und C-Graphemen spielt für die Zerlegung der Wörter in
Silben (Syllabierung) sowie für Silbenstrukturbeschränkungen eine wichtige Rolle. Die
Syllabierungsbeschränkung lautet (vgl. (41) unten), dass das letzte C-Graphem zwischen zwei
V-Graphemen bei der Worttrennung am Zeilende auf die nächste Zeile kommt (z. B. <be-
ten>, <ker-le>). Die Relevanz des Längenmerkmals für das Schriftsystem des Deutschen hat
15 Weil das graphische Längenmerkmal keine komplementäre Klasseneinteilung erlaubt, schafft nur eine exten-sionale Definition durch Aufzählung der betroffenen Einheiten Eindeutigkeit. Diese Unterscheidung ist trotz
29
Naumann (1989: 194f.) hervorgehoben. Naumanns Annahme ist, dass das lange Vexillum der
C-Grapheme bzw. C-Buchstaben als ikonisches Zeichen für einen wortinternen
phonologischen Onset, dem eine Schließbewegung der Artikulatoren entspricht, dient.
Folgende Tabelle veranschaulicht mehrere einschlägige Fälle:
Onset Nukleus Koda Onset Nukleus
langer Buchstabelautlicher Verschluss
kurzer Buchstabelautliche Öffnung
leer oder kurz langer Buchstabelautlicher Verschluss
kurzer Buchstabelautliche Öffnung
b e t e
k e r l e
t ö n e
k e n n e
f a l t e
f a h r e
Naumanns Hypothese der graphetischen Onsetvisualisierung ist empirisch nur partiell erfüllt.
Bei Wörtern wie <töne> oder <kenne> wird der Onset der zweiten Silbe visuell durch Länge
gar nicht angezeigt. Bei Wörtern wie <falte> wird er nicht eindeutig angezeigt. Bei Wörtern
wie <fahre> enthält fälschlicherweise die Koda der ersten Silbe und nicht der Onset der
zweiten Silbe die Länge. Die Probleme ergeben sich aus der Annahme Naumanns, dass es auf
das lange Vexillum der C-Buchstaben und den Silbenanfang ankommt. C-Buchstaben sind
jedoch in ihrer Länge unterschiedlich und außerdem kommen sie nicht nur im Onset vor. Aus
diesem Grund können sie den Silbenanfang durch Länge nicht immer eindeutig abbilden.
Hier wird dagegen die Auffassung vertreten, dass die visuelle Kennzeichnung des Silben-
gipfels zuverlässiger ist als die des Silbenanfangs. Folgende Beschränkung über den Silben-
gipfel gilt ausnahmslos:
(29) Der graphetische Silbengipfel darf das Mittelspatium nicht überschreiten. Nicht-native
Buchstaben / Grapheme (vgl. Lyrik, Physik) unterliegen dieser Beschränkung nicht.
Die Beschränkung gilt für Buchstaben und nicht für Diakritika (Trema, i-Punkt).
verfänglicher CV-Terminologie segmentaler und nicht silbenstruktureller Natur. In Ermangelung einer besserenTerminologie wird hier diese Mehrdeutigkeit in Kauf genommen.
30
Diese Beschränkung lässt sich aus der allgemeineren Prominenzbeschränkung erklären, dass
der Silbengipfel unabhängig vom Realisationsmedium (Laut-, Schrift- oder Gebärdensprache)
das Wahrnehmungszentrum der Silbe bildet und im optimalen Fall nur mit wahrnehmungs-
prominenten Elementen assoziiert wird (vgl. (5) oben). Mediumspezifisch ist die binäre
Prominenzskala:
(30) Prominenzskala für die deutsche Schriftsprache: V-Segment > C-Segment (Buchstabe
oder Graphem)
Diese binäre Segmentklassifizierung liegt in der substanziellen Charakteristik der Schrift-
sprache begründet (vgl. Günther 1983), die in (31) zusammengefasst wird:
(31) Das schriftsprachliche Medium weist diskrete Einheiten auf. Schriftsprachliche
Prominenzskalen sind binär und diskret. Sie determinieren eine binäre silbische
Alternationsstruktur ohne Übergangselemente zwischen C und V. Diese starke
Binaritäts- und Diskretheitshypothese gilt uneingeschränkt für das nativ-deutsche
Schriftsystem.
Zusammenfassend kann festgehalten werden, dass die graphische Substanz der Alternations-
struktur in der Spatiumeinteilung bzw. Länge der Kleinbuchstaben liegt. Im Silbengipfel wird
das Mittelspatium, das Wahrnehmungszentrum der untersuchten Alphabetschrift, nicht
überschritten, in den Silbenrändern wird es sehr oft (aber nicht immer) überschritten. Es
handelt sich um eine binäre Alternation, die zur allgemeinen Diskretheit graphischer
Elemente gut passt. Aus dieser medialen Charakteristik ergibt sich die auf das Schriftsystem
bezogene binäre Klassifizierung in V- und C-Grapheme, wobei erstere die prominenten
Segmente sind.
5.2 Silbenstrukturelle Beschränkungen des deutschen Schriftsystems
Die Prominenzbeschränkung des Schriftsystems nimmt nicht direkt auf das Mittelspatium
Bezug, sondern auf die zwei Buchstaben- bzw. Graphemklassen. V-Grapheme belegen nur
das Mittelspatium, C-Grapheme sind nicht auf das Mittelspatium beschränkt, so dass die ein-
zige graphembezogene Generalisierung, die die graphetische Beschränkung (29) ausnahmslos
erfüllen kann, folgende ist:
31
(32) Silbengipfel-Beschränkung in der deutschen Schriftsprache: Jeder graphematische
Silbengipfel (jede V-Position) ist mit einem V-Graphem assoziiert. Formal:
V !<V> <V> - V-Graphem, ! - Gebot
Aus (32) und der Binarität der graphematischen Prominenzskala folgt: Kein graphematischer
Silbengipfel ist mit einem C-Graphem assoziiert. (32) erfüllt die allgemeine Gipfel-Be-
schränkung (3), die die Besetzung des V-Gipfels fordert, sowie die allgemeine Prominenzbe-
schränkung (5a), die das Verbot der Gipfelfüllung mit einem nicht-prominenten Segment
(hier C-Graphem) über das Verbot der Gipfelfüllung mit einem prominenten Segment (hier
V-Graphem) stellt.
Wo zeigt sich (32) als eigenständige graphematische Beschränkung am deutlichsten? Es
gibt Wörter wie Atem, Eden und edel, deren Normalaussprache einen Konsonanten im Gipfel
der Reduktionssilbe enthält. Trotzdem können wir sie nicht so schreiben, wie wir sie
sprechen, weil dann ein C-Buchstabe im Silbengipfel erschiene. Vgl. (33):
(33) Konsonant im Gipfel einerReduktionssilbe (vgl. auch (13)):
Nur V-Graphem im Silbengipfel:
[a:tm#][e:dn#][e:dl!]
*<atm>
*<edn>
*<edl>
<atem>
<eden>
<edel>
Ein C-Graphem im Silbengipfel könnte wie bei <edl> lang ausfallen, was schon der graphe-
tischen Gipfelbeschränkung (29) widerspräche. Vgl. die graphetische Analyse der zwei
Optionen für die Verschriftung der Reduktionssilbe von [e:dl !] in (34):
(34)
*
Onset Gipfel Onset Gipfel Koda
d l d e l
32
Eine weitere, zugegebenermaßen periphere Evidenz für die schriftsprachliche Eigenständig-
keit der Beschränkungen (29) und (32) sind phonologisch zweisilbige Formen, die standard-
sprachlich aus dem Bairischen entlehnt sind wie z. B. Dirndl oder Stubn. Sie werden zwei-
silbig ohne Schwa ausgesprochen und ohne <e> geschrieben. Die Absenz dieses zweiten V-
Graphems bedingt die graphematische Einsilbigkeit dieser Formen: sie dürfen am Zeilende
nicht getrennt werden.
Zusammenfassend kann man festhalten, dass die graphematische Prominenzbeschränkung
für Silbengipfel nie verletzt wird, und zwar auch dann nicht, wenn die Normalaussprache
eines Wortes eine Verletzung legitimieren würde.
Die schriftsprachliche Entsprechung der Prominenzbeschränkung für Silbenränder ist im
Deutschen folgende:
(35) Prominenzbeschränkung für Silbenränder in der deutschen Schriftsprache: Kein
graphematischer Silbenrand ist mit einem V-Graphem assoziiert. Formal:
CO/K
<V>
(35) ergibt sich von selbst aus der binären Prominenzskala, dem Alternationsgebot und der
Silbengipfelbeschränkung. Dass diese graphematische Beschränkung nicht aus der
Lautsprache abgeleitet werden kann, zeigt sich in Fällen, in denen phonologisch ein hoher
Vokal im Onset erscheinen kann, wie bei der zweisilbigen Aussprache von Nation, Ferien
oder graduell. Vgl. die phonologische Repräsentation in (21) oben, der (36) am ehesten
entspräche:
(36) <ω>|¯¯¯¯¯¯¯¯¯|σ σ
|¯¯¯| |¯¯¯¯|¯¯|O N O N K| /\ /\ /\ |C V C C C V C C| \/ | | \/ |
*<n a t i o n>
33
Aber nicht (36), sondern (37), wo alle V-Grapheme im Nukleus erscheinen, garantiert, dass
<nati-on> am Zeilenende getrennt werden darf.16
(37) <ω>|¯¯¯¯¯¯|¯¯¯¯¯¯¯|σ σ σ
|¯¯¯| |¯¯¯| |¯¯¯|O N O N N K| /\ | /\ /\ |C V C C V C V C C| \/ | \/ \/ |
<n a t i o n>
Formen mit <qu> im Onset wie <quelle> oder <quark> verletzen die Randbeschränkung
nicht, wenn man <qu> wie üblich als C-Graphem klassifiziert und außerdem annimmt, dass
die segmentalen Silbenstrukturbeschränkungen - wie hier geschehen - graphembezogen zu
formulieren sind. Verletzungen von (35) findet man nur bei einigen wenigen Fremdwörtern,
darunter einigen Eigennamen mit <i> im Onset, z. B. Ion, ionisch, Iokaste, Iolanthe, Iota, Iod,
Maia (röm. Göttin). Diese Formen unterliegen einer deutlich erkennbaren Eindeutschungs-
tendenz im Sinne der Beschränkung (35), wie bspw. Jota, Jod, Maja, Aja ("Erzieherin" von
ital. aia) demonstrieren.
Die Prominenzbeschränkungen für graphematische Silbengipfel und Silbenränder sind
Spezialfälle der modalitätsneutralen Beschränkungen (5a, b). Substanzspezifisch ist die
Prominenzskala, in der kurze V-Einheiten, die nur das Mittelspatium füllen, prominenter sind
als C-Einheiten, die in ihrer Länge variieren. Außerdem ist die Binarität dieser Skala
charakteristisch für unsere Alphabetschrift. Aufgrund dieser substanziellen Charakteristik ist
eine graphematische Entsprechung der lautsprachlichen Sonoritätssequenzbeschränkung (vgl.
(22) oben), die feinere Prominenzabstufungen zwischen den einzelnen Skelettpositionen
fordert, nicht nachzuweisen. Nicht nur die bisherigen Beobachtungen, sondern auch die Daten
in (38) weisen darauf hin:
(38) a. <schön>, <mai-sche>, <che-mie>, <ro-chen>
b. <ihm>, <rohr>
c. <saal>, <moor>, <fee>
16 Dass bei Familie die Worttrennung <famili-e> nicht vorgenommen wird, liegt daran, dass ein einzelnerBuchstabe am Zeilenende nicht mehr Platz in Anspruch nimmt als der Trennungsstrich und dass ein einzelnerBuchstabe mit Trennungsstrich mehr Platz benötigt als ohne.
34
In (38a) steigt die graphematische Prominenz (d. h. graphetische Kürze) wegen des
Buchstabens h zum Silbengipfel hin nicht stetig an. Unter der Annahme, dass
Prominenzbeschränkungen nicht auf die Buchstaben innerhalb eines Graphems greifen,
erweist sich diese Gruppe von Beispielen allerdings als nicht einschlägig. Die Beispiele in
(38b), in denen die graphematische Prominenz wegen des Buchstabens h vom Silbengipfel
weg nicht stetig abfällt, kann man jedoch nicht auf diese Weise wegerklären. Die Fälle in
(38c), für die angenommen wird (vgl. Primus 2000), dass der V-Dehnungsbuchstabe die
nukleare C-Position besetzt, zeigen, dass gar kein Prominenzabfall von der V-Position zur
nächsten C-Position stattfindet.
Eine weitere unterschiedliche Silbenstrukturerscheinung betrifft die oben eingeführten
Gelenkkonsonanten, die die deutsche Lautsprache charakterisieren. In der Graphematik sind
segmental überlappende Silbengrenzen nicht zu erwarten, und tatsächlich kommen
Silbengelenke hier nicht vor, worauf Peter Eisenberg in mehreren eingangs erwähnten
Arbeiten hingewiesen hat:
(39) Es gibt keine graphematischen Silbengelenke in der deutschen Schriftsprache.
(40) illustriert die diesbezüglichen Unterschiede zwischen der Laut- und Schriftsprache des
Deutschen:
(40) a. [ω] b. <ω>|¯¯¯¯¯¯¯| |¯¯¯¯¯¯¯|σ σ σ σ
|¯¯¯| |¯¯|¯¯| |¯¯¯| |¯¯|¯¯|O N O N K O N O N K| /\ | | | | /\ | | |C V C C V C C V C C V C| | \/ | | | | | | | |
[f a l ´ n] <f a l l e n>
Fremdwörter wie City oder Limit weisen eine phonologische Gelenkbildung auf, die in der
graphematischen Form nicht sichtbar markiert ist. Natürlich könnte man analog zur Phono-
logie auch in der Graphematik in solchen Fällen ein Silbengelenk ansetzen. Diese graphema-
tische Analyse wäre jedoch aufgrund der segmental distinkten Syllabierung <ci-ty> bzw. <li-
mit> unplausibel.
Eine weitere Beschränkung, die für den Unterschied in der Organisation der phonologi-
schen und graphematischen Silbe sehr aufschlussreich ist, betrifft die Syllabierung. Zunächst
35
sei vermerkt, dass weder in der Phonologie noch in der Graphematik die wortinternen Silben-
grenzen hörbar oder sichtbar gemacht werden müssen. In der Schriftsprache syllabiert man
graphisch sichtbar nur bei der Worttrennung am Zeilenende. Die einschlägige Syllabierungs-
beschränkung, die in der graphematischen Forschung und in normativen Orthographien in
empirisch äquivalenter Formulierung mehrheitlich angenommen wird, ist folgende:
(41) Syllabierungsbeschränkung: Bei internuklearen C-Graphemen beginnt der nächste
Onset mit dem letzten C-Graphem.
Dass die schriftbasierte Beschränkung graphembezogen formuliert werden muss, zeigt die
Nichttrennbarkeit der Grapheme <sch> und <ch> in rascheln und Rachen. Auch die kom-
plexen Fremdgrapheme <ph>, <th> oder <rh> wie in Graphem, Äther oder Myrrhe sind nicht
zerlegbar. Die lautbasierte Syllabierungsbeschränkung (vgl. (24) oben) sei hier kurz in
Erinnerung gerufen: Bei internuklearen Konsonanten beginnt der nächste Onset mit dem
letzten Sonoritätsminimum. Auch hier zeigen sich Gemeinsamkeiten und Unterschiede
zwischen Laut- und Schriftsprache sehr deutlich. Beide Beschränkungen führen zur Vermei-
dung von VC-Silben zugunsten von CV-Silben (zur so genannten Onsetmaximierung). Die
Unterschiede sind substanzbedingt und resultieren aus der graduellen Sonoritätsskala der
Lautsprache und der binären Prominenzskala der Schriftsprache.
Der Unterschied zwischen der phonologischen und graphematischen Syllabierung tritt
nicht in Erscheinung, wenn dem letzten bzw. einzigen internuklearen C-Graphem phono-
logisch das letzte internukleare Sonoritätsminimum entspricht. Vgl. (42):
Einschlägig für den Unterschied zwischen phonologischer und graphematischer Syllabierung
sind Fälle, in denen dem letzten internuklearen Sonoritätsminimum nicht das letzte inter-
nukleare C-Graphem entspricht, vgl. (43):
(43) [vi:$driç], [duN$kl´], [kem$pf´]
*<wi-drig>, *<dun-kle>, *<käm-pfe>
<wid-rig>, <dunk-le>, <kämp-fe>
36
Unterschiede ergeben sich auch aus der Existenz der oben besprochenen phonologischen
Silbengelenke. Eine phonologische Silbengrenze kann im Gegensatz zu einer
graphematischen Silbengrenze in einem Segment liegen (was hier einfachheitshalber linear
durch Unterstreichung notiert wird):
(44) [rat´], [kem´n], [siti], [limit]
<rat-te>, <käm-men>
<ci-ty>, <li-mit>
Die Domäne der Syllabierung ist eine Einheit, die gegebenenfalls kleiner ist als das syntak-
tische Wort. In der Phonologie ist der phonologische Wortbegriff (Abk. ω) relevant, wobei
Stämme, Präfixe und Suffixe mit anlautendem Konsonanten als phonologische Wörter zählen.
Die einschlägige Korrespondenzbeschränkung, die die lautsprachliche und graphematische
Syllabierungsbeschränkung dominiert, ist folgende:
(45) Jeder ω-Grenze entspricht eine Silbengrenze (aber nicht notwendigerweise auch um-
gekehrt).
Die folgenden Syllabierungen, die die graphematische Syllabierungsbeschränkung verletzen,
demonstrieren die Wirkung der Korrespondenzbeschränkung: <stand-ort>, <ab-ernten>, <an-
ekeln>.
Die graphematische Syllabierung wird nach Meinung vieler (vgl. Duden 1991, 1996) auch
bzw. in erster Linie durch die phonologische Syllabierungsbeschränkung bestimmt. Gemäß
dieser Auffassung fände bei der graphematischen Syllabierung eine Konkurrenz der Be-
schränkungen statt, die man mit den Methoden der Optimalitätstheorie (OT) genauer fassen
kann. Die OT geht von den folgenden Hypothesen aus (vgl. Prince/Smolensky 1993), die
auch in diesem Beitrag angenommen werden:
- Allgemeine (insbes. universelle) Beschränkungen sind verletzbar.
- Beschränkungen sind in einer sprachspezifischen Dominanzhierarchie geordnet.
- Was grammatisch bzw. korrekt oder akzeptabel ist oder nicht, wird aus der Menge aller
möglichen Kandidaten durch die Dominanzhierarchie der Beschränkungen determiniert.
Derjenige Kandidat gewinnt und ist somit grammatisch, der relativ zu den anderen Kandi-
daten die wenigsten Verletzungen hinsichtlich der dominantesten einschlägigen Beschrän-
kung aufweist. Dies erklärt, warum auch verletzbare Beschränkungen im Allgemeinen genau
37
einen grammatisch korrekten Output haben. Für die Etablierung des optimalen Kandidaten
wurde ein Überprüfungsverfahren entwickelt, das die möglichen Kandidaten in einem
Tableau in der ersten Spalte aufreiht und spaltenweise die einschlägigen Beschränkungen von
links nach rechts gemäß ihrer Dominanzhierarchie anwendet.
In den folgenden Tableaus werden einige relevante Kandidaten (Syllabierungen eines
Inputs ohne Silbengrenze) evaluiert. Dabei kommt gemäß der Hypothese der normativen
Orthographie zunächst die phonologische Beschränkung und erst dann die graphematische
zum Zuge. Der gemäß dieser Dominanzhierarchie optimale Kandidat wird wie üblich in der
OT mit dem Handsymbol angezeigt, ein Kandidat, der eine Beschränkung verletzt, erhält ein
Sternsymbol. Eine orthographische Normverletzung wird durch ein Doppelkreuz markiert.
Tableau 1
EVAL <aber>
phonologische Beschränkung
(24)
graphematische Beschränkung
(41)
1. #<ab-er> *! *
2. !<a-ber>
Der Kandidat <ab-er> unterliegt schon aufgrund der phonologischen Beschränkung einer
fatalen Verletzung (*!), die zu seiner sofortigen Elimination aus dem Wettbewerb führt. Eine
Verletzung ist für einen Kandidaten fatal genau dann, wenn es weitere Kandidaten im
Wettbewerb gibt, die weder eine höherrangige noch die betreffende Beschränkung verletzen.
Bei einer fatalen Verletzung ist es unerheblich, ob der betreffende Kandidat weitere weniger
dominante Beschränkungen verletzt (s. Schraffierung). Diese Evaluation illustriert den Fall, in
dem die graphematische und die phonologische Beschränkung nicht miteinander konkurrieren
(vgl. auch (42) oben). Erst die nächste Evaluation, bei der die beiden Beschränkungen
miteinander konkurrieren (vgl. auch (43) oben) demonstriert, dass die Dominanzannahme der
normativen Orthographien nicht stimmen kann, weil man inkonsistente Ergebnisse (!#)
erzielt:
Tableau 2
EVAL <widrig>
phonologische Beschränkung
(24)
graphematische Beschränkung
(41)
1. <wid-rig> *!
2. !#<wi-drig> *
38
Wenn die graphematische Beschränkung die phonologische dominiert, erhält man konsistente
Ergebnisse:
Tableau 3
EVAL <aber>
graphematische Beschränkung
(41)
phonologische Beschränkung
(24)
1. #<ab-er> *! *
2. !<a-ber>
Tableau 4
EVAL <widrig>
graphematische Beschränkung
(41)
phonologische Beschränkung
(24)
1. !<wid-rig> *
2. #<wi-drig> *!
Dieses Ergebnis schürt den Verdacht, dass die phonologische Syllabierung für die Graphe-
matik irrelevant ist (vgl. Günther 1992). Es könnte sich allerdings zeigen, dass die
phonologische Syllabierung in der Graphematik benötigt wird, wenn die graphematische
Syllabierungsbeschränkung nicht greift.17 Das sind Fälle, in denen eine V-Graphemfolge kein
dazwischen liegendes C-Graphem aufweist. In solchen Fällen ist die graphematische
Syllabierung mehrdeutig. Die folgende Zusammenstellung fasst graphematisch mehrdeutige
Fälle zusammen und liefert Belege für die verschiedenen Deutungsmöglichkeiten:
<ai> a. Mai, Sai-te
b. A-i-da, A-ï-da
<ei> a. rei-ten, berei-ten, nei-den
b. re-i-terieren, Nere-i-de, Ne-re-ï-de
<ie> a. Tier
b. Ti-er von engl. "Schicht, Ebene"
<eu> a. Heu, Eu-ro
b. de-us
<eie> a. rei-ern, fei-ern
b. kre-ieren
17 Es gibt auch den umgekehrten Fall, in welchem die phonologische Beschränkung nicht greift, vgl. z. B. <ru-he>, <wei-he>, weil in der Lautsprache keine internukleare Konsonanz vorliegt (vgl. jedoch Ossner 1996, 2001,der hier ein /h/ in der zugrunde liegenden phonologischen Repräsentation postuliert).
39
<oo> a. Zoo
b. zo-o in zootechnisch u. Ä.
<ee> a. scheel
b. re-ell
V-Buchstabenfolgen wie z. B. <ue> in Duell und <aue> in klauen und Frauen sind eindeutig,
weil <ue> keine Diphthonglesart hat. Eine Syllabierung mit einem zweifachen Hiat für <aue>
kommt ebenfalls nicht in Frage.
Man braucht für solche Fälle den Zugriff auf den Lexikoneintrag der entsprechenden Ein-
heiten. Denn auch die phonologische Silbentrennung ist in diesen Fällen nicht aus der ein-
schlägigen Beschränkung (24) ableitbar. Damit liefern diese Beispiele keinen Beweis, dass
ihre graphematische Silbentrennung einer regelgeleiteten phonologischen Syllabierung unter-
liegt. Mit Günther (1992) sollte man sich darüber hinaus die Frage stellen, ob es notwendiger-
weise die phonologische Teilkomponente der Lexikoneinträge ist, auf die beim graphemati-
schen Syllabieren zugegriffen wird. Dies setzt einen notwendig indirekten, über phonolo-
gisches Rekodieren vermittelten Lexikonzugriff voraus. Leseexperimente und Dyslexien
belegen jedoch, dass der indirekte Zugriff nicht immer stattfindet (vgl. Günther 1988, de
Bleser 1991). Aus diesem Grund sollte man Günthers Vorschlag folgen und annehmen, dass
die graphematische Lexikonkomponente die Syllabierungsinformation selbst liefert. Die Ver-
wendung des Tremas für die rein graphematische Lösung von Syllabierungsambiguitäten wie
in Aïda und Nereïde zeigt, dass dies ein plausibler Vorschlag ist.
Die bisher besprochene einfache Syllabierungsbeschränkung (41) wird durch zusätzliche
Normen ergänzt. So galt bis zur Neuregelung der deutschen Orthographie (vgl. Duden 1991)
ein Verbot der Abtrennung einzelner Buchstaben wie z. B. *<a-ber>, das aufgehoben wurde
(vgl. Duden 1996). Weiterhin bestand ein inzwischen aufgehobenes Verbot, die Graphem-
folge <st> wie in <has-ten> zu trennen. Dafür hat die Neuregelung die Untrennbarkeit der
Graphemfolge <ck> eingeführt, so dass *<bak-ken> nicht mehr normkonform ist. Auch für
Fremdwörter gelten Sonderregelungen. Man trennt in Fremdwörtern im Allgemeinen nicht
die Buchstabenfolgen, die einem Plosiv, nämlich [p, t, k, b, d, g], und einem Liquid, nämlich
[l, r], entsprechen, sowie <chth>, <gn> und <kn>. Dadurch ergaben sich bis zur Neuregelung
als einzige Trennmöglichkeiten <ta-blett>, <hy-drant>, <ere-chtheion> und <ma-gnet>. Die
Neuregelung wandelte dieses strikte Verbot in ein verletzbares um, womit sich eine zweite
Trennungsmöglichkeit nach der graphematischen Syllabierungsbeschränkung (41) ergibt,
nämlich <tab-lett>, <hyd-rant>, <erech-theion> und <mag-net>.
40
In den bisherigen Betrachtungen zur Schreibsilbe wurde die nukleare C-Skelettposition
der graphematischen Vollsilbe vernachlässigt. Wie bereits erwähnt, gibt es in der deutschen
Lautsprache Evidenz, dass diese Position in Vollsilben einer erweiterten Nukleuskonstituente
zuzuschlagen ist. Der besondere Status dieser Skelettposition zeigt sich auch in der Graphe-
matik, allerdings in einer genuin graphematischen, von der Lautsprache unabhängigen Art
und Weise. Es ist die einzige Position, in der sowohl V- als auch C-Grapheme vorkommen,
wie z. B. die Minimalpaare <maat> - <matt>, <saat> - <satt> und <stiel> - <still> demonstrie-
ren. Außerdem gilt für sie folgende Komplexitätsbeschränkung:
(46) *Komplex-CN: In der nuklearen C-Position der Schreibsilbe ist ein komplexes
Graphem ausgeschlossen.
Komplexe Grapheme sind nicht nur <sch> oder <ch> wie in waschen oder lachen, sondern
auch Buchstaben mit Trema wie <ä> oder <ü>. Dass Buchstaben mit Trema ein komplexes
Graphem bilden, wird unten näher begründet. Aus (46) und der Annahme, dass das erste
Element einer C-Geminate, ein V-Dehnungsbuchstabe und der zweite Bestandteil eines
Diphthongs in der nuklearen C-Position platziert sind (vgl. Primus 2000), ergeben sich fol-
gende Spezialverbote für die nukleare C-Position sowie eine einheitliche Funktion des
Tremas von selbst:
i) V-Buchstaben mit Trema werden nicht verdoppelt;
ii) Der Umlautdiphthong wird <äu> statt *<aü> verschriftet;
iii) Das Trema kennzeichnet die nukleare V-Position;
iv) Komplexe Grapheme werden nicht geminiert;
Als erstes verbietet die Komplexitätsbeschränkung Geminata bzw. Dehnungsbuchstaben mit
Trema wie in *Sääle, *Häärchen oder *Böötchen.
Der zweite Spezialfall zeigt sich bei der Schreibung der Diphthonge. Die Lautsprache des
Deutschen verfügt über die drei Diphthonge /au/, /ai/ und /ay/, vgl. lauten, leiten und läuten.
Alternative oberflächenorientierte Notationen sind [ao], [ae] und [oy] oder [oø].18 Die
Variation bei der phonetischen Transkription der Diphthonge deckt schon ein erstes
phonologisches Problem auf. Die Aussprache des zweiten Bestandteils erreicht nicht das vom
Sprecher intendierte artikulatorische Ziel (vgl. Vennemann 1982: 275, Wiese 2000: 159), ein
18 In den Interjektionen hui und pfui kommt auch der Diphthong [ui] vor, den ich aber im Folgenden ver-nachlässige, weil seine Schreibung aus der phonologischen Form direkt ableitbar ist. Außerdem befolgt seinzweiter Bestandteil die einschlägigen Beschränkungen (46) und (50).
41
für Diphthonge typisches Merkmal. Phonologisch ist jedoch davon auszugehen, dass die drei
Diphthonge den Höhenkontrast maximal ausschöpfen, vgl. folgendes Schema:
(47) VN CN | |
u a i
y [+tief] [+hoch] [-hoch] [-tief]
Die C-Position wird in einer linearen (d. h. nicht-strukturellen) Notation mittels eines diakri-
tischen Zeichens angegeben wie z. B. in [au$] oder [ai8]. Da die Korrespondenz zwischen
Lautsprache und Graphematik in der Regel durch zugrunde liegende phonologische Formen
determiniert ist (vgl. z. B. Prinz/Wiese 1990), sind oberflächenphonologische
Diphthongvarianten für die Verschriftung irrelevant.
Die Schreibung der lautsprachlichen Diphthonge ist innergraphematisch betrachtet sehr
systematisch (vgl. Eisenberg 1995: 66), was hier in der Distributionsbeschränkung (48)
zusammengefasst wird:
(48) VN CN | |<e> <i><a> <u><ä>
Alle vier möglichen Kombinationen mit <a> und <e>, nämlich <ei>, <eu>, <ai> und <au>,
werden ausgenützt und sonst gar keine (vgl. leiten, Leute, Saite, Seite und lauten). Der
Diphthongbestandteil <ä> ist morphologisch-paradigmatisch bedingt und lässt sich nur mit
<u> kombinieren, vgl. läuten (wegen laut und lauten).
Der Schreibdiphthong <äu> ist hier von besonderem Interesse. Die Behandlung des
Diphthongs /ay/ weicht von älteren Auffassungen ab und richtet sich nach Wiese (2000:
159f.). Hinsichtlich des ersten Bestandteils liefert Wiese mehrere Argumente für zugrunde
liegendes /a/ und gegen die traditionellere Annahme von [o]. Die Folge [oy] würde zwei
runde Vokale im Nukleus zusammenfügen, eine Vokalfolge, die es im Deutschen generell
nicht gibt, d. h. auch im morpheminternen Hiat nicht (vgl. jedoch Duo und Myom sowie zoo-
in zootechnisch). Der zweite Bestandteil ist hier bedeutsamer. Wie schon Kloeke (1982: 17)
42
mit unabhängigen Argumenten belegt, kann die Umlautung (vgl. Baum - Bäume) nur den
zweiten Bestandteil betreffen, also [u] zu [y]. Die Umlautung von [a] ergibt nämlich nicht [o],
sondern [e], vgl. ich falle - du fällst. Aufgrund dieser Umlautbeschränkung müsste der
Diphthong als <aü> verschriftet werden. Entgegen der lautsprachlichen Vorgabe und gemäß
der Komplexitätsbeschränkung für die nukleare C-Position wird graphematisch nur der erste
Bestandteil umgelautet <äu> (vgl. auch <eu>). Übrigens belegt auch dieser Fall, was wir
schon von der Syllabierung wissen: phonologisch basierte Korrespondenzbeschränkungen
können innergraphematischen Beschränkungen im Wettbewerb unterliegen.
Die eingehendere Besprechung der Diphthonge lohnt sich, weil sie für eine weitere
Beschränkung der nuklearen C-Position einschlägig ist. Zunächst muss festgehalten werden,
dass die Klasse der Schreibdiphthonge größer ist, als die Korrespondenz zur Lautsprache
vorgibt. Die allgemeinste Auffassung ergibt sich aus der Definition (49):
(49) Ein Schreibdiphthong besteht aus zwei V-Graphemen im Nukleus derselben Silbe,
wobei das erste Graphem die V-Position und das zweite V-Graphem die C-Position
einnimmt.
Diese Definition ergibt im Deutschen 9 Schreibdiphthonge, wobei Eigennamen und