Lernmodul 1 Linguistisches Propädeutikum Institut für Computerlinguistik Universität Zürich http://www.cl.uzh.ch Simon Clematide [email protected]Version von 28. März 2007 1 PDF-Version: http://www.cl.uzh.ch/siclemat/lehre/ling-prop/script/script.pdf HTML-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/script/html/script.html Folien-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/slides-4up.pdf
17
Embed
1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide [email protected] Institut für Computerlinguistik Universität Zürich
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
I Kenntnis der Begriffe Wort, Token, Lexem, Lemma, LexemverbandI Kenntnis der Wortartenlehre für DeutschI Kenntnis der morphologischen Kategorien für Deutsch und EnglischI Kenntnis und Anwendung des Stuttgart-Tübingen-Tagsets (STTS) mit
Hilfe der ReferenzkarteI Erfahrungen mit computerlinguistisch unterstützter, halbautomatischer
linguistischer Annotation von Morphologie und Wortarten
Definition (nach [Bußmann 1990])Wort. Intuitiv vorgegebener und umgangssprachlich verwendeter Begriff fürsprachliche Grundeinheiten, dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind.
Beispiel (Was ist ein Wort?)
1. Sie wollte vor allem am 1. Spiel teilnehmen.2. Sie nahm z.B. an dem 2. Spiel teil.3. Das gibts doch nicht!4. Blick Online verlost zum Film-Start das «Ich bin Borat»-Kit [. . . ]
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt6 eine4 Fliege5 Fliegen3
nach7.
Definition (Syntaktisches Wort)Ein syntaktisches Wort ergibt sich aus einer Wortform kombiniert mit ihrenmorphosyntaktischen Merkmalen.Rein orthographische Varianten einer Wortform werden für ein syntaktischesWort normalerweise zusammengefasst.
Beispiel (Wortform vs. syntaktisches Wort)Die Wortform “Fliegen” kann mindestens 4 syntaktische Wörterrepräsentieren: “Fliege” in Nominativ, Akkusativ, Dativ oder Genitiv Plural.
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5, fliegt5 eine4 Fliege3 Fliegen3
nach6.
Definition (Lexem im engen Sinn)Ein Lexem ist eine Menge (Paradigma) von syntaktischen Wörtern, welchesich nur in bestimmten morphosyntaktischen Merkmalen (Kasus, Numerus,Tempus usw.) unterscheiden.
Definition (Nennform, Zitierform, Grundform, Lemma)Ein Lemma ist eine lexikographische Standard-Notation für ein Lexem.
Beispiel (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im NominativSingular repräsentiert. Verb-Lexeme durch den Infinitiv. Wie werdenVerb-Lexeme im Latein notiert?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 10 / 28
Wort Wortarten Morphologische Merkmale STTS 5 Hauptwortarten nach Glinz
Wortarten nach [Bußmann 1990]
Definition (Redeteile, engl. parts of speech (PoS))Wortarten sind das Ergebnis der Klassifizierung der Wörter einer Sprachenach morphologischen, syntaktischen und/oder semantischen Kriterien.
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca. 100 vor Chr.) wirkte starkbis ins 19. Jahrhundert. Für Deutsch wurde in den Schulen lange dietraditionelle 10-Wortarten-Lehre (Numerale als eigene Kategorie) gemässAdelung (1781) vermittelt. Mit der 5-Wortarten-Lehre nach Hans Glinzsetzte sich ab den 50er-Jahren eine flachere Einteilung durch, welcheexplizite (operationalisierbare) und durchgängige Klassifikationskriterienanwendet.
Wort Wortarten Morphologische Merkmale STTS 5 Hauptwortarten nach Glinz
Klassifikationskriterien
Abbildung: Die 5 Hauptwortarten nach Glinz [Stocker et al. 2004]
Welcher Fachbegriff wäre präziser anstelle von “Wörter” in der Abbildung?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 13 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Morphologische Kategorien und ihre Merkmale
Definition (auch morphosyntaktisches oder grammatisches Merkmal)Die morphologischen Merkmale sind Ausprägungen von morphologischenKategorien wie Genus, Kasus, Numerus, Person, Tempus, Modus undKomparation, welche durch die Flexion realisiert werden.
Flexion: Bildung von den unterschiedlichen syntaktischen Wortformeneines Lexems
I Konjugation von VerbenI Deklination von Nomen, Adjektiven, Artikeln und PronomenI Steigerung von Adjektiven
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Der Kasus (engl. case): Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
BemerkungDer Plural von Kasus lautet Kasus.
Beispiel (Bei welchen Wortarten ist die Kategorie Kasus ausgeprägt?)
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Der Modus (engl. mode, mood): Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Möglichkeitsform subjunctive mood Konj er gehe
BemerkungenDer Plural von Modus lautet Modi.Die Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst.Im STTS ist dies durch das V.IMP ausgedrückt.
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Die Person (engl. person)
Fachbegriff Deutsch Englisch STTS Beispiel1. Person Sprecher first person 1 ich gehe2. Person Angesprochene second person 2 du gehst3. Person Person, Sachverhalt third person 3 er geht
BemerkungenDer Plural von Person lautet Personen; die Verwendung ist allerdingsungebräuchlich.
Beispiel (Bei welchen Wortarten ist die Kategorie Person ausgeprägt?)
I ‘Wortarten’ für satzinterne und -finale InterpunktionI Kategorie für fremdsprachliches Material (FM)I Feine Aufgliederung bei PartikelnI Durchgängige Unterscheidung von attribuierend vs. substituierend bei
PronomenI Eigennamen sind eine semantisch definierte Klasse.I Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven
I Referenzkarte zu STTS und dem NEGRA-SprachmodellI Manuals für das Programm annotate [Plaehn 2000, Plaehn 1998]I http://www.canoo.net aus Basel hat eine sorgfältige linguistische
Terminologie im Web und viel (!) Anschauungsmaterial aus ihremMorphologiesystem.
PflichtlektüreNachschlagen von mindestens 30 Tags im Annotationshandbuch[Schiller et al. 1999] bei Unsicherheit im Annotieren von Wortart undmorphologischer Kategorie
I Bußmann, Hadumod (1990).Lexikon der Sprachwissenschaft. Kröner, Stuttgart, 2., völlig neu bearbeiteteAufl.
I EAGLES (1996).ELM-DE: EAGLES Specifications for German morphosyntax: LexiconSpecification and Classification Guidelines, electronic,http://www.ilc.cnr.it/EAGLES96/pub/eagles/lexicons/elm_de.ps.gz,http:/www.cl.uzh.ch/siclemat/lehre/papers/EAGLES1996.pdf Arbeitsmaterial.
I Gallmann, Peter und H. Sitta (2001).Deutsche Grammatik. Lehrmittelverlag, 3. Aufl., Konzis und verständlich.
I Linke, Angelika et al., Hrsg. (2001).Studienbuch Linguistik. Niemeyer, Mit interaktivem Lernprogramm aufCD-ROM.
I Plaehn, Oliver (1998).ANNOTATE: Bedienungsanleitung ,http:/www.cl.uzh.ch/siclemat/lehre/papers/Plaehn1998a.pdf Arbeitsmaterial.
I Plaehn, Oliver (2000).ANNOTATE v3.6 – Quick Reference,http:/www.cl.uzh.ch/siclemat/lehre/papers/Plaehn2000.txt Arbeitsmaterial.
I Schiller, Anne, S. Teufel und C. Stöckert (1999).Guidelines für das Tagging deutscher Textcorpora mit STTS (Kleines undgroßes Tagset), http://www.ims.uni-stuttgart.de/projekte/corp-lex/TagSets/stts-1999.pdf.
I Steiner, Petra (2003).Das revidierte Münsteraner Tagset / Deutsch (MT/D). Beschreibung,Anwendung, Beispiele und Problemfälle,http://santana.uni-muenster.de/Publications/tagbeschr_final.ps.
I Stocker, Christa, D. Macher, R. Studler, N. Bubenhofer,D. Crevlin, R. Liniger und M. Volk (2004).Studien-CD Linguistik: Multimediale Einführungen und interaktive Übungen zurgermanistischen Sprachwissenschaft, Max Niemeyer Verlag,http://www.ds.unizh.ch/studien-cd.
Definition (Linguistische Proben)Eine linguistische Probe ist ein experimentelles Analyseverfahren derstrukturellen Linguistik, das gezielt die sprachliche Kompetenz benutzt, umgrammatische Aussagen verifizieren (bestätigen) oder falsifizieren(verwerfen) zu können.
DefinitionIn der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durcheinen grammatisch eindeutig zu interpretierenden Ausdruck ersetzt. DieInterpretation des Satzrestes muss dabei unverändert bleiben.
Beispiel (Bestimmung des Kasus)Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Ersatzprobe für PronomenManchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeitschaffen.Beispiel (Bestimmung der Wortart von “das”)
I Das ist das Angebot, das uns überzeugt hat.I Dieses ist das Angebot, welches uns überzeugt hat.I * Welches ist das Angebot, dieses uns überzeugt hat.I ? Das ist dieses Angebot, welches uns überzeugt hat.
Probleme der InterpretationI Test bestanden vs. nicht bestanden ist manchmal abhängig von der
ursprünglichen Interpretation des Satzes.I Ob die Interpretation des Satzrestes sich ändert durch den Ersatz, ist
nicht immer leicht zu beurteilen.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 6 / 29
DefinitionIn der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontexteingesetzt, der ihn grammatisch eindeutig interpretiert.
Beispiel (Bestimmung der Wortart)Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis *Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmaswie Konjugation für Verben oder Steigerung für Adjektive.
DefinitionIn der Weglassprobe wird von einem grösseren mehrdeutigen Ausdrucksoviel Material wie möglich entfernt, um einen eindeutigen Ausdruck zuerhalten.
Beispiel (Bestimmung eines Satzglieds)1. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
2. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
3. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
4. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
FrageWarum nicht Variante 4?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 8 / 299
DefinitionIn der Verschiebeprobe werden Wörter und Wortgruppen im Satzumgestellt, so dass der Satz grammatisch bleibt und sich am Inhalthöchstens die Gewichtung ändert.Damit lassen sich die Anfang und Ende von Satzgliedern erkennen.
Beispiel (Bestimmung von Satzgliedern)1. Die Sitzung mit dem Chef bereite ich morgen vor.2. Morgen bereite ich die Sitzung mit dem Chef vor.
3. Ich bereite die Sitzung mit dem Chef morgen vor.
Regeln: Tausche immer 2 Kandidaten aus, um nicht unnötigungrammatische (Pseudo-)Sätze zu erzeugen. Ersetze in einfachen Sätzenimmer das Satzglied vor dem flektierten Verb.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 9 / 29
Definition (nach [Bußmann 1990])Satz (engl. clause oder sentence). Nach sprachspezifischen Regeln auskleineren Einheiten (sog. Konstituenten) konstruierte Redeeinheit, diehinsichtlich Inhalt, grammatischer Struktur und Intonation relativvollständig und unabhängig ist.
Definition (nach [Dudenredaktion 2005])Ein Satz ist eine Einheit, die aus einem finiten Verb und allen vom Verbverlangten Satzgliedern besteht. Darüber hinaus kann der Satz zusätzlicheAngaben enthalten.
Definition (nach [Bußmann 1990])Konstituente. In der strukturellen Satzanalyse (sog. Konstituentenanalyse)Bezeichnung für jede sprachliche Einheit (Wort, Wortgruppe) , die Teileiner grösseren sprachlichen Einheit ist.
Definition (nach [Bußmann 1990])Ziel und Ergebnis der Konstituentenanalyse ist die Zerlegung einessprachlichen Ausdrucks in eine hierarchische definierte Abfolge.
Definition (Konstituenz)Konstituenz ergibt sich aus der unmittelbaren Dominanz und linearenPräzedenz zwischen Konstituenten.
DefinitionEin Kopf oder Kern einer Konstituente ist diejenige Unterkonstituente,welche die grammatischen Eigenschaften ihrer Mutterkonstituente bestimmtund von der die Geschwisterkonstituenten abhängig sind. Der Kern istnormalerweise nicht weglassbar (Weglassprobe).
Beispiel (Welches ist der Kern der geklammerten Konstituenten?)I Er [hält ihm den Ausweis unter die geschwollene Nase].I Sie rennt [mit dem Mobile hantierend] zum Kiosk.I Es wird [viel zu oft] telefoniert.I [Die Frau, die zum Kiosk rannte, ] war aufgeregt.I Sie fühlte sich [wie in einem schlechten Film].I Aber sie war auch [in einem ziemlich schlechten Film].
1. Verbalgruppe, -phrase (VP): Konstituente mit einem verbalen Kern. InNEGRA umfasst VP nur infinite, d.h. nicht-flektierte Kerne. DieKategorie Satz (S) hat finite Verbalkerne.
2. Nominalgruppe, -phrase (NP): Konstituente mit Nomen oderPronomen als Kern.
3. Adjektivgruppe, -phrase (AP): Konstituente mit Adjektiv oderadjektivisch verwendetem Partizip als Kern.
4. Adverbgruppe, -phrase (AVP): Konstituente mit Adverb als Kern.5. Präpositionalgruppe, -phrase (PP): Konstituente mit Präposition oder
Postposition als Kern.6. Konjunktionalgruppe, -phrase: Konstituente mit der Konjunktion “als”
oder “wie” als Kern. In NEGRA ebenfalls mit PP bezeichnet.
DefinitionKoordination (Beiordnung) ist eine syntaktische Struktur, welche aus zweioder mehr Konjunkten (Wörter, Wortgruppen oder Sätzen) besteht.
Beispiel (Koordination von Konstituenten aus NEGRA-Korpus)I Selbst die flotteren Passagen werden nie ausgelassen und fröhlich. [Satz 35]I Oder saß es wieder einmal immer nur mit der Teeflasche im Auto und in der
Sportkarre? [Satz 9328]I Wenn es eine Organisation gibt, der vertraut wird und die etwas erreichen kann, ist
das die Kirche. [Satz 11’978]
ProblemWas ist der Kopf?Keine Entscheidung in NEGRA, denn es gibt die Konstituenten CS, CNP,CAP usw.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 17 / 29
DefinitionDependenz ist die syntaktische Relation der Abhängigkeit zwischenKonstituenten.
Definition (nach [Bußmann 1990])Syntaktische Funktion ist ein Sammelbegriff für Beschreibungsgrössen wie“Subjekt”, “Objekt”, “Prädikat”, “Adverbial”, “Attribut” u.a., welche nachSprachtyp oder Grammatiktheorie unterschiedlich verwendet werden, um dieBeziehung zwischen abhängigen Konstituenten zu bestimmen.
HinweisTraditionelle Ansätze blenden gerne die syntaktische Funktion des “Kerns”sowie der koordinativen Verknüpfungen aus.
I Artikel, attributive Adjektiv(phrasen), begleitende Pronomen (NK)I Präpositionen und konjunktionales “als” oder “wie” (AC)I Genitivattribute von Nominalphrasen (AG) oder feinere
Unterscheidung: pränominaler (GL) oder postnominaler (GR) GenitivI Koordinierende Konjunktion (CD) und die koordinierten Konstituenten
(CJ)I Platzhalter (PH) und wiederholte Elemente (RE)
I Das erste grosse (20’000 Sätze) Baumbank-Projekt für Deutsch(1997-2001): http://www.coli.uni-saarland.de/projects/sfb378/negra-corpus/negra-corpus.html
I PP und NP werden mit flacher Hierarchie verbautI Ketten von infiniten Verben (VP) sind zu verschachtelnI Syntaktische Phrasenknoten werden nur für Wortgruppen gebildet, nie
für EinzelwörterI Keine annotierten Köpfe in NPI Keine explizite Unterscheidung der SatztypenI Annotationshandbuch [Brants et al. 1999] mit detaillierten RegelnI Die TIGER-Baumbank (TIGER-Korpus) (50’000 Sätze im 2006) ist
I Brants, Thorsten, R. Hendriks, S. Kramp, B. Krenn, C. Preis,W. Skut und H. Uszkoreit (1999).NEGRA Annotierschema, unpublished,http:/www.cl.uzh.ch/siclemat/lehre/papers/BrantsHendriks1999.pdfArbeitsmaterial.
I Bußmann, Hadumod (1990).Lexikon der Sprachwissenschaft. Kröner, Stuttgart, 2., völlig neu bearbeiteteAufl.
I Carstensen, Kai-Uwe, C. Ebert, C. Endriss, S. Jekat,R. Klabunde und H. Langer, Hrsg. (2004).Computerlinguistik und Sprachtechnologie : Eine Einführung . Elsevier,München, http://www.ifi.unizh.ch/CL/CLBuch/.
I Dudenredaktion, Hrsg. (2005).Duden, die Grammatik: unentbehrlich für richtiges Deutsch, Bd. 4 d. Reihe DerDuden. Dudenverlag, 7. Aufl.
I Stocker, Christa, D. Macher, R. Studler, N. Bubenhofer,D. Crevlin, R. Liniger und M. Volk (2004).Studien-CD Linguistik: Multimediale Einführungen und interaktive Übungen zurgermanistischen Sprachwissenschaft, Max Niemeyer Verlag,http://www.ds.unizh.ch/studien-cd.