Top Banner
Einf¨ uhrung in die Computerlinguistik Semantik Hinrich Sch¨ utze Center for Information and Language Processing 2018-11-19 Intro Lexikalische Semantik Text¨ ahnlichkeit Logik Zeit&Aspekt Kompositionalit¨ at Referenz Sch¨ utze: Semantik 1 / 90
102

Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Apr 12, 2019

Download

Documents

trinhtram
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Einfuhrung in die ComputerlinguistikSemantik

Hinrich Schutze

Center for Information and Language Processing

2018-11-19

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 1 / 90

Page 2: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Die Grundfassung dieses Foliensatzes wurde von Dr. AnnemarieFriedrich (unter Zuhilfenahme von Materialien von Prof. ManfredPinkal und Prof. Vera Demberg) erstellt. Fehler und Mangel sindausschließlich meine Verantwortung.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 2 / 90

Page 3: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 3 / 90

Page 4: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 4 / 90

Page 5: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Der Begriff “Semantik”

griechisch semantikos = bezeichnend, zu: semaınein =bezeichnen

griechisch sema = Zeichen, Merkmal

wortlich:Lehre von der Bedeutung

(der Sprache)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 5 / 90

Page 6: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt
Page 7: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Kaffee machen

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 7 / 90

Page 8: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Motivation

Machen Sie mirbitte

eine Tasse Kaffee!

Sprache/Text

VerarbeitungDarstellung

⇒Aktion

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 8 / 90

Page 9: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Motivation

Machen Sie mirbitte

eine Tasse Kaffee!

Sprache/Text

VerarbeitungDarstellung

⇒Aktion

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 9 / 90

Page 10: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Motivation

Machen Sie mirbitte

eine Tasse Kaffee!

Sprache/Text

VerarbeitungDarstellung

⇒Aktion

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 9 / 90

Page 11: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Motivation

Machen Sie mirbitte

eine Tasse Kaffee!

Sprache/Text

VerarbeitungDarstellung

⇒Aktion

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 9 / 90

Page 12: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Motivation

Machen Sie mirbitte

eine Tasse Kaffee!

Sprache/Text

VerarbeitungDarstellung

⇒Aktion

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 9 / 90

Page 13: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Verarbeitung/Darstellung,um Aktion einleiten zu konnen:Wie?

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 10 / 90

Page 14: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Konstituenten-Baum?

S

NP–SB VVFIN NP–SB NN–OA

NE

Tina

kocht ART NN

eine Tasse

Kaffee

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 11 / 90

Page 15: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Dependenz-Baum?

kocht

Tina Tasse Kaffee

ROOT

eine

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 12 / 90

Page 16: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Konstituenz/Dependenz:nur Syntax.Wir brauchen auch Semantik.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 13 / 90

Page 17: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantikreprasentation: WordNet

WordNet

Noun (46){07945759} ¡noun.food¿[13] S: (n) coffee#1(coffee%1:13:00::), java#2 (java%1:13:00::) (a beverageconsisting of an infusion of ground coffee beans) “he ordered a cupof coffee”

https://wordnet.princeton.edu/

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 14 / 90

Page 18: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantikreprasentation: Semantische Rollen

PropBank

agree.01Arg0: AgreerArg1: PropositionEx: [Arg0 The goup] agreed [Arg1 it wouldn’t make an offer . . . ]

Palmer, M., Gildea, D., & Kingsbury, P. (2005). Theproposition bank: An annotated corpus of semantic roles.Computational linguistics, 31(1), 71-106.http://propbank.github.io

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 15 / 90

Page 19: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantikreprasentation: FrameNet

Cooking creation

This frame describes food and meal preparation. A Cook creates aProduced food from (raw) Ingredients. The Heating Instrumentand/or the Container may also be specified. Caitlin baked somecookies from the pre-packaged dough.

https://framenet.icsi.berkeley.edu/fndrupal

http://demo.ark.cs.cmu.edu/parse

Page 20: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantikreprasentation: Abstract MeaningRepresentations (AMR)

“Can you please make me a mug of coffee?”

(m / make-01 :polite + :mode imperative

:ARG0 (y / you)

:ARG1 (c / coffee

:quant (v / volume-quantity :quant 1

:unit (m / mug)))

:ARG3 (i / i))

http://amr.isi.edu

Example: Thanks to Tim O’Gorman.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 17 / 90

Page 21: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anforderung an Semantikreprasentationen

Verifizierbarkeit

Es muss moglich sein, eine Aussage mit einem Zustand der Weltzu verbinden, sodass wir testen konnen, ob ein Satz wahr ist.

“Das Flugzeug hat einen Propeller.”⇓

Reprasentation: part-of(Propeller, Flugzeug))

⇓Kommt dies in der Wissensbasis (knowledge base) vor?

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 18 / 90

Page 22: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anforderung an Semantikreprasentationen

Eindeutigkeit = Nicht ambig

Sprache ist ambig, aber wir wollen eine eindeutigeSemantikreprasentation.

“Hans sah den Mann mit der Lupe.”

Zum Beispiel hier nur: halt(Mann,Lupe)

und nicht: halt(Hans, Lupe)Entscheidung welche Reprasentation (automatisch) gewahlt wird: schwer

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 19 / 90

Page 23: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anforderung an Semantikreprasentationen

Kanonische Form

Alle Satze, die das Gleiche bedeuten, sollen gleich reprasentiertwerden.

“Gibt es im Restaurant Almaz vegane Speisen?”“Bietet Almaz auch veganes Essen an?”“Kann man bei Almaz vegan essen?”⇒ Egal, wie die Frage gestellt wird, wir wollen eine Reprasentationfur unsere Datenbankabfrage.Zum Beispiel: BietetAn(Almaz,VeganesEssen) → true/false?Paraphrasen erkennen

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 20 / 90

Page 24: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anforderung an Semantikreprasentationen

Inferenzen

Alle Dackel sind Hunde.Alle Hunde mogen Wurst.Fiffi ist ein Dackel.⇒ Fiffi mag Wurst. wahr oder falsch?

Wir wollen nicht nur das direkt gesagte reprasentieren, sondernauch neue Aussagen / neues Wissen davon ableiten.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 21 / 90

Page 25: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anforderung an Semantikreprasentationen

Question Answering

Wer hat Dracula geschrieben?Antwort: Bram Stoker

https://www.youtube.com/watch?v=P18EdAKuC1U

START-System: http://start.csail.mit.edu/index.php

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 22 / 90

Page 26: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 23 / 90

Page 27: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Wort-Bedeutungs-Relation

Beispiel

Wort: Bank

Konzepte:

Homonym = ein Wort, steht fur verschiedeneBegriffe/Konzepte

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 24 / 90

Page 28: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word-Bedeutungs-Relation

Weitere Relationen zwischen Konzepten (6= zwischen Wortern)

(1) Synonymie: zwei Begriffe bedeutendasselbe

(2) Hypernymie: ein Begriff ist einUberbegriff eines anderen

(3) Hyponymie: ein Begriff ist einUnterbegriff eines anderen

(4) Homophonie: zwei Begriffe klingen gleich,werden aber unterschiedlich geschrieben

(5) Meronymie: ein Begriff verweist auf einTeil eines anderen Begriffs

(6) Holonymie: ein Begriff verweist auf einGanzes, von dem der andere Begriff einTeil ist

(a) Dach, Haus

(b) Hand, Finger

(c) Mensch,Lebewesen

(d) Leere, Lehre

(e) Geige, Violine

(f) Kuchen, Mar-morkuchen

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 25 / 90

Page 29: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

WordNet

Eine große lexikalisch-semantische Ressource

Netzwerk aus semantischen Relationen zwischen Konzepten;Hyponymie-Relation als Kern

Konzepte werden als Synsets reprasentiert: Mengen vonsynonymen Wortern, die sich gegenseitig disambiguieren

Umschreibungen (glosses) fur alle Synsets +Anwendungsbeispiele

Synsets fur car.noun

S: (n) car, auto, automobile, machine, motorcar (a motorvehicle with four wheels; usually propelled by an internalcombustion engine), he needs a car to get to work

S: (n) car, railcar, railway car, railroad car (a wheeled vehicleadapted to the rails of railroad), three cars had jumped therails

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 26 / 90

Page 30: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

WordNet

WordNet: 170.000 lexikalische Eintrage (Worter) / 120.000Synsets

WordNet-Versionen gibt es fur etwa 45 Sprachen

WordNet wird in vielen sprach- undinformationstechnologischen Anwendungen erfolgreichgenutzt, insbesondere als Grundlage von Inferenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 27 / 90

Page 31: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

https://wordnet.princeton.edu

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 28 / 90

Page 32: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation (WSD)

Wortbedeutung im Kontext

Schwester Maria sprach ein Gebet.Meine Schwester argert oft meinen kleinen Bruder.Woher weiß ich, welche “Schwester” gemeint ist?

Methoden in der Computerlinguistik fur WSD

Statistische Modellierung

Annotation aller Zielwort-Instanzen im Trainingskorpus miteiner Wortbedeutung

Annotationsschema: Wortbedeutungen aus einem Worterbuch/ Thesaurus (Standard: WordNet-Synsets)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 29 / 90

Page 33: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Trainingskorpus

Bank #1: Bank #2:

(1) Fur diejenigen, denen Komfort wichtig ist, haben wir eineBank mit leicht schwingender Ruckenlehne entwickelt. . . .

(2) . . . Ich suche noch eine Bank fur meinen Garten und sondieredeshalb gerade Angebote. . . .

(3) . . . Habe im Marz 2000 einen hoheren Betrag bei einer Bankangelegt. . . .

(4) . . . Beim Test Anlageberatung der Banken loste kein Institutdie einfache Frage nach einer sicheren Anlage wirklich gut. . . .

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 30 / 90

Page 34: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Trainingskorpus

Bank #1: Bank #2:

(1) Fur diejenigen, denen Komfort wichtig ist, haben wir eineBank [bank1] mit leicht schwingender Ruckenlehne entwickelt.. . .

(2) . . . Ich suche noch eine Bank [bank1] fur meinen Garten undsondiere deshalb gerade Angebote. . . .

(3) . . . Habe im Marz 2000 einen hoheren Betrag bei einer Bank[bank2] angelegt. . . .

(4) . . . Beim Test Anlageberatung der Banken [bank2] loste keinInstitut die einfache Frage nach einer sicheren Anlage wirklichgut. . . .

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 31 / 90

Page 35: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Merkmalsspezifikation

Kontext: Satz Beim Test Anlageberatung derBanken [bank2] loste kein In-stitut die einfache Frage nacheiner sicheren Anlage wirklichgut.

Merkmale: Kontextworter Anlageberatung, loste, sicherenAnlage, . . .

Merkmalsvektor: Eintragfur jedes Wort im Vokabular

Angebot: 0, Anlage: 1, Anlage-beratung: 1, Garten: 0, loste:1, Ruckenlehne: 0, schwingend:0, sicheren: 1, . . .

⇓Maschinelles Lernen

Algorithmus entscheidet, ob der Vektor mehr wie diejenigen furbank1 oder bank2 aussieht.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 32 / 90

Page 36: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Merkmalsspezifikation

Kontext: Satz Beim Test Anlageberatung derBanken [bank2] loste kein In-stitut die einfache Frage nacheiner sicheren Anlage wirklichgut.

Merkmale: Kontextworter Anlageberatung, loste, sicherenAnlage, . . .

Merkmalsvektor: Eintragfur jedes Wort im Vokabular

Angebot: 0, Anlage: 1, Anlage-beratung: 1, Garten: 0, loste:1, Ruckenlehne: 0, schwingend:0, sicheren: 1, . . .

⇓Maschinelles Lernen

Algorithmus entscheidet, ob der Vektor mehr wie diejenigen furbank1 oder bank2 aussieht.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 32 / 90

Page 37: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Merkmalsspezifikation

Kontext: Satz Beim Test Anlageberatung derBanken [bank2] loste kein In-stitut die einfache Frage nacheiner sicheren Anlage wirklichgut.

Merkmale: Kontextworter Anlageberatung, loste, sicherenAnlage, . . .

Merkmalsvektor: Eintragfur jedes Wort im Vokabular

Angebot: 0, Anlage: 1, Anlage-beratung: 1, Garten: 0, loste:1, Ruckenlehne: 0, schwingend:0, sicheren: 1, . . .

⇓Maschinelles Lernen

Algorithmus entscheidet, ob der Vektor mehr wie diejenigen furbank1 oder bank2 aussieht.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 32 / 90

Page 38: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Merkmalsspezifikation

Kontext: Satz Beim Test Anlageberatung derBanken [bank2] loste kein In-stitut die einfache Frage nacheiner sicheren Anlage wirklichgut.

Merkmale: Kontextworter Anlageberatung, loste, sicherenAnlage, . . .

Merkmalsvektor: Eintragfur jedes Wort im Vokabular

Angebot: 0, Anlage: 1, Anlage-beratung: 1, Garten: 0, loste:1, Ruckenlehne: 0, schwingend:0, sicheren: 1, . . .

⇓Maschinelles Lernen

Algorithmus entscheidet, ob der Vektor mehr wie diejenigen furbank1 oder bank2 aussieht.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 32 / 90

Page 39: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Merkmalsspezifikation

Kontext: Satz Beim Test Anlageberatung derBanken [bank2] loste kein In-stitut die einfache Frage nacheiner sicheren Anlage wirklichgut.

Merkmale: Kontextworter Anlageberatung, loste, sicherenAnlage, . . .

Merkmalsvektor: Eintragfur jedes Wort im Vokabular

Angebot: 0, Anlage: 1, Anlage-beratung: 1, Garten: 0, loste:1, Ruckenlehne: 0, schwingend:0, sicheren: 1, . . .

⇓Maschinelles Lernen

Algorithmus entscheidet, ob der Vektor mehr wie diejenigen furbank1 oder bank2 aussieht.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 32 / 90

Page 40: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

WSD: Lesk-Algorithmus (Lesk, 1986)

Given: (i) context of an ambiguous word(e.g., “honey is yellow”)

Given: (ii) lexicon definitions of the senses of the ambiguousword

Example:(synset1) honey (a sweet yellow liquid produced by bees)(synset2) beloved, dear, dearest, honey, love (a belovedperson used as terms of endearment)

Count the overlap (number of common words) of eachdefinition with the sentence, e.g.,synset1: overlap of one word (“yellow”)synset2: overlapp of zero words

Select the sense with the greatest overlap

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 33 / 90

Page 41: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

WSD: Pfad-basierte Algorithmen (WordNet-basiert)

Ahnlichkeit zwischen zwei Konzepten ∝ Distanz im Graph

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 34 / 90

Page 42: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

WordNet browser

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 35 / 90

Page 43: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

WSD: Distributionelle Methoden

Worter ( 6= Konzepte) werden als Vektoren dargestelltDimensionen = Worter des VokabularEintrage = wie haufig das Kontextwort vorkam (evtl.lemmatisiert, normalisiert)Ahnlichkeit von zwei Wortern: Winkel zwischen denKontextvektoren (je kleiner der Winkel, desto ahnlicher)

schmusen essen

Katze 100 30Hund 40 100Apfel 1 100. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .

Hund

Katze

Apfel

schmusen

essenIntro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 36 / 90

Page 44: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Ubung: Lesk-Algorithmus

Disambiguieren Sie “state” im Satz “Dry ice is the solid state ofcarbon dioxide.”

state, province (the territory occupied by one of the constituent administrativedistricts of a nation) “his state is in the deep south”state (the way something is with respect to its main attributes) “the currentstate of knowledge”; “his state of health”; “in a weak financial state”state (the group of people comprising the government of a sovereign state) “thestate has lowered its income tax”state, nation, country, land, commonwealth, res publica, body politic (apolitically organized body of people under a single government) “the state haselected a new president”; “African nations”; “students who had come to thenation’s capitol”; “the country’s largest manufacturer”; “an industrialized land”state of matter, state ((chemistry) the three traditional states of matter aresolids (fixed shape and volume) and liquids (fixed volume and shaped by thecontainer) and gases (filling the container)) “the solid state of water is calledice”state (a state of depression or agitation) “he was in such a state you justcouldn’t reason with him”country, state, land (the territory occupied by a nation) “he returned to the landof his birth”; “he visited several European countries”Department of State, United States Department of State, State Department

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 37 / 90

Page 45: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 38 / 90

Page 46: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Textahnlichkeitsmaß: Jaccard

Grundidee des Lesk-Algorithmus: die Definition aus wahlen,die zum Kontext die großte Ahnlichkeit hat.

Maß fur Textahnlichkeit: word overlap

Nachteile von word overlap?

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 39 / 90

Page 47: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Jaccard coefficient

A commonly used measure of overlap of two sets

Let A and B be two sets

Jaccard coefficient:

jaccard(A,B) =|A ∩ B||A ∪ B|

(A 6= ∅ or B 6= ∅)jaccard(A,A) = 1

jaccard(A,B) = 0 if A ∩ B = 0

A and B don’t have to be the same size.

Always assigns a number between 0 and 1.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 40 / 90

Page 48: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Jaccard coefficient: Example

What is the query-document match score that the Jaccardcoefficient computes for:

Query: “ides of March”Document “Caesar died in March”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 41 / 90

Page 49: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Nachteile von Jaccard?

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 42 / 90

Page 50: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 43 / 90

Page 51: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Warum Logik?

1 Theorie / Formalisierung der Semantik:Bedeutung = Wahrheitsbedingungen

2 Inferenz / Logisches Schließen:

Aus bestehendem Wissen/Beobachtungenneues Wissen ableiten.Beispiel question answering:“Liegt Hamburg in Europa?”Vielleicht sagt das keine Quelle (Text, Datenbank) direkt.Aber es folgt aus “Hamburg liegt in Deutschland” und“Deutschland liegt in Europa”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 44 / 90

Page 52: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Wahrheitsbedingungen-Semantik

Bedeutung = WahrheitsbedingungenBedeutung eines Satzes wird mit seinenWahrheitsbedingungen identifiziert,d.h. mit Bedingungen, die die Welt erfullen muss.

Satze sind synonym, wenn sie dieselbenWahrheitsbedingungen haben.

Einen Satz verstehen heißt angeben konnen, ob er in einergegebenen Situation wahr oder falsch ist.

Ursprung:

Gottlob FregeLudwig WittgensteinMathematische Logik: Alfred Tarski, Rudolf Carnap

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 45 / 90

Page 53: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Aussagenlogik

Aussagesatz (Proposition) → Wahrheitswert

Beispiel

Schnee ist weiß. = T (true / wahr)Ein Junggeselle ist verheiratet. = F (false / falsch)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 46 / 90

Page 54: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Syntax der Aussagenlogik

Satzbuchstaben: Ausdrucke, die ganzen Satzen entsprechen

Beispiele: p, q, r

5 Satzoperatoren (Junktoren, logische Zeichen von AL):

Negation (nicht) ¬Konjunktion (und) ∧Disjunktion (nicht ausschließendes oder) ∨Implikation (wenn, dann) →Aquivalenz (genau dann, wenn) ↔

Hilfszeichen: ( )

A ist ein Satz von AL, wenn eine der folgenden Bedingungenerfullt ist:

(i) A ist ein Satzbuchstabe

(ii) B und C sind Satze von AL und A ist:¬B, (B ∧ C), (B ∨ C), (B → C) oder (B ↔ C)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 47 / 90

Page 55: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Beispiele

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 48 / 90

Page 56: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantik der Aussagenlogik

Die Semantik einer Aussage ist ihr Wahrheitswert.

Die Semantik einer komplexen Aussage wird rekursiv aus derSemantik der Junktoren und der Teilaussagen berechnet.

Semantik der Junktoren: Wahrheitstabelle

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 49 / 90

Page 57: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Konjunktion: “und”

Tim mag Kaffee. p T T F FAnna mag Tee. q T F T F

Tim mag Kaffee und Anna mag Tee. p ∧ q

T F F F

T = wahr / true F = falsch / false

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 50 / 90

Page 58: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Konjunktion: “und”

Tim mag Kaffee. p T T F FAnna mag Tee. q T F T F

Tim mag Kaffee und Anna mag Tee. p ∧ q T F F FT = wahr / true F = falsch / false

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 50 / 90

Page 59: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Negation: “nicht”, “kein”

Tim mag Kaffee. p T F

Tim mag keinen Kaffee. ¬p

F T

Negation: “nicht”, “kein”

Tim ist in Italien. p T F

Tim ist nicht in Italien. ¬p

F T

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 51 / 90

Page 60: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Negation: “nicht”, “kein”

Tim mag Kaffee. p T F

Tim mag keinen Kaffee. ¬p F T

Negation: “nicht”, “kein”

Tim ist in Italien. p T F

Tim ist nicht in Italien. ¬p F T

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 51 / 90

Page 61: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Disjunktion: “oder”

Tim mag Kaffee. p T T F FTim mag Tee. q T F T F

Tim mag Kaffee oder Tim mag Tee. p ∨ q

T T T F

ausschließendes vs nicht ausschließendes oder

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 52 / 90

Page 62: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Disjunktion: “oder”

Tim mag Kaffee. p T T F FTim mag Tee. q T F T F

Tim mag Kaffee oder Tim mag Tee. p ∨ q T T T F

ausschließendes vs nicht ausschließendes oder

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 52 / 90

Page 63: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Implikation: (kein perfekt passendes deutsches Wort)

Anna trinkt Kaffee. p T T F FTim kocht. q T F T FWenn Anna Kaffee trinkt, dann kocht Tim. p → q T F T T

Wenn p, dann muss q auch eintreten.Aber q kann auch ohne p eintreten → kein Ruckschluss moglich.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 53 / 90

Page 64: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Aquivalenz: “genau dann wenn”

Tim trinkt Kaffee. p T T F FAnna kocht Tee. q T F T FTim trinkt Kaffee genau dann,wenn Anna Tee kocht. p ↔ q

T F F T

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 54 / 90

Page 65: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Aquivalenz: “genau dann wenn”

Tim trinkt Kaffee. p T T F FAnna kocht Tee. q T F T FTim trinkt Kaffee genau dann,wenn Anna Tee kocht. p ↔ q T F F T

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 54 / 90

Page 66: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Kontravalenz / Exclusive Or: “entweder . . . oder”

Tim rennt. p T T F FAnna kocht. q T F T FEntweder rennt Tim oder Anna kocht. p ↔ q

F T T F

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 55 / 90

Page 67: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Kontravalenz / Exclusive Or: “entweder . . . oder”

Tim rennt. p T T F FAnna kocht. q T F T FEntweder rennt Tim oder Anna kocht. p ↔ q F T T F

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 55 / 90

Page 68: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Pradikatenlogik (erster Stufe) – First-Order Logic

Aussagenlogik:Aussagen werden als nicht analysierbare Einheiten behandelt.

Pradikatenlogik:Wir stellen auch die interne Struktur von Aussagen dar.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 56 / 90

Page 69: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Pradikatenlogik (erster Stufe) – First-Order Logic

IndividuenkonstantenHans, Maria, das Buch, ‘‘Dracula’’ ...

Pradikate und Argumente

Hans ist ein Kind. kind(Hans)

Einstelliges Pradikat ≈ Eigenschaft

Hans mag Maria. mag(Hans, Maria)

Zweistelliges Pradikat ≈ Relation

Individuenvariablen

mogen(x, y)

Ein Wert (Hans, Maria, ... ) wird x und y zugewiesen, dannkann der Wahrheitswert berechnet werden.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 57 / 90

Page 70: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Pradikatenlogik (erster Stufe) – First-Order Logic

Existenzquantor

∃x (kind(x) ∧ mogen(x, Maria))

Es gibt ein x, sodass x ein Kind ist und Maria von x gemocht wird.Ein (irgendein bestimmtes) Kind mag Maria.

Allquantor

∀x mogen(x, Maria)

Fur jedes x gilt, dass Maria von x gemocht wird.Alle mogen Maria.

∀x (kind(x) → mogen(x, Maria))

Fur jedes x, das ein Kind ist, gilt, dass Maria von x gemocht wird.Alle Kinder mogen Maria.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 58 / 90

Page 71: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Syntax der Pradikatenlogik (vereinfacht)

Term: Variable oder Individuenkonstante

atomare Formel: P(t1, . . . , tn)(ti sind Terme, P ist ein Pradikatsymbol)

oft wird als atomare Formel auch zugelassen:(ti = tj)

A ist eine Formel von PL, wenn eine der folgendenBedingungen erfullt ist:

(i) A ist eine atomare Formel

(ii) B und C sind Formeln von PL und A ist:¬B, (B ∧ C), (B ∨ C), (B → C) (B ↔ C),∀xA, ∃xA

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 59 / 90

Page 72: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantik-Konstruktion

Wir bauen an derKonstituentenstrukturentlang komplexesemantische Ausdrucke“kompositionell” auseinfacheren Ausdruckenzusammen.

Fur jedenLexikoneintrag undjede syntaktische Regelfugen wir noch einesemantischeKomponente hinzu.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 60 / 90

Page 73: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Semantik-Konstruktion: Herausforderung

Jede Teilnehmerin prasentierte ein Papier.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 61 / 90

Page 74: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Ubung

Ubersetzen Sie in die Pradikatenlogik:

1 Nemo ist ein Fisch.

2 Nemo schwimmt.

3 Nemo ist keine Schildkrote.

4 Ein Student traumt.

5 Jeder Student kennt ein Buch.

Beispiele

“Irgendein Kind mag Maria.” ∃x (kind(x) ∧ mogen(x, Maria))

“Alle mogen Maria.” ∀x mogen(x, Maria)

“Alle Kinder mogen Maria.” ∀x (kind(x) → mogen(x, Maria))

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 62 / 90

Page 75: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 63 / 90

Page 76: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Aspekt

Vendler-Klassen: innere temporale Struktur von Verben / SatzenZeno Vendler: Verbs and times. 1957.

State: Zustand“Ich wohnte in Munchen.”

Activity: Aktivitat ohne bestimmten Endpunkt“Sie fuhr Fahrrad.”

Accomplishment: Aktivitat mit bestimmtem Endpunkt“Er flog nach New York.”

Achievement: Ereignis geschieht “in einem Moment”.“Er erreichte New York.”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 64 / 90

Page 77: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Zustande vs. Ereignisse

Zustande (State)

. . . beschreiben Eigenschaften, die sich uber einen gewissenZeitraum nicht andern.“Anne wohnte von 2011 bis 2016 in Saarbrucken.”

Ereignisse (Event)

. . . beschreiben Veranderungen.“Anne zog im Oktober nach Munchen.”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 65 / 90

Page 78: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Interpretation von Tempus nach Hans Reichenbach

Sprechzeit S (speech time)

Referenzzeit R (reference time)

Ereigniszeit E (event time)

Prasens

Anna kocht (gerade) einen Tee.

SRE

E = R = S

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 66 / 90

Page 79: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Reprasentation von Zeit

Interpretation von Tempus nach Hans Reichenbach

Sprechzeit S (speech time)

Referenzzeit R (reference time)

Ereigniszeit E (event time)

Prateritum

Anna kochte einen Tee.

SRE

E = R < S

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 67 / 90

Page 80: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Reprasentation von Zeit

Interpretation von Tempus nach Hans Reichenbach

Sprechzeit S (speech time)

Referenzzeit R (reference time)

Ereigniszeit E (event time)

Plusquamperfekt

Anna hatte einen Tee gekocht.

SREE < R < S

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 68 / 90

Page 81: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Ubung

Interpretation von Tempus nach Hans Reichenbach: Zeichnen Sieauf der Zeitachse S, R und E ein – jeweils eine Zeitachse pro Satz.

1 Anna wird einen Tee kochen.

2 Anna wird einen Tee gekocht haben.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 69 / 90

Page 82: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 70 / 90

Page 83: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Kompositionalitat

Kompositionalitatsprinzip (Gottlob Frege, 1848-1925)

Die Bedeutung eines komplexen Ausdrucks ist eine Funktion derBedeutungen seiner Teile und der Art ihrer Kombination.

Beispiel

Der Hund biss den Mann.Bedeutung setzt sich zusammen aus:

+ +Semantikkonstruktion . . .

brauchen wir, um die genau Art der Zusammensetzung zubestimmen.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 71 / 90

Page 84: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Vollverben vs. Stutzverbkonstruktionen

Vollverb: Semantik klar, Bedeutung ist eine Hauptbedeutung ausdem Worterbuch, kompositionell

Vollverben

Susi nimmt sich einen Keks. → Susi + nehmen + Keks

Stutzverbkonstruktionen: Bedeutung des Verbs “schwach”, Nomen(Argument) muss miteinbezogen werden.

Stutzverbkonstruktion (light verbs, support verbs)

Susi nimmt ein Bad. 6= Susi + nehmen + Bad

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 72 / 90

Page 85: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Idiom

Wortverbindung (Phrase oder Kompositum), derenGesamtbedeutung sich nicht aus den Einzelbedeutungen derWorter ableiten lasst

Beispiele:“Friedhof”, “rotes Tuch”, “die Rechnung ohne den Wirt machen”Idiome sind nicht kompositionell.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 73 / 90

Page 86: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Aufgabe

Idiom? Stutzverbkonstruktion? Vollverb?

1 mit dem Bus fahren

2 aus der Haut fahren

3 in Kontakt treten

4 zur Sprache bringen

5 eine Sprache lernen

6 auf die Palme bringen

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 74 / 90

Page 87: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Outline

1 Intro

2 Lexikalische Semantik

3 Textahnlichkeit

4 Logik

5 Zeit&Aspekt

6 Kompositionalitat

7 Referenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 75 / 90

Page 88: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anaphorische Referenz

aus dem Altgriechischen ana = zuruck phero = tragen

Anaphorische Ausdrucke zeigen auf Referenten, die imsprachlichen Kontext schon eingefuhrt wurden:Maria . . . sie . . . die(se) Frau . . .

Zwei Arten von anaphorischer Referenz:

Koreferenz (bei identischem Referenten)Bridging (assoziative Beziehung zwischen den Referenten)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 76 / 90

Page 89: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anaphorische Referenz: Koreferenz

Koreferenz = identischer Referent

typischerweise durch Pronomen oder definite Nominalphrasen

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 77 / 90

Page 90: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anaphorische Referenz: Koreferenz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 78 / 90

Page 91: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anaphorische Referenz: Bridging

Bridging = Assoziative Referenz:der Referent der Anapher ist inferierbar aus dem Antezedensauf Grund einer assoziativen Beziehung (z.B Teil-Ganzes,Eigenschaften etc.).typischerweise durch definite Nominalphrasen

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 79 / 90

Page 92: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anaphorische Referenz: Bridging

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 80 / 90

Page 93: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Singleton

A mention referring to a referent is called a singleton if thisreferent is not mentioned again in the text. (= single reference tothis referent)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 81 / 90

Page 94: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Anaphernauflosung = coreference resolution

Automatische Anaphernauflosung ist eine Herausforderung furdie automatische Sprachverarbeitung.

Wichtig fur viele Anwendungsgebiete:

Information RetrievalSummarizationMachine translationDialogue Systems

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 82 / 90

Page 95: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Methoden zur Koreferenzauflosung

Korpusannotation: Erstellen von Trainings- undTestdatensatzen (z.B. OntoNotes)

Statistische Ansatze (z.B. Berkeley’s System)

Nomen und Pronomen werden mit Hilfe von MerkmalenbeschriebenMention-Pair Models: Algorithmus (maschinelles Lernen) wirdtrainiert, zu entscheiden, ob sich zwei Nominalphasen aufdasselbe Objekt beziehen → Kettenbildung als 2. Schritt

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 83 / 90

Page 96: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Word Sense Disambiguation: Merkmalsspezifikation

Kontext: Satz Beim Test Anlageberatung derBanken [bank2] loste kein In-stitut die einfache Frage nacheiner sicheren Anlage wirklichgut.

Merkmale: Kontextworter Anlageberatung, loste, sicherenAnlage, . . .

Merkmalsvektor: Eintragfur jedes Wort im Vokabular

Angebot: 0, Anlage: 1, Anlage-beratung: 1, Garten: 0, loste:1, Ruckenlehne: 0, schwingend:0, sicheren: 1, . . .

⇓Maschinelles Lernen

Algorithmus entscheidet, ob der Vektor mehr wie diejenigen furbank1 oder bank2 aussieht.

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 84 / 90

Page 97: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Koreferenzauflosung: Regelbasierter Ansatz

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 85 / 90

Page 98: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Koreferenzauflosung: Beispiel

Nochmal die Terminologie: Anapher (sie), Antezedent (Alice)

Koreferenzketten

Alice fing an sich zu langweilen; sie saß schon lange bei ihrerSchwester am Ufer und hatte nichts zu tun. Das Buch, das ihreSchwester las, gefiel ihr nicht; denn es waren weder Bilder nochGesprache darin. “Und was nutzen Bucher,” dachte Alice, “ohneBilder und Gesprache?”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 86 / 90

Page 99: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Koreferenzauflosung: Beispiel

Nochmal die Terminolgie: Anapher (sie), Antezedent (Alice)

Koreferenzketten

Alice fing an sich zu langweilen; sie saßschon lange bei ihrerSchwester am Ufer und hatte nichts zu tun. Das Buch , dasihre Schwester las, gefiel ihr nicht; denn es waren weder Bildernoch Gesprache darin. “Und was nutzen Bucher ,” dachteAlice, “ohne Bilder und Gesprache?”

Schwierigkeit: generische Ausdrucke (Buch - Bucher?)

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 87 / 90

Page 100: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Ubung

Welche Außerungen referieren anaphorisch? Bestimmen Sie denjeweiligen Antezedenten!

“Cindy ist strohblond. Ihr Fell schimmert in der Sonne. AlsJeannette auf den Hof tritt, hebt die Haflingerstute den Kopf undblinzelt ihr von der Stalltur aus zu. Dann fangt es an zu regnen.”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 88 / 90

Page 101: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Ubung

Entwickeln Sie einen Algrithmus und wenden Sie ihn an, der furjedes “referierende” Wort im folgenden Text den Antezedentenfindet. Wie kann man die Bestimmung der Antezedenten in diesenFallen automatisieren?

“A small maltese dog named Soshe has been reunited with herowners after spending a week on a floating sofa after floods,brought on by Hurricane Florence, devastated parts of NorthCarolina last month. Soshe’s owner, who was out of the state atthe time, was unable to return to her flooded home in the town ofBurgaw. She made frequent calls to the Humane Society ofMissouri (HSMO), who sent a team to North Carolina to helprescue animals trapped by the powerful storms. The HSMO team,who were using Pender County Animal Control as a base ofoperations, made two attempts to find the stranded dog but theflooding was so severe that it made locating the house extremelydifficult. On their third attempt the motor on their boat stopped,so they had to paddle the rest of the way. Finally, they spotted ahome that seemed to match the description they had been given.As the team approached, they could hear barking coming frominside the building. Woman who rescued 27 animals duringHurricane Florence is arrested The rescuers knocked in the doorand found the terrified maltese dog floating on a couch in theliving room. A team member seized the dog and they ferried her tosafety. Soshe’s family still hadn’t made it back to Burgaw, so afriend came to pick her up from a local animal shelter to finallyreunite the dog with her owner.”

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 89 / 90

Page 102: Einführung in die Computerlinguistik Semantik - cis.lmu.dehs/teach/18w/pdf/09semantikflat.pdf · Outline 1 Intro 2 Lexikalische Semantik 3 Text ahnlichkeit 4 Logik 5 Zeit&Aspekt

Zum Schluss: Besonders klausurrelevant

Word-Bedeutungs-Relationen, WordNet

Word sense disambiguation, Lesk-Algorithmus

Jaccard

Wahrheitsbedinungensemantik

Syntax der Aussagenlogik

Negation, Konjunktion, Disjunktion, Implikation, Aquivalenz

Pradikatenlogik:Pradikate, Variablen, Existenzquantor, Allquantor

Ubersetzung:deutscher/englischer Satz in die Ausagenlogikdeutscher/englischer Satz in die Pradikatenlogik

Kompositionalitatsprinzip

Vollverb, Stutzverbkonstruktion, Idiom

Anaphorische Referenz: Koreferenz, Bridging

Coreference resolution

Intro Lexikalische Semantik Textahnlichkeit Logik Zeit&Aspekt Kompositionalitat Referenz

Schutze: Semantik 90 / 90