IN1140: Introduksjon til språkteknologi Forelesning #09 Lilja Øvrelid Universitetet i Oslo 25 oktober 2018
INF1140: Introduksjon til språkteknologi
IN1140: Introduksjon til språkteknologi
Forelesning #09
Lilja Øvrelid
Universitetet i Oslo
25 oktober 2018
Tema for i dag
Forrige ukeI Kontekstfrie grammatikkerI Formelle beskrivelser av syntaksI Oblig2b: ordklasser/ordklassetagging (frist: 31/10)
I dagI Semantikk: en lingvistisk gjennomgangI Neste uke: semantisk språkteknologi
2
Tema for i dag
I Semantikk
3
Semantikk
I Studiet av betydning slik det uttrykkes gjennom språkI Betydning til morfemer, ord, fraser og setninger
I Leksikal semantikkI SetningssemantikkI (Pragmatikk: hvordan konteksten påvirker betydning)
4
Semantikk
Kunnskap om betydning (mening), men hva innebærer det?
Meningsfull:I Ord – slem vs slåmI Setning – Jon svømmer vs Jon metaforisk hver
Flere betydningerI Ord – fiskerI Setning – Jon så mannen med kikkerten
Samme betydningI Ord – sofa vs couchI Setning – Jon ga Hanna en gave vs Jon ga en gave til Hanna
5
Semantikk
Kunnskap om betydning (mening), men hva innebærer det?I Referanse i verden til objekter (bil, vindu, fly)
SannhetsbetingelserI All kings are maleI Molybdenum conducts electricity (må kanskje sjekkes i en bok?)
Entailment (A medfører B)I Alfred myrdet bankdirektørenI Bankdirektøren er død
6
Leksikal semantikk (Ordsemantikk)
7
Leksikal semantikk (ordsemantikk)
I Leksikal semantikkI Representere betydningen til ordI Vise hvordan betydninger er relatert
I Fundamental forskjell mellom setningssemantikk og ordsemantikk(leksikal semantikk)
I Betydninger i det mentale leksikon er konvensjonerI Setningers betydning er komposisjonelle
I Leksemnivå – semantiske ordI Men hva inneholder det egentlig? Hva vil det si å forstå et ord?
8
Sense and Reference
I Språkfilosofi: Gottlob FregeI Betydningen til et ord er dets referanse, koblingen til objektet detrefererer til (“referenten”)
I Understreker at betydning knyttes til verdenI Men trenger noe mer:
I Ikke alle ord referer til et objektI No baby swims
I Vi kan mange ord som ikke har noen referent, f.eks. enhjørning, orker,Yoda
I Ord kan ha samme referanse uten å bety det samme, f.eks. DonaldTrump, the President
9
Sense and Reference
I Sense: mer varig betydningsdimensjon som er separat fra referanse,kanskje en mental representasjon
I BilderI (Abstrakte) konsepter
I nødvendige og tilstrekkelige betingelser (x er kvinne hviss L: menneskelig,voksen, kvinnelig, osv.)
I prototyper: sentrale og typiske medlemmerI konseptuelle hierarkier (feks. WordNet)
10
Semantiske trekk
I Egenskaper eller deler av ords betydning som uttrykker vår kunnskapom hva ordet betyr
SubstantiverI female: tigress, hen, aunt, debutante, maiden, widow, etc.I human: doctor, bachelor, professor, baby, teenager
VerbI cause: darken, kill, uglify, etc.I go: swim, crawl, throw, giveI become: break
I “Slip-of-the-tongue”-data: ordene som forveksles deler semantiske trekk
11
Leksikale relasjoner
I Lingvistisk teori: hvordan vi beskriver betydningen til ordI Et annet sentralt område innen leksikal semantikk:
I Leksikale relasjoner: Hvordan betydninger relaterer til hverandre
12
Leksikale relasjoner
HomonymiUrelaterte betydninger av samme fonologiske ord (homograf/homofon)1. Samme ordklasse og samme ortografi, f.eks. lap ’circuit of course’ og
lap ’part of body when sitting down’2. Samme ordklasse, forskjellig ortografi, f.eks. verbene wring og ring3. Forskjellig ordklasse, samme ortogafi, f.eks. verb keep og subst. keep
(hytte)4. Forskjellig ordklasse, forskjellig ortografi, f.eks. not, knot
13
Leksikale relasjoner
Polysemi: flere betydninger, men betydningene er relatert (konseptuelteller historisk)
hook noun. 1. a piece of material, usually metal, curved or bent and usedto suspend, catch, hold or pull something. 2. short for fish-hook. 3. a trapor snare 4. a sharply curved spit of land, 5. Boxing a short swinging blowdelivered from the side with the elbow bent. . . . etc
14
Leksikale relasjoner
Synonymi:Forskjellige ortografiske ord, men med samme, eller meget lik, betydningI Eksempelvis couch/sofa, lawyer/attorney, toilet/lavatory, large/bigI Sjeldent fenomen i streng forstand, små nyanser i betydningI Ulik distribusjon:
I ulike dialekter/varianter/kontekstI ulikt register, f.eks. slang, formell, literært, etc.I mer eller mindre negativ: naiv, godtroende
15
Leksikale relasjoner
Antonymi:Motsatt betydningI Enkle antonymer (komplementære par): positiv av det ene medførernegativ for det andre
I dead/aliveI pass/fail (a test)I hit/miss (a target)
I Gradérbare antonymer: positiv av ene medfører ikke nødvendigvisnegativ av andre
I rich/poorI fast/slowI old/young
16
Leksikale relasjoner
Antonymi (forts.)I Reverser: relasjon mellom ord som betegner bevegelse i motsattretning
I push/pullI come/goI ascend/descend
I Konverser: relasjon mellom ord som beskriver samme situasjon fraforskjellig synspunkt
I above/belowI employer/employee
I Taksonomiske søstre ord som er på samme nivå i en taksonomi(klassifikasjonssystem)
rød oransje gul grønn blå lilla brun
17
Leksikale relasjoner
Hyponymi:Inkluderingsrelasjon: et hyponym inkluderer betydningen til et mer genereltordI hund, katt er hyponymer av dyrI søster, mor er hyponymer av kvinne
I Det mer generelle ordet kalles hypernymI Basis for semantiske nettverk (f.eks. WordNet)
18
Leksikale relasjoner
Meronymi:Relasjon mellom del og helhetI X er del av Y, Y har X
I et omslag er del av en bokI en bok har et omslag
I Forskjellig fra hyponymi ved transitivitet:I hyponymi-relasjonen er alltid transitiv (siameser – katt – dyr)I meronymi-relasjonen kan være transitiv (negl – finger – hånd)I men trenger ikke være det (arm – musiker – orkester)
19
Setningssemantikk
20
Komposisjonell (Formell) Semantikk
I Richard Montague (1974): logikk for å representere setningsbetydningI Your car has been stolen (p)I Your car has not been stolen (¬p)I I’ll see you today or tomorrow (p ∨ q)
I En setnings betydning = dens sannhetsbetingelserI sannhetsverdi: hvorvidt en setning er sann eller ikke (1 eller 0)I sannhetsbetingelser: hvilke betingelser som må til i den virkelige verdenfor å gjøre en setning sann
21
Komposisjonell (Formell) Semantikk
I Beregner sannhetsverdien for setninger basert på betydningen tilmindre deler (ord, fraser)
I Å forstå en setnings betydning er å kunne avgjøre dens sannhetsverdi:I Under hvilke betingelser setningen er sann eller usann i henhold til dinkunnskap om verden?
I Tautologier: alltid sanneI Sirkler er runde
I Kontradiksjoner: alltid usanneI Han er en morder, men han har aldri drept noen
I De fleste er sanne/usanne i en gitt situasjonI Jon sykler
22
Entailment
I Semantisk relasjon mellom setninger, uavhengig av empiriske faktaI The anarchist assassinated the emperorI The emperor died
I Definisjon:I En setning p medfører (“entails”) en annen setning q dersom det er slikat når p er sann er q sann og når q er usann så er p usann
23
Entailment
I Entailment-relasjon er gitt ved lingvistisk struktur, trenger ikke sjekkefakta i verden for å avgjøre
I Kilden kan være leksikalsk (assassinate – die) eller syntaktisk (aktiv –passiv)
I Egypterne bygget pyramideneI Pyramidene ble bygget av egypterne
I Parafrase: to setninger som gjensidig medfører hverandre (over)I Kontradiksjon: to setninger kontradikterer hverandre dersom den enemedfører negasjonen av den andre
I Bankdirektøren er dødI Bankdirektøren er levende
24
Formell semantisk analyse
I Semantisk analyse ved oversettelse fra engelsk (eller norsk eller . . . ) tilet universelt metaspråk
I Førsteordenslogikk er et slikt metaspråkI Logiske konnektiver:
I Emil er en katt som ikke maler: Ke ∧ ¬MeI Dersom Bill drikker blir Jenny sint: Db → Sj
I KvantorerI Alle studenter leser: (∀x : Sx)LxI Alle studenter kjenner professoren: (∀x : Sx)KxpI Professoren kjenner (minst) en student: (∃x : Sx)Kpx
25
Semantisk tolkning
I Logikken gis en tolkning ved mengdelæreI Setninger: sannhetsverdi (match eller ikke med situasjonen), [p] = 1I Konstanter: individer eller mengder av individer
I [j] = individet JonI Predikater: mengden av individer som predikatet gjelder for {x : . . . }
I [sykler] = {x : x sykler}I [elsker] = {<x,y> : x elsker y}
26
Semantiske regler
Evaluere sannhet:I John synger = SjI [Sj] = 1 hvis og bare hvis [j] ∈ [S]I Med referanse til syntaktisk struktur: betydningen til [S NP VP ] erfølgende sannhetsbetingelse:
I Dersom betydning til NP (et individ) er medlem av betydningen til VP(mengde individer) er S sann, ellers er den usann
27
Semantiske regler
Evaluere sannhet:I Bob idoliserer John = IbjI [Ibj] = 1 hvis og bare hvis [<b,j>] ∈ [I]I Med referanse til syntaktisk struktur:
I betydningen til [V P V NP ] er mengden av individer X slik at X er førstemedlem i et par i betydningen til V, hvis det andre medlemmet erbetydningen til NP
28
Problemer for komposisjonalitet
I Semantisk anomali: semantisk tolkning bryter sammenI Colorless green ideas sleep furiously
I Metafor, f.eks. “time is money”I You are wasting my timeI This gadget will save you hoursI How do you spend your time?I I’ve invested a lot of time here
I Idiomatiske uttrykk: språkspesifikke, en bokstavelig og en figurativbetydning, f.eks. kaste inn håndklet, gå bort
29
Semantiske roller
30
Semantiske roller
I Annet aspekt ved setningsbetydning: hvilke roller de forskjelligedeltagerene inntar
I Nina hevet bilen med jekkenI Nina – deltageren som er ansvarlig for å utføre handlingen beskrevet avverbet
I bilen – blir påvirket av handlingenI jekken – middelet som Nina bruker til å utføre handlingen
I Semantiske roller beskriver den semantiske relasjonen som argumenterhar til handlingen beskrevet av verbet
31
Semantiske roller
RolletyperI agent: den som setter i gang en handling, i stand til å handle medviten og vilje (“volition”)
I David stekte kjøttetI Reven hoppet ut av grøfta
I patient: entiteten som påvirkes av en handling, gjennomgår ofte enforandring
I Edna kuttet buskeneI Sola smeltet isen
32
Semantiske roller
RolletyperI theme: entiteten som blir beveget av en handling eller hvis beliggenhetbeskrives
I David sparket ballen over til de andreI Boka er på biblioteket
I experiencer: er bevisst på handlingen eller tilstanden, men er ikke ikontroll over den
I Edna følte seg dårligI Hanna så røykenI Fia hørte ringeklokken
33
Semantiske roller
RolletyperI beneficiary: entiteten som en handling utføres for
I David fylte inn skjemaet for bestemoren sinI De bakte en kake til meg
I instrument: middelet som gjør at en handling kan utføres eller finnersted
I Hun renset såret med et antibakterielt middelI De signerte avtalen med den samme pennen
34
Semantiske roller
RolletyperI goal: entiteten som noe beveger seg mot (bokst./fig.)
I Hun leverte sertifikatet sitt til politimannenI Hun fortalte vitsen til vennene sine
I source: entiteten som noe beveger seg fra (bokst./fig.)I Flyet kom tilbake fra KinshasaI Vi fikk ideen fra et interiørblad
35
Semantiske roller
I Eksempelet: Nina hevet bilen med jekkenagent theme instrument
I Tester for semantiske rollerI agent: legge til med vilje
I Jon tok boka fra Edna med viljeI theme/patient
I Det som skjedde med Y var at . . .I Det X gjorde mot Y var . . .
36
Semantiske roller
I Ikke alltid enkelt å tildele semantiske rollerI Fergus carried the bag to the lighthouse (goal)I Sylvie bought him a sports car (beneficiary)I Margareta received a gift of flowers (goal/beneficiary? beggedeler?)
37
Quiz
I Del ut følgende semantiske roller for setningene under:I PATIENT: entiteten som påvirkes av en handling, gjennomgår ofte enforandring
I AGENT: den som setter i gang en handling, i stand til å handle medviten og vilje
I INSTRUMENT: middelet som gjør at en handling kan utføres eller finnersted
1. Jon knuste vinduet2. Jon knuste vinduet med en stein3. Steinen knuste vinduet4. Vinduet ble knust av Jon
38
Semantiske roller
I Ikke slik at syntaktiske funksjoner alltid tilsvarer samme semantiske rolleI Semantiske roller identiske i parafraser
I The dog bit the stick/the stick was bitten by the dogI Kan også være identiske i setninger som ikke er parafraser
I The boy opened the door with the keyI The key opened the doorI The door opened
39
Pragmatikk
40
Pragmatikk
I Studiet av vår språklige forståelse i kontekstI lingvistisk kontekst
I pronomenerI ikke-lingvistisk kontekst
I Kan du sende saltet?
41
Ordklasser: pronomen
Pronomen:jeg, hun, dere, seg, hverandre, hvem, man1. av svært ulik form, uregelmessig bøyning2. som substantiv, kan fungere som setningsledd alene3. lite eget innhold, får betydning fra sammenhengen (konteksten)
I Jeg liker grammatikkI Man skal respektere hverandreI Hvem tok vesken?
42
Ordklasser: pronomen
I Pronomen får sitt innhold enten fra et element i selve talesituasjoneneller fra en nominal leddtype (typisk substantiv) i konteksten.
I Leddet som gir pronomen innhold er pronomenets antesedentI Se herI Er du sulten?I Gro Harlem Brundtland er en tidligere norsk politiker. Hun var norgesførste kvinnelige statsminister. . .
43
Pragmatikk
I Deiksis: ord som får referansen kun fra den ikke-lingvistiske kontekstenI this personI that manI these women
I Tids-og stedsdeiksisI nå, i morgen, forrige ukeI her, der, dette stedet, denne parken
44
Pragmatikk
I Grice: kjent språkfilosofI Samtaler er basert på prinsipp om samarbeidI Maksimene til Grice: samtalekonvensjoner som muliggjør ensammenhengende og meningsfull diskurs
I kvantitet: si hverken mer eller mindre enn nødvendigI relevans: vær relevantI måte: vær klar og konsisI kvalitet: ikke lyv
45
Pragmatikk
Kvantitetsmaksimet:I Hva skjedde i dag?I Møtet startet tre minutter for sent, jeg satt ved døren, den første somsa noe var . . .
I Ikke noe
Relevansmaksimet:I Hvordan har du hatt det i dag?I Jeg hater tomater
Måtesmaksimet:I Liker du skjorten min?I Den er interessant
Kvalitetsmaksimet:I Venn spør: Vet du hvor bilnøklene mine er?, og forventer et sannferdigsvar
46
Pragmatikk
I Taleakter: språk kan brukes til å utføre handlinger, f.eks. love noe,vedde, advare, døpe noen, gratulere noen, sverge, etc.
I Jeg vedder 100 kroner på at Amman vinnerI Møtet er hevetI Jeg erklærer dere herved for rette ektefolkI Jeg lover å komme tilbake
I Underliggende målet med ytringen varierer med kontekstenI Bursdagsfest 11/4 kl 20
47
Oppsummering – Semantikk
I Studiet av betydning slik det uttrykkes gjennom språkI Ord: leksikal semantikk
I referanse vs senseI leksikale relasjoner (*nymi)
I Setning: formell semantikkI sannhetsverdiI logikkI semantiske regler angir tolkning (kobling til syntaks)
I Setning: semantiske rollerI hvilke roller de forskjellige deltagerene inntarI abstrakt beskrivelse av situasjonen verbet angir
48
Oppsummering – Semantikk
I Pragmatikk: språklig forståelse i kontekstI kontekst gir referanse/innhold
I pronomenI deiksis
I sosial kontekst med samarbeidsprinsipper bidrar til forståelse (Grice)I ikke-lingvistisk kontekst påvirker betydning (taleakter)
49