15 dicembre 2016 Linguistica Computazionale
15 dicembre 2016
Linguistica Computazionale
2
Semantica computazionale l Modelli formali e computazionali per la rappresentazione del
significato l semantica lessicale, semantica formale, logica, filosofia del
linguaggio l Metodi computazionali per l’acquisizione e l’estrazione di
informazione semantica dai testi l corpus-based computational semantics
l Significato & computer l computer à significato
l uso di metodi logico-matematici, statistici e algoritmici per indagare i problemi relativi al significato e alle strutture concettuali
l significato à computer l costruire rappresentazioni del significato per dotare i computer di
conoscenze semantiche
3
Semantica computazionale l Ambiti di applicazione
l costruzione (semi-automatica) di risorse lessicali l dizionari, lessici, repertori terminologici, thesauri, reti semantiche,
ontologie (ontology learning), ecc. l creazione di corpora annotati con informazione semantica
l sensi, classi semantiche, eventi, relazioni semantiche, relazioni anaforiche, ecc.
l estrazione di contenuto semantico da testi l entità, relazioni tra entità, eventi
l analisi semantico-lessicale l espressioni polirematiche (multiwords), costruzioni, strutture
argomentali, ecc. l modelli computazionali del lessico mentale e della memoria
semantica l categorizzazione, acquisizione del vocabolario, formazione di concetti,
deficit semantici, ecc.
4
Il computer e il significato l Il significato come concetto espresso da una parola
l Il significato come definizione di un dizionario automobile s.f. 1. veicolo a quattro ruote, con motore a scoppio, per il trasporto su strada di un numero limitato di persone.
automobile
mondo
concetti linguaggio
5
Il computer e il significato l Lessici computazionali semantici
l rappresentano alcune componenti del significato dei termini lessicali in maniera comprensibile e utilizzabile da modelli computazionali per task di NLP l disambiguazione sintattica, traduzione, recupero ed
estrazione dell’informazione, ecc. l Modelli computazionali per la rappresentazione del
significato lessicale l Modello relazionale
l WordNet l Modello a frame
l FrameNet
6
Modello relazionale della memoria semantica l Semantic Networks (Quillian 1968, Collins &
Quillian 1969, Collins & Loftus 1975) l la memoria semantica è organizzata come una
rete di nodi concettuali l i nodi rappresentano concetti e gli archi relazioni
concettuali di tipo diverso l Le reti semantiche sono principalmente (ma non
esclusivamente) basate su una struttura tassonomica l relazione IS-A (inclusione categoriale)
§ una rondine IS-A un uccello
7
Semantic Networks (Quillian 1968, Collins & Quillian 1969)
fish
animal
bird
canary salmon
IS-A
has skin can move around eats breaths
has wings can fly has feathers
can sing is yellow
has fins can swim has gills
IS-A
IS-A IS-A
8
Modello relazionale del lessico
l Relazioni semantiche fondamentali l Sinonimia
l X e Y sono sinonimi se possono essere liberamente sostituite nelle frasi senza alterarne l’accettabilità § automobile – macchina § re – monarca
l Iperonimia l X è un iperonimo di Y se la classe di entità a cui Y si riferisce è un sottoinsieme
della classe di entità a cui X si riferisce § automobile – veicolo § cane – animale
l Se X è un iperonimo di Y, Y è un iponimo di X l Meronimia
l X è un meronimo di Y se l’entità a cui X si riferisce è una parte dell’entità a cui Y si riferisce § braccio – uomo § ruota – automobile
Il significato di una parola è determinato dalle sue relazioni con il significato di altre parole
9
Modello relazionale del lessico l Le relazioni semantiche nel dizionario
l Il significato è rappresentato da una rete semantica di relazioni
automobile s.f. 1. veicolo a quattro ruote, con motore a scoppio, per il trasporto su strada di un numero limitato di persone. iperonimo
meronimi funzionalità
automobile
veicolo ruota
motore trasporto
prodotto
iperonimo
iperonimo
funzionalità
meronimo
meronimo
10
WordNet (http://wordnet.princeton.edu/) l Database semantico-lessicale
l modello relazionale l sviluppato a Princeton (Miller, Fellbaum, et al.) l nomi, verbi e aggettivi
l Rete concettuale l un concetto viene rappresentato dall’insieme delle parole sinonime
che lo esprimono (synset) l synset
l insieme di sinonimi § {automobile, macchina} § {re, monarca}
l il synset a cui appartiene la parola X rappresenta il concetto espresso dalla parola X
l le relazioni semantiche sono definite come relazioni tra i concetti espressi dalle parole l relazioni tra synset
11
WordNet la struttura dei synsets
synset
definizione (glossa)
12
Molteplicità di significati l Ambiguità lessicale
l X è semanticamente ambigua se ha più di un significato e questi sono tutti irrelati e indipendenti l cane
§ 1. animale domestico § 2. parte di una pistola
l Polisemia l X è polisemico se ha più di un significato e questi sono connessi
tra di loro l giornale
§ Gianni ha stracciato il giornale § Il giornale è interessante § Il giornale è stato fondato nel 1960 § il giornale si è riunito per decidere lo sciopero
OGGETTO_CONCRETO
INFORMAZIONE ISTITUZIONE
GRUPPO
13
WordNet l Una parola con n significati appartiene a n synsets diversi
l macchina l {macchina, automobile} l {macchina, macchinario}
l il synset corrisponde alla nozione tradizionale di senso di una parola l Un synset può anche contenere un’unica parola
l cane l {cane} animale l {cane} parte di pistola
l ATTENZIONE!! cane ≠ {cane} l in WordNet ogni synset ha un identificatore univoco
Il concetto espresso da un synset è pienamente caratterizzato solo dalla posizione del synset all’interno della rete semantica (dall’insieme delle sue relazioni con altri synsets)
14
La rete semantica Sense 4 bank, bank building -- (a building in which the business of banking transacted; "the bank is on the corner of Nassau and Witherspoon") => depository, deposit, depositary, repository -- (a facility where things can be deposited for storage or safekeeping) => facility, installation -- (a building or place that provides a particular service or is used for a particular industry) => artifact, artefact -- (a man-made object taken as a whole) => whole, unit -- (an assemblage of parts that is regarded as a single entity) => object, physical object -- (a tangible and visible entity; an entity that can cast a shadow) => physical entity -- (an entity that has physical existence) => entity -- (that which is perceived or known or inferred to have its own distinct existence (living or nonliving))
Sense 2 bank -- (sloping land (especially the slope beside a body of water)) => slope, incline, side -- (an elevated geological formation) => artifact, artefact -- (a man-made object taken as a whole) => geological formation, formation -- ((geology) the geological features of the earth))
=> object, physical object -- (a tangible and visible entity; an entity that can cast a shadow) => physical entity -- (an entity that has physical existence) => entity -- (that which is perceived or known or inferred to have its own distinct existence (living or nonliving))
15
WordNet l WordNet è sia un dizionario che un thesaurus
l accesso lessicale per lemma l dato un lemma WordNet descrive i suoi possibili sensi
§ cf. dizionari l accesso concettuale per synset
l ogni synset descrive un concetto l la rete di synsets definisce una rete concettuale (cf.
Semantic Networks nelle scienze cognitive) e navigandola possiamo trovare tutti i lemmi che appartengono allo stesso dominio / categoria concettuale § cf. thesauri
16
Relazioni semantiche in WN l Relazioni differenti per le categorie lessicali (nomi, verbi,
aggettivi, avverbi) l nomi
l hypernyms: canine - hypernym - dog l hyponyms: dog - hyponym - canine l coordinate terms: Y is a coordinate term of X if X and Y share a
hypernym (wolf coordinate term - dog, e dog - coordinate term - wolf) l holonym: building - holonym - window l meronym: window - meronym - building
l aggettivi l antonyms: good – antonym - bad l related nouns: expensive – related nouns - expensiveness l is a value of: fast - is a value of - speed
l adverbs l root adjectives: gently – root adjective – gentle
l Ogni tipo di relazione semantica è associata a uno schema di frase per verificarne la plausibilità l hypernyms: “X is a kind of Y”
17
Relazioni semantiche in WN il caso dei verbi l Relazioni semantiche tra synsets verbali
l hypernym: the verb Y is a hypernym of the verb X if the activity X is a (kind of) Y l to travel - hypernym – to move
l troponym: the verb Y is a troponym of the verb X if the activity Y is doing X in some manner l to march - troponym - to walk
l entailment: the verb Y is entailed by X if by doing X you must be doing Y l to sleep - entailed by – to snore
l coordinate terms: those verbs sharing a common hypernym l to lisp - coordinate terms - to yell
l cause: doing X causes the event Y l to kill - causes – to die
l antonyms: l to buy – antonym – to sell