1
Le peculiarità del linguaggio giuridico. Problemi e prospettive
nel contesto multilingue europeo
Maria-Teresa Sagri, Daniela Tiscornia
Ittig-CNR, Istituto di Teoria e Tecniche per l'Informazione Giuridica del Consiglio
Nazionale Delle Ricerche (Italia)∗, {sagri|tiscornia}@ittig.cnr.it
Citation: Sagri, Maria-Teresa e Daniela Tiscornia (2009), “Le peculiarità del linguaggio giuridico. Problemi e prospettive nel contesto multilingue europeo”, mediAzioni 7, http://mediazioni.sitlec.unibo.it, ISSN 1974-4382.
Parole chiave: terminologia giuridica, multilinguismo, semantic web, ontologie per il diritto, accesso ai
contenuti digitali.
Riassunto: Il forte tecnicismo del linguaggio giuridico rappresenta da sempre un ostacolo alla
comprensione ed alla conoscenza sostanziale dei contenuti normativi. Il diritto regola ogni manifestazione
della vita sociale, perciò confluiscono nella terminologia giuridica termini creati dal legislatore, parole del
linguaggio comune utilizzate in accezione tecnica, termini che appartengono alla realtà normata. In più, il
diritto è fortemente dipendente sia dalla sua testualità che da una particolare contestualità, generata dal
sistema giuridico entro cui ogni innovazione normativa va ad inserirsi: ne è prova la frequente
sovrapposizione fra le metodologie della comparazione giuridica e la traduzione del diritto. Il presente
contributo intende analizzare il fenomeno dalla prospettiva degli 'strumenti', più precisamente descrivendo
come le tecniche dell'Information Technology affrontino il problema delle barriere linguistiche nella ricerca
e nella comprensione dell'informazione giuridica on line. Si analizzeranno approcci teorici e metodologici
sottostanti allo sviluppo di risorse lessicali e di architetture software, atte a consentire un accesso ai
contenuti digitali indipendente dalla forma linguistica in cui sono espressi, affrontando i temi del
multilinguismo, del tecnicismo e dell'eterogeneità delle fonti. Si illustreranno iniziative concrete, frutto di
progetti di ricerca promossi dalla Commissione Europea, se ne descriveranno le caratteristiche, i risultati, i
punti deboli e le lezioni imparate dalle esperienze applicative.
∗ Maria-Teresa Sagri, ricercatrice presso Ittig è autrice degli paragrafi 1, 2, 3. Daniela Tiscornia, dirigente di ricerca presso Ittig, è autrice del paragrafo n. 4.
2
Introduzione
L'ordinamento comunitario nasce come un sistema giuridico che riesce a
svilupparsi al di sopra delle singole sovranità nazionali. Tale processo risulta
piuttosto singolare, dato che la nuova organizzazione politica viene ad
affermarsi senza presentare quegli elementi costitutivi1 che la dottrina ritiene da
sempre necessari per il consolidamento e la legittimazione di un ordinamento
giuridico2. Ne consegue che, mancando un substrato storico di riferimento, il
nuovo assetto comunitario si presenta come una realtà multiculturale
caratterizzata da differenti lingue e sistemi giuridici nazionali (Pozzo e Jacometti
2006).
In particolare il crescente raffronto e confronto dei documenti in lingua diversa
ha indotto la ricerca ad affrontare le problematiche delle traduzioni multilingue e
concentrarsi sullo sviluppo di strumenti che possano ovviare al difficile
problema della comunicabilità dei dati e dei concetti giuridici. Ciò ha fatto
emergere l’importanza di assicurare un’efficiente comunicazione linguistica che,
superando le problematiche inerenti al “multilinguismo” degli Stati membri,
favorisca la necessaria osmosi tra i diversi contesti3.
Secondo le politiche comunitarie, infatti, il miglioramento del processo
informativo e conoscitivo può rappresentare una ottima manovra strategica per
risolvere il problema della legittimazione del nuovo ordinamento ed avvicinare i
contesti nazionali alla dimensione europea (Schioppa 2002: 6). Viene quindi
fortemente percepita l'esigenza di sviluppare un concetto di appartenenza
1 Sul punto Cuocolo (1999: 120) sottolinea come gli elementi costitutivi di un ordinamento Statale sono il popolo, territorio e potere sovrano. E' proprio quest'ultimo elemento che in dottrina solleva molte polemiche e discussioni. In effetti è dubbia la natura giuridica della sovranità dell'ordinamento europeo. Sull'argomento cfr. anche Bin e Petruzzella (2005).
2 Su questo aspetto un interessante contributo è dato dalle teorie di Cannanea (2003) dove si approfondiscono le tematiche del problema della legittimazione dell'ordinamento europeo.
3 Cfr. Schena e Snel Trampus (2002) e Ricoer (2000: 2).
3
sociale e politica al nuovo sistema giuridico4. In particolare, attraverso
programmi istituzionali si incentiva la possibilità di acquisire le informazioni,
capirle, comunicarle e rielaborarle, al fine di incidere sulla sua stessa vita di
relazione comunitaria5. Solo una adeguata capacità di interazione dell'utente
con i nuovi organismi istituzionali sembra aprire la strada ad una maggiore
percezione dello status di cittadinanza europea e coadiuvare così il processo di
consolidamento politico (Azzena 2007: 1420).
Nel contesto giuridico questa problematica viene particolarmente ad acuirsi. Nel
mondo giuridico, contrariamente ad altri contesti tecnici, l'accesso
all'informazione non significa soltanto accrescere la capacità conoscitiva
dell'utente, ma anche soddisfare un più generale obbligo di informazione che
grava sulle istituzioni statali6. L'ordinamento, in quanto formale tutore della
legalità, deve inevitabilmente farsi garante della trasparenza ed accessibilità
delle informazioni giuridiche. Purtroppo però il problema dell'uso del linguaggio
per il recupero delle informazioni si complica non solo a causa del forte
tecnicismo che caratterizza il linguaggio legale ma anche a causa della
fisionomia multilingue acquisita negli ultimi anni dai sistemi giuridici (Sacco
2000: 125).
L'affermarsi dell’ordinamento comunitario ha, infatti, determinato la presenza di
alcune problematiche che scaturiscono dalle differenze e dalle distanze tra i
sistemi giuridici ed i moduli linguistici comunitari (Rossi 2007: 140).
4 L’Unione europea è fondata sul motto “unità nella diversità: diversità di culture, usi, costumi e credenze e di lingue – ovvero una realtà in cui ciascuna individualità nazionale viene salvaguardata e valorizzata in tutte le sue manifestazioni – è proprio questa diversità a fare dell’Unione europea [...] non un ‘melting pot’ in cui le differenze si fondono, bensì una casa comune in cui la diversità viene celebrata e le nostre numerose lingue materne rappresentano una fonte di ricchezza e fungono da ponte verso una solidarietà e una comprensione reciproca maggiori”. Cfr. Comunicazione della Commissione: Un nuovo quadro strategico per il multilinguismo, Bruxelles, 22.11.2005, COM (2005) 596, p. 2.
5 Per un approfondimento di questa tematica cfr. Migliazza (2002).
6 “Si pensi esemplarmente al settore della comunicazione e dell'informazione pubblica, grazie a cui l'amministrazione è chiamata sempre più ad operare [...] in una “forma” nuova, calcata sul modello interattivo reso possibile dalla digitalizzazione ed alle reti” (Costanzo 2006: 4).
4
Non solo a livello europeo non si dispone di una comune terminologia giuridica,
ma nella fase di elaborazione normativa, si è imposta all'interno delle diverse
istituzioni comunitarie la prassi secondo la quale la bozza preliminare del
documento normativo viene realizzata utilizzando soltanto tre principali lingue di
lavoro (inglese, francese e solo in più limitati casi il tedesco); ne consegue che i
documenti non sono “pensati” multilingue fin dall'origine, e vengono tradotti
nelle diverse lingue ufficiali soltanto nella fase finale della redazione (Cosmai
2007: 122). Ciò determina la produzione di una regolamentazione che non tiene
conto delle profonde differenze esistenti tra i vari ordinamenti (Ajani e Ebers
2005).
Le stesse problematiche vengono ad acuirsi nel difficile rapporto tra la
legislazione comunitaria e quella dei singoli Stati. Gli atti comunitari vengono
difficilmente armonizzati nei contesti nazionali, sia perché la normativa richiede
l'inserimento di concetti giuridici che sono spesso sconosciuti agli assetti
nazionali, sia perché le difformità di recepimento da un ordinamento all'altro
tendono a inficiare l'uniformità giuridica dell'Unione (Ajani e Rossi 2006: 124).
1. Difficoltà di traduzione del linguaggio giuridico
Le problematiche poste dall'incidenza del diritto comunitario trovano uno stretto
collegamento con le tematiche legate alla traduzione giuridica e sono diventate
evidenti proprio quando i giuristi hanno cominciato a lavorare su progetti volti
all’uniformazione del diritto (Ioratti 2005: 1552).
I termini tecnici utilizzati in ciascun contesto non esplicitano soltanto i concetti
giuridici in esso operanti, ma rispecchiano anche le profonde differenze
esistenti tra i vari ordinamenti (Pozzo 2006: 6).
In diritto è infatti più opportuno parlare di versioni multilingue di un testo
legislativo piuttosto che di traduzioni, altrimenti si corre il rischio di perdere gran
parte del contenuto del documento, là dove una traduzione approssimativa può
far correre il rischio di appiattire i diversi contenuti dei testi. Si possono infatti
verificare delle situazioni in cui pur essendo possibile la traduzione letterale del
5
termine, l’equivalente acquista in un diverso contesto linguistico un significato
completamente diverso7. In altri casi le difficoltà nascono dal dover confrontare
sistemi linguistici divergenti per struttura e matrice culturale8, dove anche gli
stessi domini giuridici sono caratterizzati da profonde divergenze di carattere
sostanziale9.
Ne consegue che nei linguaggi specialistici, come quello giuridico, per stabilire
una corrispondenza tra i termini di lingue diverse occorre individuare la
corrispondenza tra concetti o istituti giuridici, in quanto la diversità di struttura
dei diversi ordinamenti determina la difficile comparazione tra gli istituti presenti.
In questo senso alcune teorie terminologiche propongono, nel processo di
traduzione, di spostare l’attenzione dal termine, espressione linguistica usata in
un determinato contesto, per focalizzare lo studio sul senso contenuto, ovvero il
concetto espresso dal termine stesso10. Questa metodologia consente di
superare in parte le difformità della lingua per confrontare così i concetti
utilizzati in un determinato contesto comunicativo e verificare se l’istituto esista
7 Ad esempio il termine diritto civile in italiano, tradotto in inglese in civil law, viene a rappresentare un significato estremamente lontano a quello del contesto italiano.
8 La teoria della relatività linguistica sostiene che la struttura della lingua condiziona la struttura stessa del pensiero dei parlanti. Ne consegue come corollario che come le lingue sono diverse, anche i concetti sono diversi da cultura a cultura. Ad esempio la lingua francese è caratterizzata da un'abbondanza di parole polisemiche o la frequenza di certe figure retoriche ingannevoli che provano molte difficoltà ad essere raffrontati con termini e strutture della lingua inglese, che risulta invece molto più pragmatica e pratica. Ne consegue alcune difficoltà nel trovare i termini equivalenti. Come sottolinea Sacco “i concetti creati, elaborati, definiti dal legislatore o dal giurista di un certo sistema non corrispondono necessariamente ai concetti elaborati per un altro sistema, così è difficile trovare la parola francese che permetta di esprimere agent, estoppel, executor, ecc.“ (Sacco 2000: 126).
9 Un esempio è rappresentato dal termine negozio giuridico introdotto dalla dottrina tedesca che difficilmente trova un equivalente nella lingua francese o in quell’inglese; in effetti, è un concetto che può essere perfettamente spiegato sia dai giuristi francesi ed inglesi ma in nessuna delle due lingue è possibile tradurre l’espressione con un apposito termine, rappresentando così un limite alla comparazione e traduzioni di testi (Sacco 1995: 86).
10 Secondo Ricoer, il concetto è una unità di pensiero, il cui contenuto semantico può essere riformulato ricorrendo a una combinazione di altri concetti (Ricoer 2000).
6
in un sistema giuridico, oppure se sia elaborato all’interno di un ordinamento
attraverso strutture giuridiche differenti. Più precisamente, la traduzione
giuridica mira a definire una nozione di equivalenza funzionale tra concetti
appartenenti ai diversi ordinamenti giuridici, vale a dire un’equivalenza basata
sul confronto tra due termini che, essendo descritti attraverso gli elementi
costitutivi, possono in qualche modo essere messi in relazione in virtù di uno o
più elementi comuni (De Groot 2000; Wroblewski 2000).
Secondo tale prospettiva, nel settore giuridico si sostiene che “la traduzione di
una parola in un’altra è possibile e legittima nella misura in cui le due parole
esprimono lo stesso concetto” (Sacco 1991: 24). La parola esprime la nozione,
ma diversamente da altri contesti tecnici, nel dominio giuridico certi concetti,
creati, elaborati e definiti dal legislatore o dal giurista di un certo sistema
giuridico, non necessariamente corrispondono a concetti elaborati per un
differente sistema (Sacco 2000: 126). Le lingue di differenti paesi esprimono
concetti che sovente non si equivalgono. La nozione giuridica, pur essendo
all’origine di un numero indefinito di realizzazioni che maturano nelle diverse
esperienze culturali e giuridiche, è incentrata su elementi considerati come
invariabili da un sistema giuridico all’altro. Ad esempio la nozione di contratto è
incentrata sull'accordo, la convenzione, il consenso, il patto, a prescindere dalla
sua realizzazione linguistica. Secondo alcuni linguisti (Vanderlinden 1995: 23),
dato che difficilmente una parola di una lingua corrisponde interamente ad
un'altra parola di un'altra, una metodologia utilizzabile nella traduzione è
rappresentata dal riuscire a decomporre le nozioni giuridiche, far figurare tra i
componenti tutti gli elementi che non corrispondono ad uno o l'altro dei termini
che si cerca di comparare, per poi individuare le caratteristiche comuni di
entrambi al fine di estrapolare il concetto generale.
Di fronte a tale metodo rimane da chiedersi se questa procedura rappresenti già
una forma di interpretazione piuttosto che una traduzione di un messaggio
verbale da un lingua all'altra (Zaccaria 2003 e 2006).
7
2. L'informatica giuridica ed il trattamento dell’i nformazione multilingue
Come già sottolineato nel paragrafo introduttivo, la nascita dell’Unione Europea
ha reso indispensabile una più agile circolazione delle informazioni.
In questo senso lo strumento informatico si inserisce come mezzo ideale per
trasformare i contesti istituzionali in “società trasparenti” e permettere a
chiunque, attraverso uno strumento democratico e veloce, non solo di accedere
a tutte le informazioni disponibili, ma anche di superare l'oggettiva distanza
materiale dalla fonte informativa. L'accelerazione tecnologica rende disponibili
tecnologie di comunicazione ed informazione sempre più potenti, capaci di
trasformare profondamente le organizzazioni pubbliche e private.
Un utilizzo effettivo di tali risorse si lega però inscindibilmente con la concreta
capacità dell'apparato di fornire strumenti affinché il cittadino possa godere di
tali strumenti senza bisogno di intermediazioni.
Il Web è stato progettato come un grande spazio di informazioni, ma queste
ultime sono progettate per essere “mostrate” piuttosto che “comunicate”
(Calzolari e Lenci 2004: 57). Ne consegue che possono essere forniti grandi
quantitativi di dati che nel concreto sono difficilmente gestiti o utilizzati
dall'utente a causa della difficile interazione tra l'uomo e la macchina.
L'utente medio può relazionarsi con la risorsa informatica soltanto attraverso il
linguaggio naturale; ciò comporta il sorgere di alcune complicazioni originate
dalle incongruenze linguistiche che spesso esistono tra i dati archiviati ed il
linguaggio utilizzato per la ricerca.
Il problema di acquisire e gestire la conoscenza depositata nei documenti
testuali dipende dal suo essere codificata all'interno di una rete di strutture e
relazioni grammaticali e lessicali che costituiscono la natura stessa della
comunicazione linguistica. Nel linguaggio infatti, il lessico e le regole per la
combinazione delle parole in strutture sintatticamente complesse si fanno
veicoli degli aspetti multiformi e creativi dei contenuti semantici (Calzolari e
Lenci 2004: 57).
8
La situazione si complica quando l'informazione ricercata è di tipo tecnico. I
domini specialistici utilizzano dei linguaggi tecnici che sono difficilmente
conosciuti da un utente non specialistico. Le caratteristiche dei linguaggi
settoriali sono principalmente due: in primo luogo la loro insostituibilità per lo
studio di una determinata disciplina e per l’esercizio di un’attività; in secondo
luogo la loro attitudine ad indicare l’appartenenza ad un gruppo di individui uniti
da legami di interessi e conoscenze più stretti di quelli che intercorrono
normalmente tra i membri di una comunità linguistica. Le informazioni sono
quindi prodotte con un linguaggio molto distante da quello utilizzato dall'uomo
della strada. Quest'ultimo molto spesso è incapace di recuperare e di
consultare tali informazioni, oppure pur riuscendo a rintracciarle, queste
risultano comunque incomprensibili.
3. Gli strumenti semantici nella ricerca di informa zione giuridica
Al fine di migliorare l’accesso all’informazione, la ricerca si è focalizzata sullo
sviluppo di strumenti che, superando i limiti di una ricerca di informazioni basata
sulla rappresentazione grafica di un termine, permettano di avvicinarsi al
contenuto e di conseguenza anche al contesto in cui un termine è utilizzato
(Roventini et al. 2003).
Gli sviluppi più recenti della linguistica computazionale e del Natural Language
Engineering hanno creato soluzioni tecnologiche dalle enormi potenzialità per
migliorare la ricerca e gestione intelligente dell’informazione contenuta nei
documenti testuali. All’interno di questi ambiti di ricerca si tenta di sviluppare
delle metodologie che attraverso il linguaggio macchina rendano possibile
veicolare i contenuti là dove il termine grafico di per sé non è sufficientemente
in grado di farlo11.
11 ”Parte della linguistica studia tutte le denominazioni adottate in una stessa lingua o dialetto,
per designare una medesima cosa o concetto. E’ lo studio delle parole raggruppandole per aree concettuali. Così, mentre la lessicografia ricorre alla descrizione del concetto (cioè dalla parola al concetto), la terminografia, invece, basandosi sul concetto così configurato nell’analisi
9
Le nuove tecnologie della lingua, infatti, permettono ai sistemi informatici di
accedere al contenuto digitale attraverso il Trattamento Automatico della Lingua
(TAL) (Calzolari e Lenci 2004: 60). L’obiettivo dello sviluppo ed
implementazione delle risorse linguistiche diventa quello di arricchire i motori di
ricerca che operano su Internet con strumenti che consentano la ricerca
concettuale e l’accesso a dati eterogenei e multilingue, basandosi su un
modello standardizzato di descrizione del dominio giuridico; tra questi
analizzeremo le reti semantiche quali strumenti per costruire rappresentazioni
del contenuto dei documenti per potenziare l’estrazione di informazione
rilevante da testi (Information Extraction) e la ricerca di documenti redatti in
lingue diverse (Cross-lingual Information Retrieval).
3.1. Le reti semantiche
Le reti semantiche (c.d. lessici semantici) sono strumenti attraverso i quali il
significato dei termini è reso esplicito e comprensibile dai programmi informatici
(Miller 1995). L’utilizzo di tali strumenti è finalizzato ad arricchire i motori di
ricerca che operano su Internet con metodologie che consentano la ricerca
concettuale e l’accesso a dati eterogenei e multilingue, basandosi su un
modello standardizzato di descrizione del dominio giuridico. Queste risorse
sono delle reti di concetti definiti attraverso relazioni di significato che
permettono di descrivere le informazioni. Il concetto rappresentato in una parola
può essere identificato da termini diversi all’interno di uno stesso sistema
linguistico, ma spesso può essere effettivamente reso comprensibile e
raffigurato solo relazionandolo con altri ad esso connessi.
L’accesso multilingue all’informazione giuridica non può basarsi sul semplice
utilizzo della parola, intesa come segno grafico, ma deve diversamente
incentrarsi su una relazione tra concetti. Si cerca quindi di migliorare la capacità
lessicografica, giunge poi alla denominazione del concetto in un contesto di standardizzazione e normalizzazione della parola o concetto” (Tessuto 2006: 120).
10
semantica degli strumenti disponibili attraverso delle risorse che possono
descriverne il contenuto (Tiscornia 2007: 146).
Attraverso tali risorse le unità lessicali costituite da tutti i termini che esprimono
lo stesso concetto, dette varianti, vengono legate da una relazione semantica
‘vicina’ alla sinonimia12 e descritti da una glossa che ne esplicita il senso13. Più
precisamente questi gruppi di termini sono insiemi di parole, basati
sull’equivalenza di significato, che rappresentano un concetto o l’istanza dello
stesso. Ad esempio: il termine del linguaggio comune casa può essere
rappresentato da una pluralità di termini quali abitazione, immobile che sono
principalmente appartenenti al linguaggio tecnico. Attraverso una rete
semantica il termine comune può quindi essere ricercato indifferentemente con
ognuna di queste varianti (Sagri 2007: 78).
In alcune tipologie di lessici14, l’entità atomica è denominata synset e
rappresenta l’insieme di sinonimi, abbreviazioni, sigle, varianti ortografiche e
desuete di uno stesso concetto (Fellbaum 1998).
12 Nell’ambito del linguaggio giuridico non sono previste relazioni di sinonimia vera e propria, poiché ogni termine tecnico è considerato portatore di un significato primario e non sostituibile; di fatto, però gli utenti, soprattutto quelli non prettamente specialistici, sostituiscono ai termini tecnici espressioni utilizzate dal linguaggio comune. Da qui nasce l’opportunità di creare una rete semantica capace di convogliare nello stesso significante le varie tipologie di sinonimi, anche se non secondo un'accezione prettamente tecnica.
13 Il formalismo delle reti semantiche prevede, in linea generale, di rappresentare gli oggetti dell'universo di riferimento attraverso dei grafi orientati in cui i nodi rappresentano i concetti e gli archi rappresentano relazioni tra i concetti.
14 Nel presente contributo sono presi in analisi i lessici della famiglia WordNet. WordNet (http://wordnet.princeton.edu/) e MultiWordNet (http://tcc.itc.it/projects/multiwordnet/multiwordnet.php) sono, infatti, delle reti semantiche disponibili gratuitamente su Internet che attraverso delle strutturazioni di relazioni semantiche permettono non solo di rappresentare concettualmente un dominio linguistico prescelto, ma attraverso le reti lessicali/semantiche sviluppate per le altre lingue europee dal progetto EuroWordNet (finanziato dalla Comunità Europea), permettono un collegamento simultaneo con gli equivalenti concettuali di altre realtà linguistiche. ItalWordNet (IWN) rappresenta la rete semantica sviluppata per l'italiano generico dall'Istituto di Linguistica Computazionale di Pisa del CNR all'interno del progetto IWN. Un approfondimento ed un’estensione sotto l’aspetto giuridico della risorsa IWN è il lessico JurWordNet (JWN), realizzato all’interno di un programma di
11
Ogni synset può essere descritto rappresentando le sue relazioni con altri
concetti e viene poi strutturato e collegato con gli altri termini della
tassonomia15. Le relazioni utilizzate sono basate su relazioni di senso:
iper/iponimia, (corrispondente alla logica relazione di inclusione di una classe in
un’altra), meronimia (o relazione parte-tutto), antonimia (opposizione di
significato), causa (causalità fattiva e non fattiva), implicazione, ruolo, strumento
(tra un oggetto ed il materiale con cui è realizzato), appartenenza, derivazione,
ecc.16
Le differenze di senso (polisemie) sono poi distinte, numerate e definite
mediante relazioni tassonomiche ed associative.
Sono proprio queste diverse tipologie di relazioni che distaccandosi dal ricoprire
la mera funzione di vocabolario giuridico permettono la ricostruzione
concettuale del singolo termine. Non solo il termine viene catalogato secondo le
sue diverse accezioni, ma viene anche collegato tramite relazioni semantiche
ad altri termini che a loro volta ne spiegano e ne chiarificano il senso.
Attraverso tali risorse si passa quindi da quello che può essere rappresentato
come un semplice insieme di parole (processo, procedimento giuridico,
sentenza, tribunale, attore, convenuto ecc.) ad una struttura di parole
esemplificative di una area di conoscenza. Nella rete semantica il termine
procedimento giuridico non solo è considerato equivalente di processo
giuridico, al pari del termine processo, tipico del linguaggio usato dall’utente non
ricerca promosso dall’ITTIG (http://www.ittig.cnr.it/Ricerca/Unita.php?Id=11&T=4). La risorsa JurWordNet è stata quindi strutturata secondo gli stessi principi adottati per la risorsa generica: i nodi della rete sono i synsets (insieme di termini sinonimi organizzati secondo le relazioni previste dal modello generale) che rappresentano dei concetti basilari collegati nella rete da numerose relazioni di senso oltre che da relazioni tassonomiche (Sagri 2002; Sagri et al. 2004).
15 Il synset rappresenta all’interno del progetto l’unità di misura, l’insieme di sinonimi, abbreviazioni, sigle, varianti ortografiche e desuete. Ciascun termine appartenente allo stesso gruppo può essere indistintamente intercambiato all’interno di una stessa frase, senza cambiarne il senso.
16 Il progetto ItalWordNet prevede al suo interno ben 16 tipi diversi di relazioni. Per maggiori dettagli visita http://www.ilc.cnr.it/viewpage.php/sez=ricerca/id=834/vers=ita.
12
specialistico, ma è anche collegato ad altri diversi concetti tramite delle relazioni
che ne descrivono il significato. Il termine procedimento giudiziario ha come
superiore gerarchico il più generale concetto di procedimento e come termini
più specifici processo penale e processo civile. Lo stesso termine è inoltre
collegato da una relazione di causa-effetto con il termine sentenza, e da una
relazione di ruolo con i soggetti coinvolti nel processo: il soggetto agente è
rappresentato dal termine giudice, mentre l’attore ed il convenuto sono
rappresentati come parti passive dello stesso fra loro collegate da una relazione
di “co-ruolo”.
L’uso di un lessico semantico permette all’utente di navigare agevolmente
all’interno delle liste dei descrittori (monotermini o pluritermini), nonché di
selezionare espressioni chiave di suo interesse ed eventualmente espanderle
automaticamente nella specifica sintassi utilizzata dal motore di ricerca,
sostituendo ad ogni lemma individuato la disgiunzione di tutti i descrittori
collegati da relazioni di sinonimia, iperonimia ed iponimia.
La stessa risorsa può al contempo essere utilizzata per distinguere i diversi
significati nei termini polisensi17. Per esempio il termine canone a livello
giuridico rappresenta il senso di “prestazione (in denaro o in natura) oggetto di
un rapporto obbligatorio di stampo contrattuale” e, al tempo stesso, il senso di
una norma giuridica dal carattere universale, caratteristico del diritto canonico.
Per mezzo dell’aggregazione di varianti (termini equivalenti) e della definizione
di relazioni semantiche tra synset, è possibile disambiguare i diversi significati
di un concetto e gestire così il problema della polisemia. Il termine canone
secondo il senso di prestazione sarà collegato con dei termini che ne
permettano la rappresentazione, come affitto, prestazione; mentre il termine
della diversa accezione sarà rappresentato da termini inerenti al diritto
canonico. I principali vantaggi delle reti semantiche risiedono nell’essere
relativamente facili da comprendere, efficienti da elaborare per i calcolatori e
sufficientemente potenti per rappresentare idee e concetti anche complessi.
17 Nel linguaggio tecnico tale operazione è definita “disambiguazione”.
13
3.2. Le reti semantiche come supporto nella localizza zione multilingue
Le reti semantiche oltre che rappresentare un’interessante risorsa per alcune
problematiche legate al reperimento di un’informazione caratterizzata da un
forte tecnicismo18, possono essere utilizzate come utili supporti informatici nel
gestire, comparare, reperire dati multilingue. Dove l’informazione è
caratterizzata non soltanto dal divario linguistico ma anche da quello
concettuale19.
In particolare il progetto europeo Lois20 (Peters et al. 2006) può essere
rappresentativo dell'utilizzo di reti semantiche nell'accesso multilingue
all’informazione giuridica. Nell’ambito del programma E-content, il Progetto
Europeo Lois è stato finalizzato allo sviluppo di uno strumento d’accesso
all’informazione giuridica in sei lingue europee: tedesco, portoghese, ceco,
italiano, olandese, collegate tra loro attraverso l’inglese, per migliorare la
funzionalità nella ricerca di documenti e concetti giuridici multilingue.
18 In questo settore le maggiori difficoltà dell’utente medio sono rappresentate da fatto di non conosce il termine tecnico del concetto ricercato. Ad esempio, alle parole omicidio o uccisione della lingua comune si sostituiscono i sintagmi italiani omicidio preterintenzionale, omicidio premeditato, omicidio colposo. Alcuni esempi del contrasto tra lessico comune e lessico giuridico nella lingua italiana sono i verbi: contrastare qc. ‘contraddire’; ovviare qc. ‘rimediare a’; rispondere a ‘essere responsabile per’, oppure l’uso giuridico di verbi molto comuni, come ad esempio chiedere (o disporre, pronunciare, ecc.). Ci sono poi, a titolo di esempio, altri usi di parole della lingua comune che, in ambito giuridico, hanno subito una risemantizzazione: accendere (un debito, un’ipoteca), accordo, affidamento, arresto, attore. Quindi, si potrebbe forse parlare di una sorta di disturbi alla comunicazione, disturbi che tuttavia hanno ragione di sussistere in virtù della precisione di significato ricercata e come tale istituzionalizzata nella comunicazione specialistica (Tessuto 2006: 167).
19 In tal senso si prevedono almeno tre aspetti di possibile utilizzo dei lessici semantici. In primo luogo come fonte di metadati per il tagging semantico dei testi legislativi (adottabile anche in fase di drafting legislativo come arricchimento dell’editore specialistico in fase di sviluppo). Alle strutture testuali viene aggiunta l’informazione semantica utilizzando i concetti definiti nella rete, individuando le singole disposizioni come entità alternative (non sempre coincidenti) ai segmenti testuali. Ancora, come strumento di supporto a sistemi di information retrieval per facilitare l’accesso a dati eterogenei e multilingue; oppure come base di conoscenza concettuale utilizzabile per l’estrazione di informazioni, per il tagging semantico automatico, per la condivisione di conoscenza (knowledge sharing), per il confronto tra normative.
20 http://www.ittig.cnr.it/Ricerca/materiali/lois/GoalOfLOIS.htm
14
Il lessico semantico di Lois è costituito, secondo la metodologia WordNet, da un
insieme di termini rappresentativi dei concetti basilari del dominio giuridico,
organizzati e collegati nella rete da numerose relazioni di senso e da relazioni
tassonomiche. I concetti sono strutturati utilizzando dei criteri a livello
linguistico, concettuale, ed ontologici, poiché la descrizione dei concetti
coinvolge spesso, nel mondo giuridico, il collegamento fra gli istituti e gli
ordinamenti giuridici. Questa metodologia di descrizione consente una più
agevole comparazione ed un collegamento tra i diversi domini giuridici.
La risorsa è composta da un database lessicale e da un database normativo. Il
primo è una banca dati contenente i principali concetti appartenenti alla dottrina
giuridica; il secondo è un database normativo composto da concetti definiti nelle
direttive comunitarie e nelle leggi di implementazione delle direttive. Per
quest'ultimo sono state previste due particolari relazioni: una relazione
implemented-as che lega i concetti presenti nelle direttive con i concetti definiti
nelle leggi di implementazione ed una relazione di equivalenza o quasi
equivalenza a seconda di una più forte o lieve equivalenza concettuale tra i
concetti implementati nella legislazione nazionale rispetto alle norme
comunitarie.
La struttura di Lois permette di utilizzare dei diversi criteri di collegamento tra
lessici a seconda di due diverse concezioni di equivalenza.
L’equivalenza di tipo semantico, secondo l’accezione di EuroWordNet21
(Roventini et al. 2003), come ad esempio eq-synonym, eq-near-synonym, eq-
hyperonym, è guidata dalla glossa dei concetti e collega i synset della parte
lessicale; la relazione di equivalenza normativa è stabilita sulla base di un
criterio di appartenenza alle stesse fonti normative e collega i concetti estratti
della parte legislativa. Si è inoltre prevista la definizione di criteri di interazione e
collegamento semantico delle due banche dati.
21 Per maggiori dettagli sul progetto EuroWordNet cfr. http://www.illc.uva.nl/EuroWordNet/.
15
Lo sviluppo della risorsa linguistica ha previsto due fasi distinte: la prima volta
all'editing delle reti lessicali giuridiche corrispondenti a ciascuna lingua
coinvolta, la successiva di confronto e collegamento tra i diversi contesti
linguistici dei singoli membri del progetto.
Al fine di garantire una copertura lessicale simile per le diverse lingue del
progetto si è proceduto quindi alla codifica di dati a partire da un insieme di
lemmi considerati rappresentativi dei concetti essenziali del dominio giuridico
nei singoli ordinamenti.
Per quanto concerne la sezione italiana del progetto, una volta selezionato un
gruppo rappresentativo del dominio italiano, si è proceduto a strutturarlo
all’interno della rete semantica. Ciascun basic term, considerato come possibile
root di una sotto-gerarchia di termini, è stato prima definito e poi collegato ad
altri secondo le relazioni linguistiche previste, in particolare attraverso le
relazioni di sinonimia e quelle di iper/iponimia. A questa fase ha fatto seguito
una fase successiva che prevede il collegamento tra gli specifici database per
ciascuna lingua (Peters et al. 2007).
Queste prime operazioni hanno consentito di individuare una parte delle
corrette relazioni semantiche fra termini in due lingue diverse. Ad esempio è
stato possibile disambiguare le due diverse accezioni del lemma contratto,
senso n.1 documento e senso n.2 accordo di volontà. Infatti utilizzando
l’iperonimo documento, il senso n.1 di contratto è stato collegato a “instrument:
document that states some contractual relationship or grants some right”; il
senso n.2 a “contract: a binding agreement between two or more persons that is
enforceable by law”. Come ulteriore esempio, il lemma diritto in italiano ha due
accezioni, “facoltà derivante da norme o consuetudini”, oppure “complesso di
norme legislative o consuetudinarie che regolano i rapporti sociali”; in inglese la
prima corrisponde a right, la seconda a law. Successivamente attraverso il
confronto automatico fra italiano ed i termini stranieri è stato possibile collegare
le corrette traduzioni utilizzando le relazioni di iponimia: infatti, diritto pubblico
viene correttamente tradotto con public law, e da questo si crea il corretto
iperonimo law (Peters et al. 2007).
16
3.3. Metodologie alternative per la descrizione dei contenuti giuridici
All'interno della linguistica computazionale si sono sviluppate anche altre
metodologie per la creazione di risorse semantiche. Di particolare interesse
risulta quelle sviluppata da Charles J. Fillmore, presso l'Università di Stanford,
basata su una grammatica dei casi, la c.s. semantica dei frame;
rappresentazioni del lessico organizzate sulla base di frame semantici, correlati
ad esempi di occorrenza testuale (Fillmore e Atkins 1992).
I frame sono strutture di dati che rappresentano o schematizzano situazioni
stereotipate che si configurano come una via di accesso lessicale alle situazioni
descritte.
La struttura usata in FrameNet si basa sulla teoria linguistica secondo la quale
ogni predicato ha una sua struttura argomentale, richiede un numero di
argomenti che indicano i partecipanti minimamente coinvolti nell'attività o nello
stato espressi dal verbo stesso. La relazione semantica tra il verbo ed i suoi
argomenti, o ruolo tematico, assegna un ruolo a ciascuno dei suoi argomenti.
L'informazione sulla relazione semantica tra il predicato ed i suoi argomenti è
registrata nel lessico e fornisce una griglia tematica in cui si ottiene la
rappresentazione del tipo di ruolo semantico espresso da un argomento. Ad
esempio il contratto di vendita, previsto dall' art. 1470 del c.c., può essere
rappresentato da una forma verbale rappresentativa dell'azione di contrarre,
dove i soggetti coinvolti, venditore e compratore, rispettivamente l'agente ed il
paziente dell'azione, sono coinvolti in un accordo, attraverso il quale incombe
l'obbligo di pagare un prezzo.
La struttura argomentale di un predicato, codificata nella griglia tematica,
stabilisce così quali siano i componenti minimi della frase.
Tale metodologia, diversamente da quelle utilizzate nelle risorse WN, sembra
permettere una rappresentazione più completa del contenuto, soprattutto là
dove viene utilizzata per definire una relazione di equivalenza funzionale.
17
Nel contesto giuridico multilingue infatti, la coesistenza dei diversi istituti
giuridici, organi, istituzioni esistenti nei differenti ordinamenti, può implicare che
un particolare concetto giuridico non esista in tutti i contesti normativi. E' invece
probabile che i due differenti ordinamenti condividano le stesse azioni
giuridiche: ordinare, legiferare, sanzionare, eleggere. Ne consegue che la
rappresentazione schematica di tali azioni, secondo la struttura del frame,
permette di riconoscere immediatamente il tipo di azione senza dover
necessariamente riconoscere l'organo o l'istituto coinvolto.
4. Ontologie formali
Mentre i lessici intendono facilitare l'informazione, migliorando il reperimento dei
contenuti sul web, le ontologie formali nascono con l'obiettivo più ambizioso di
rafforzare il processo di apprendimento, la conoscenza (Visser e Bench Capon
1999). Lo scopo delle ontologie è di codificare in un linguaggio artificiale (la
logica formale) gli elementi di conoscenza necessari alla comprensione; questi
vengono utilizzati dai linguaggi del Semantic Web per aggregare alle
informazioni testuali disponibili su Internet la descrizione concettualizzata dei
contenuti (semantic tagging). In certi settori, ad esempio nel commercio
elettronico e nel trattamento dei diritti digitali, la conoscenza viene totalmente
trasferita nel modello ontologico; essa diventa in tal modo comprensibile anche
dai programmi che sono a loro volta in grado di generare, attraverso passaggi
inferenziali, nuova conoscenza (machine-understandable knowledge bases).
Esiste un’enorme letteratura in tema di ontologie formali: molte classificazioni
(ontologie fondazionali, core, di dominio), una notevole quantità di risorse
realizzate, molte varietà di metodologie e di strumenti per la costruzione di
ontologie.
In questa sede parliamo di ontologie esclusivamente in relazione al trattamento
del multilinguismo nel dominio giuridico ed in particolare per evidenziare le
differenze con le ontologie leggere già descritte e per valutare i vantaggi
metodologici che derivano dall'ancoraggio della semantica 'leggera' dei lessici
computazionali alla robusta struttura assiomatica delle ontologie.
18
Rispetto alle reti terminologiche tradizionali i lessici computazionali presentano
elementi di maggiore flessibilità e ricchezza espressiva, ma mantengono una
forte dipendenza dai contesti linguistici. Le terminologie tradizionali rispondono
ad una esigenza di standardizzazione che richiede l'elezione di un termine al
rango di concetto univoco, mentre nei lessici computazionali non esiste una
corrispondenza uno a uno fra termini, ma affinità o sovrapposizioni semantiche
fra (insiemi di) termini (i synset). La polisemia viene mantenuta e esplicitata (un
termine può avere word sense appartenenti a synset diversi).
Inoltre, mentre nelle costruzione di risorse terminologiche multilingue il
collegamento cross-lingual fra i concetti è stabilito manualmente da esperti del
dominio, nei lessici semantici l'equivalenza semantica è di norma basata sulla
individuazione di un linguaggio pivot che funge da interlingua. In EuroWordNet
(e in Lois) l'indice interlingua, esemplificato nella Figura 1, collega termini
espressi nelle varie lingue attraverso le relazioni di equivalenza stabilite con il
concetto inglese, descritto da una glossa (un’espressione linguistica espressa
in inglese). Si tratta dunque di una comparazione di termini a livello concettuale
ma pur sempre dipendente da un sistema linguistico. Questo perché le relazioni
semantiche dei lessici (iponimia, meronimia, ruolo) non sono di per sé sufficienti
a cogliere le assunzioni di significato dei concetti in modo così profondo da
consentirne la comparazione.
Figura 1: Il collegamento interlingua nei lessici W ordNet
19
La costruzione di risorse semantiche richiede un massiccio lavoro manuale e
comporta il rischio che si generino inconsistenze nella strutturazione semantica.
Per raggiungere un grado di concettualizzazione più accurato, occorre
introdurre delle strutture di conoscenza più astratte, condivise e indipendenti dai
sistemi linguistici, che consentano al tempo stesso di mantenere il collegamento
dei concetti ai contesti e di salvaguardare la molteplicità sincronica
(multilinguismo) e diacronica (evoluzione del significato).
Il ruolo delle ontologie formali è appunto quello di fornire i fondamenti cognitivi
(ed il vocabolario) per la concettualizzazione formale di un dominio. Le
categorie che popolano il modello ontologico classificano i concetti che
appartengono al lessico (Gangemi et al. 2003b). Questo è il ruolo degli
strumenti ontology-based nella gestione di dati multilingue (o eterogenei in
senso lato, ad esempio, dati multimediali).
People understand the world via cognitive frames […] or models […] in which prototype-structured units of understanding are related [...]. What is named by the same term in different texts can be shown to have different referents. More often than not a category cannot be clearly delineated. It is like a chunk of knowledge which has a core and a structure but which exists in a process of continuing reformulation and is therefore in constant transition. (Temmerman et al. 2006: 303)
Questo approccio, applicato con risultati positivi anche nel dominio giuridico
(oltre al già citato progetto Lois si vedano Syllabus (Lesmo et al. 2007) e Dalos
(Francesconi et al. 2007: 404)) ha per altro generato varie e molto dibattute
questioni metodologiche: si deve costruire una struttura ontologica formale
come un elemento 'terzo' di descrizione del dominio, autonomo rispetto ai
sistemi lessicali, o si deve introdurre la descrizione del dominio all'interno dei
lessici, arricchendo la struttura di relazioni semantiche con relazioni proprie del
dominio?
Nel primo caso, l'ontologia formale si pone ad un livello di astrazione maggiore
rispetto a quello lessicale, nel secondo è il lessico stesso ad essere trasformato
in una ontologia di dominio. Nel seguito vengono illustrati con esempi i diversi
ruoli svolti dalla componente ontologica. La Fig. 2 illustra con un esempio il
primo caso, cioè l'interconnessione fra distinti livelli ontologici e lessicali. I
20
concetti che popolano il lessico costituiscono il livello di base: essi sono
'classificati' dalle categorie della Core Legal Ontology.
Figura 2: Interconnessione fra livelli ontologici e lessicali
Le ontologie core per il diritto intendono coprire quella parte della conoscenza
del mondo creata dalle norme, rielaborata dalla teoria giuridica e che può
essere considerata condivisa in una ampia comunità sociale (Gangemi et al.
2003a). Ad esempio, entità di conoscenza (unit of understanding) come reato,
diritto, sanzione, contratto, proprietà, testimonianza, giudice, norma ecc. sono
descritte nell'ontologia core per mezzo di proprietà/attributi: in termini formali da
insiemi di espressioni di logica del primordine. Tali descrizioni catturano gli
elementi cognitivi di senso comune sottostanti i processi di comunicazione e
possono perciò essere 'compresi' universalmente e collegati alle loro molteplici
realizzazioni linguistiche. Costituiscono al tempo stesso la struttura prototipica
di riferimento per la comparazione di concetti ed istituti nei diversi sistemi
normativi e per monitorare l'evoluzione di significato di nozioni giuridiche
attraverso l'elaborazione giurisprudenziale. Anche nel settore delle legal
ontologies esiste una ricca letteratura e varie proposte di ontologie core. In
questa sede facciamo in particolare riferimento alla Core Legal Ontology
costruita come estensione per il mondo del diritto dell'ontologia fondazionale
Dolce (Masolo et al. 2003). Dolce è un‘ontologia fondazionale, o di alto livello, in
quanto include nozioni di base ad un livello di alta astrazione e riccamente
21
assiomatizzate. Per la descrizione delle ontologie formali rinviamo alla
vastissima letteratura disponibile.
Nell'esempio in Fig. 2 il concetto (synset) espresso dai termini legal evidence,
legal proof viene classificato dalle categorie ontologiche legal document e legal
description. La duplice appartenenza ontologica esprime due delle prospettive
con cui il concetto può essere inteso nel senso comune, sia come contenitore
fisico di informazioni, vale a dire un documento contenente la prova
testimoniale, o come contenuto informativo dotato di valore giuridico. Nulla
esclude che altre possibili 'viste' del medesimo concetto possano essere
rappresentate nell'ontologia, ad esempio il concetto di prova dal punto di vista
della medicina legale farà riferimento anche ad elementi del mondo fisico.
L'ontologia rimane dunque esterna al lessico come criterio ordinante in grado
di:
• rendere esplicite molteplici assunzioni di significato, non rilevate dalla
semantica lessicale, come nell'esempio sopra illustrato. Ciò consente
anche di guidare la corretta localizzazione linguistica dei concetti nella
costruzione di lessici multilingue, ad esempio nel caso in cui alla diversa
prospettiva ontologica, non evidenziata dalla glossa, corrisponda una
diversa lessicalizzazione.
• distinguere i sensi dei termini polisemici. Come è stato illustrato
nell'esempio di canone, i lessici computazionali consentono la
numerazione dei sensi (word sense) nei termini polisemici. Con la
classificazione ontologica, non è più necessaria la specificazione dei
significati contenuta nella glossa.
• arricchire le informazioni sugli elementi di conoscenza condivisi
(meaning agreement) che sottostanno ai processi cognitivi e
comunicativi di senso comune. Va notato che, a differenza dei lessici
computazionali, nelle ontologie la relazione di sussunzione fra classi e
sottoclassi (relazione ISA) è logicamente valida, perciò ogni elemento
eredita proprietà/attributi della classe superiore. Ogni classe si
differenzia dal suo genus per la presenza di ulteriori elementi di
specificità che nel linguaggio delle ontologie sono espressi come vincoli,
cioè restrizioni di significato (intenzionale) rispetto alla classe più ampia:
22
ad esempio, municipality, in Fig. 2, appartiene alla classe delle legally
constructed institutions, sottoclasse delle entità sociali. Le proprietà
specifiche della classe legally constructed institution ereditate da
municipality sono: essere dipendente da norme giuridiche ed in
particolare essere costituita da norme costitutive, essere rappresentata
da un soggetto giuridico identificato da una persona fisica. Nella
ontologia Dolce, ad un livello ancora maggiore di astrattezza, i social
object sono entità che popolano la realtà sociale, che vengono percepite
e comprese dal senso comune sulla base di convenzioni sociali ed a cui
viene riconosciuta una esistenza concreta affine a quella degli oggetti
fisici (Gangemi et al. 2005).
Tutta questa conoscenza implicita, che può sembrare ridondante nello stabilire
equivalenze terminologiche, diventa però molto importante per consentire il ri-
uso, l'integrazione, l'aggiornamento della risorsa lessicale, oltre che a guidare la
costruzione di ontologie su domini giuridici ristretti (ad esempio, il diritto
d'autore, il diritto contrattuale, ecc.) o quando si voglia allineare il lessico con
l'ontologia.
Questa seconda ipotesi metodologica comporta l’interpretazione delle relazioni
lessicali in termini di relazioni logiche, in particolare la trasformazione delle
relazioni tassonomiche in relazioni classe-sottoclasse. Il passaggio richiede un
controllo manuale della consistenza, in quanto non sempre nelle tassonomie
lessicali viene rispettata la distinzione fra relazioni di sussunzione o di istanza in
senso proprio; ad es., l'Autorità per la Protezione dei dati che in un lessico può
essere considerato iponimo di Autorità, nell'ontologia è istanza di Organismo
pubblico. La Tabella 1 riporta la corrispondenza fra le relazioni WordNet e le
proprietà dell'ontologia. Per maggiori dettagli si veda il progetto OntoWordNet22,
volto ad allineare WordNet inglese all'ontologia Dolce.
22 http://www.w3.org/TR/wordnet-rdf/.
23
Relazioni Wordnet Proprietà in Dolce+CLO
Hyponym/hyper/nym, instance_of, meronym
ISA (sub-class-of), instance_of, part-of, member_of, constituent-of
ogni word sense che compone il synset same_as
role, cause assiomi e proprietà del dominio
Tabella 1: La corrispondenza fra le relazioni WordN et e le proprietà dell'ontologia
Come esempio del risultato finale del processo, la Fig. 3 mostra la
rappresentazione ontologica del concetto proprietà: si noti come, a differenza
dei lessici, in cui ciascun sistema linguistico ha una struttura autonoma basata
su relazioni semantiche interlinguistiche, e collegata da relazioni
interlinguistiche di equivalenza alle altre, nell'ontologia il modello è unico e la
proprietà has-IT-name, has EN-name collega la concettualizzazione al
linguaggio.
Figura 3: La rappresentazione ontologica del concet to proprietà
Conclusioni
Il contributo intende fare il punto sulle metodologie fornite dall'Information
Technology nel trattamento del multilinguismo nei settori specialistici, in
particolare nel settore giuridico. Il tema del multilinguismo nel diritto è molto
24
complesso e richiede una attenzione particolare agli aspetti culturali, storici,
sociali che sottostanno a tutti i fenomeni linguistici ed alla loro analisi. Non si
può parlare di traduzione del diritto, ed infatti non si è fatta menzione dei
progressi raggiunti dalle tecniche di traduzione automatica nel settore del
linguaggio comune e del parlato, ma di rapporti di equivalenza concettuale fra
concetti e nozioni giuridiche. L'utilizzo delle tecniche informatiche presuppone
perciò un processo di concettualizzazione manuale o semiautomatico, su cui i
modelli computazionali intervengono offrendo strutture, metodologie e linguaggi
a gradi progressivi di formalizzazione. Le scelte metodologiche dipendono dagli
obiettivi, dalla complessità del dominio, dai risultati pratici che si intendono
raggiungere.
Bibliografia
Ajani, G. e M. Ebers (a cura di) (2005) Uniform Terminology for European
Contract Law, Baden Baden: Nomos.
Ajani, G. e P. Rossi (2006) “Coerenza del diritto privato e multilinguismo”, in B.
Pozzo (a cura di) Le politiche linguistiche delle istituzioni comunitarie dopo
l'allargamento, Milano: Giuffré, 119-139.
Azzena, L. (2007) “La costruzione del principio di uguaglianza nell’ordinamento
comunitario”, Diritto pubblico comparato ed europeo 3: 1419-1440.
Bin, R. e G. Petruzzella (2005) Diritto pubblico, Torino: Giappichelli.
Calzolari, N. e A. Lenci (2004) “Linguistica Computazionale - strumenti e risorse
per il trattamento automatico della lingua”, Il mondo digitale 2: 56-64.
Cannanea, G. (2003) L'Unione europea: un ordinamento composito, Roma:
Laterza.
Cosmai, D. (2007) Tradurre per l'Unione Europea. Problematiche e strategie
operative, Milano: Hoepli.
25
Costanzo, P. (2006) “Nuove tecnologie e “forma” dell’amministrazione”, in P.
Costanzo, G. De Minico e R. Zaccaria (a cura di) I tre codici della Società
dell'Informazione. Amministrazione digitale. Comunicazioni elettroniche.
Contenuti audiovisivi, Torino: Giappichelli, 4-20.
Cuocolo, F. (1999) Principi di diritto costituzionale, Milano: Giuffrè.
De Groot, G-R. (2000) “La traduzione di informazioni giuridiche”, Ars
Interpretandi 5: 133-154.
Fellbaum, C. (1998) WordNet: An electronic lexical database, Cambridge: The
MIT Press.
Fillmore, C.J. e B.T.S. Atkins (1992) “Towards a Frame-based organization of
the lexicon: the semantics of RISK and its neighbors”, in A. Lehrer e E.F. Kittay
(a cura di) Frames, Fields, and Contrasts: New Essays in Semantics and
Lexical Organization, Hillsdale: Lawrence Erlbaum, 75-102.
Francesconi, E., P. Spinosa e D. Tiscornia (2007) “A linguistic-ontological
support for multilingual legislative drafting: the DALOS Project”, in P.
Casanovas, M.A. Biasiotti, E. Francesconi e M.T. Sagri (a cura di) Proceedings
of LOAIT ’07, II Workshop on Legal Ontologies and Artificial Intelligence
Techniques, 103-112. Disponibile online: http://www.ittig.cnr.it/loait/loait07.html.
Gangemi, A., M.T. Sagri e D. Tiscornia (2003a) “Metadata for Content
Description in Legal Information”, in Proceedings of the ICAIL 2003 Workshop
on Legal Ontologies. Disponibile online: http://www.loa-cnr.it/Papers/ICAIL.pdf.
Gangemi, A., N. Guarino, C. Masolo e A. Oltramari (2003b) “Sweetening
WordNet with DOLCE”, AI Magazine 24(3): 13-24.
Gangemi, A., M.T. Sagri e D. Tiscornia (2005) “A Constructive Framework for
Legal Ontologies”, in V. Richard Benjamins, P. Casanovas, J. Breuker e A.
Gangemi (a cura di) Law and the Semantic Web, Berlin: Springer, 77-96.
26
Ioratti Ferrari, E. (2005) “Lingua e diritto in Europa: multilinguismo, pluralismo
linguistico e terminologia giuridica uniforme nel diritto europeo dei contratti”,
Diritto pubblico Comparato ed europeo IV: 1549-1568.
Lesmo L., G. Boella, A. Mazzei e P. Rossi (2007) “Multilingual conceptual
dictionaries based on ontologies: analytical tools and case studies”, in G. Ajani,
G. Peruginelli, G. Sartor e D. Tiscornia (a cura di) The Multilanguage
Complexity of European Law: Methodologies in Comparison, Firenze: European
Press Academic Publishing, 179-194.
Masolo, A., S. Borgo, A. Gangemi, N. Guarino e A. Oltramari (2003)
WonderWeb Deliverable D18, Ontology Library. Disponibile online: www.loa-
cnr.it/Papers/D18.pdf.
Migliazza, M. (2002) Il diritto all'Informazione nell'Unione Europea, Milano:
Giuffrè.
Miller, G. (1995) “WordNet: A lexical database for English”, in Communications
of the ACM 38(11): 39-41.
Peters, W., M.T. Sagri, D. Tiscornia e S. Castagnoli (2006) “The LOIS Project”,
in Proceedings of the 5th International Conference on Language Resources and
Evaluation (LREC) (Genova, 23-27 maggio 2006), 1089-1094.
Peters, W., M.T. Sagri e D. Tiscornia (2007) “The Structuring of Legal
Knowledge in LOIS”, Journal of Artificial Intelligence and Law 15: 117-135.
Pozzo, B. (2006) “Multilinguismo, terminologie giuridiche e problemi di
armonizzazione del diritto privato europeo”, in B. Pozzo e V. Jacometti (a cura
di) Le politiche linguistiche delle istituzioni comunitarie dopo l'allargamento,
Milano: Giuffrè, 3-18.
----- e V. Jacometti (a cura di) (2006) Multilingualism and the Harmonisation of
European Law, The Netherlands: Kluwer Law International.
Ricoer, P. (2000) “Il paradigma della traduzione”, Ars Interpretandi 5: 1-17.
27
Rossi, P. (2007) “Il diritto plurilingue europeo nella prospettiva del legislatore
comunitario e dell’interprete nazionale”, Politica del diritto 38(1): 139-147.
Roventini, A., A. Alonge, F. Bertagna, N. Calzolari, J. Cancila, C. Girardi, B.
Magnini, R. Marinelli, M. Speranza e A. Zampolli (2003) “ItalWordNet: Building a
Large Semantic Database for the Automatic Treatment of the Italian Language”,
in A. Zampolli, N. Calzolari e L. Cignoni (a cura di) Computational Linguistics in
Pisa, Special Issue of Linguistica Computazionale Vol. XVIII-XIX, Pisa-Roma:
Istituto Editoriale e Poligrafico Internazionale, 745-791.
Sacco, R. (1991) La comparaison juridique au service de la connaissance du
droit, Parigi: Economica.
----- (1995) “Negozio giuridico, circolazione del modello”, in Digesto delle
discipline privatistiche, sez. civile 12: 86-95.
----- (2000) “Lingua e diritto”, Ars Interpretandi 5: 117-134.
Sagri, M.T. (2002) “Strumenti semantici per l’accesso all’informazione giuridica:
JurWordNet”, Informatica e diritto 28(2): 185-210.
----- (2007) “Strategie per migliorare la rilevanza delle informazioni reperite.
Dalla descrizione semantica alla descrizione logica”, in G. Taddei Elmi (a cura
di) Corso di informatica giuridica, Napoli: Simone, 76-85.
-----, D. Tiscornia e F. Bertagna (2004) “Jur-WordNet“, in P. Sojka, K. Pala, P.
Smrz, C. Fellbaum e P. Vossen (a cura di) Proceedings of the Second
International WordNet Conference --- GWC 2004 (Brno, Czech Republic 20-23
gennaio 2004), 305-310.
Schena, L. e R.D. Snel Trampus (2002) (a cura di) Traduttori e giuristi a
confronto: interpretazione traducente e comparazione del discorso giuridico,
Bologna: CLUEB.
Schioppa, F. (2002) Rapporto sullo Stato dell’Unione Europea, Istituto di Studi
ed Analisi Economica, Bologna: Il Mulino.
28
Temmerman, R., K. Kerremans e P. De Baer (2006) “Sociocognitive
terminology and Termontography”, in Proceedings of the Journées d'Etudes sur
le Traitement Automatique de la Langue Arabe (Rabat, Marocco, 5-7 giugno
2006), 290-313.
Tessuto, G. (2006) English for law. A focus on legal concepts and language,
Milano: Giappichelli.
Tiscornia, D. (2007) ”Structuring multilingual ontologies for law”, in G. Ajani, G.
Peruginelli, G. Sartor e D. Tiscornia (a cura di) The Multilanguage Complexity
of European Law: Methodologies in Comparison, Firenze: European Press
Academic Publishing, 145-162.
Vanderlinden, J. (1995) Comparer le droit, Diegem: Kluwer.
Visser, P.R.S e T. Bench Capon (1999) “Ontologies in the Design of Legal
Knowledge Systems, Towards a Library of Legal Domain Ontologies”, in
Proceedings of Jurix 99, Leuven, Belgique, 30-44.
Wroblewski, J. (2000) “Il problema della traduzione giuridica”, Ars intrepretandi
5: 155-164.
Zaccaria, G. (2003) “Testo, contesto e linguaggi settoriali nell’interpretazione
giuridica”, in A. Mariani Marini (a cura di) La lingua, la legge, la professione
forense, Giuffrè: Milano, 90-102.
----- (2006) “Tradurre e interpretare”, Ars intrepretandi 1: 197-206.