Il rischio di credito Francesco Romito Università RomaTre, 1Q 2009
Il rischio di credito
Francesco Romito
Università RomaTre, 1Q 2009
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze – I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
Default risk e credit risk• Default risk: rischio che un affidato, un emittente ovvero
una controparte non onori i suoi obblighi di pagamento • Credit risk: rischio di default ovvero di riduzione del
valore di mercato causata da cambiamenti del merito creditizio dell’emittente, dell’affidato ovvero della controparte
• Rischio collegato: Liquidity Risk– Effetti prezzo e quantità– Esempi recenti default Russia nel 1998, scandalo Enron 2001,
subprime crisis 2007.• Default events
– I default sono rari e accadono inaspettatamente– Comportano perdite significative il cui importo è ignoto prima del
default
Default: le possibili definizioni
• Status giuridico: amministrazione straordinaria, Liquidazione, Chapter 11
• Regolamentazione finanziaria: sofferenze, incagli, ristrutturate, Past due
• Classificazioni interne degli intermediari• Prassi di specifici mercati (es., CDS)
Definizione regolamentare post Basilea II
• Per esposizioni in default si intendono: sofferenze, incagli, crediti ristrutturati, crediti scaduti e/o sconfinanti (past due).
• Rientrano tra i crediti scaduti e/o sconfinanti quelli per cui:– il debitore è in ritardo su una obbligazione creditizia rilevante verso la banca o il
gruppo bancario da: • (i) oltre 180 per i crediti al dettaglio e quelli verso gli enti del settore pubblico; • (ii) oltre 180 - fino al 31.12.2011 - per i crediti verso le imprese; • (iii) oltre 90 per gli altri;
– la soglia di “rilevanza” è pari al 5% dell’esposizione.
• Resta ferma la possibilità di utilizzare, per le filiazioni del gruppo operanti in altri Stati comunitari o del Gruppo dei Dieci, la definizione di default adottata dalle locali autorità di vigilanza.
• Non determinano un default le seguenti modifiche delle originarie condizioni contrattuali: il riscadenzamento dei crediti e la concessione di proroghe, dilazioni, rinnovi o ampliamenti di linee di credito. Tali modifiche non devono dipendere dal deterioramento delle condizioni economico-finanziarie del debitore ovvero non devono dare luogo a una perdita.
Rilevanza del rischio di credito• Durante la crisi giapponese negli anni ’90 le
perdite cumulate sono state pari a $ 550 billion• Attuale crisi: stimati più di $ 1000 billion ??
• Principali cause:– Elevato livello di leverage e scoppio della real estate
bubble– Deficienze nel risk management– Inadeguati standard di concessione– Carenze della supervisione finanziaria
E’ più importante del rischio di mercato?
• Derivatives market– Orange County (Dec 1994) Reverse repos 1,810– Showa Shell Sekiyu (Feb. 1993) Currency forwards 1,580– Kashima Oil (Apr. 1994) Currency forwards 1,450– Metallgesellschaft (Jan. 1994) Oil futures 1,340– Barings (Feb. 1995) Stock index futures 1,330
• Credit market– Japan (1990s) Bad loans 550,000– China (1990s) 4 state banks insolvent 498,000– US (1984-91) 1400 S&L, 1300 banks fail 150,000– South Korea (1998-) Restructuring of banks 90,000– Worldwide (2007-20??) Subprime and delevereging ??
Le misure del rischio di credito: credit rating
I credit ratings delle tre grandi agenzie di rating (Standard & Poor’s, Moody’s e Fitch) forniscono indicazioni sul merito creditizio degli emittenti
I Credit ratings poossono essere divisi in due classi:1 Investment grade (da “Aaa” a “Baa” ovvero da “AAA” a “BBB”)2 Speculative grade
Corporate spreads
Mortage e FED rates
Corporate spreads e maturity
La probabilità di default o di insolvenza cresce al peggiorare del rating…
Historical Default Probabilities
Average default frequencies delle classi di rating S&Pper diversi orizzonti temporali da 1 a 10 anni (in %).
Come cambia il rischio (ed il rating)?
Fonte: Standard & Poor’s
Componenti del rischio di credito• Arrival Risk: incertezza derivante dalla manifestazione o meno del default
– Probability of Default (PD)
• Timing Risk: incertezza connessa al tempo della manifestazione del default
• Recovery Risk: severità delle perdite in caso di default– Distribuzione del recovery rate (RR=1-LGD)
• Market Risk: cambiamenti nel valore di mercato di uno strumento dovuti a cambiamento del merito creditizio o delle condizioni di mercato (incl. migrationrisk).
• Default Correlation Risk: rischio che più emittenti/affidati/controparti vadano in default simultaneamente ovvero in sequenza– Arrival & Timing Risks
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze – I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
Sistema di rating• Insieme strutturato e documentato delle metodologie,
dei processi organizzativi e di controllo, delle modalità di organizzazione delle basi dati che consente la raccolta e l’elaborazione delle informazioni rilevanti per la formulazione di valutazioni sintetiche della rischiosità di una controparte e delle singole operazioni creditizie.
• Il rischio connesso con un’esposizione è espresso attraverso quattro componenti:– probabilità di default (PD), che attiene al debitore; – tasso di perdita in caso di default (LGD), – esposizione al momento del default (EAD) – scadenza effettiva (M).
Definizione
Elementi Rischio di Credito attengono alla
singola operazione
Portafogli creditizi: altri elementi per la determinazione della rischiosità
• Granularità: grado di concentrazione (hpBIS II granularità infinita)
• Correlazione tra prenditori, aree geografiche, settori di attività (nell’accordo approccio semplificato per portafogli e livelli di PD)
Sistema di rating• Attraverso il sistema di rating la banca:
– attribuisce al debitore il grado interno di merito creditizio (rating), ordinando le controparti in relazione alla loro rischiosità;
– perviene a una stima delle componenti di rischio.
• Il rating rappresenta la valutazione, riferita a un dato orizzonte temporale, effettuata sulla base di tutte le informazioni ragionevolmente accessibili – di natura sia quantitativa sia qualitativa – ed espressa mediante una classificazione su scala ordinale, della capacità di un soggetto affidato o da affidare di onorare le obbligazioni contrattuali.
• Ad ogni classe di rating è associata una probabilità di default.
• Le classi di rating sono ordinate in funzione del rischio creditizio: muovendo da una classe meno rischiosa a una più rischiosa, la probabilità che i debitori risultino in default è crescente.
Il Nuovo Accordo di Basilea consente di scegliere tra tre approcci per il calcolo del requisito patrimoniale minimo per il rischio di credito
Standard
IRB Foundation
IRB Advanced
L’attivo ponderato viene calcolato come per Basilea I in base a ponderazioni fisse. Sono introdotti rating “esterni” per le controparti Corporate Banche e Paesi e definito un nuovo trattamento delle garanzie, dei derivati e delle cartolarizzazioni
L’attivo ponderato viene calcolato come funzione di 4 elementi costituenti il rischio di credito , con utilizzo di stime interne per determinare la PD, mentre gli altri elementi (LGD/EAD/M) sonostandard in quanto definiti a priori dalla normativa
L’attivo ponderato viene calcolato come funzione dei 4 elementi costituenti il rischio di credito con utilizzo di stime interne
Inte
rnal
Rati
ng
B
ase
d(I
RB
)
Il nuovo Accordo: Basilea 2Il nuovo Accordo: Basilea 2
Sistema IRB: overview
Classi di attività
SISTEMA DI RATING
PD LGD EAD M
Criteri minimi
Funzioni di ponderazione
Ponderazioni e requisiti
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze– I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
Le fasi della stima di un modello quantitativo per la PD
• L’obiettivo è ottenere un indicatore – che differenzi in modo significativo imprese
“normali” e in crisi– che permetta di ottenere una graduazione del
livello di rischio associato ad ogni impresa
• Le fasi della stima di un modello:1) Definizione del default2) Formazione del campione di stima 3) Stima del modello4) Verifica dell’efficacia su un campione indipendente
La formazione del campione di stima
• Una volta definito il default, si selezionano le imprese appartenenti ai due gruppi alternativi (default vs. non default)
1) ... cercando di costruire campioni ampi;2) e che rappresentino l’universo delle imprese da
classificare
NB. L’utilizzo di “filtri” arbitrari nella selezione delle imprese (ad esempio, per eliminare “dati anomali”) può distorcere:
• L’individuazione della regola di classificazione• La valutazione della performance del modello nel
separare i due gruppi
• Per ogni impresa selezionata è opportuno raccogliere informazioni precedenti il default, per identificare i “sintomi” più efficaci della crisi.
• Normalmente si ritiene adeguato un orizzonte di valutazione annuale
• Non è importante rispettare esattamente la proporzione numerica tra i due gruppi nell’universo, ma è opportuno un bilanciamento delle caratteristiche “operative” (es. dimensione, settore di appartenenza)
La formazione del campione di stima
La stima del modello• Ogni metodologia richiede alcune scelte a priori da parte
dell’analista, relativamente– All’individuazione degli indicatori– Alla gestione di eventuali dati anomali– Alla procedura di stima utilizzata– All’obiettivo che si vuole conseguire
• Non sembra possibile individuare una tecnica “dominante”. Obiettivi che può essere opportuno perseguire sono comunque:– Una buona stabilità della performance a livello
previsionale– Una sufficiente stabilità nelle diverse fasi del ciclo
economico
La verifica dell’efficacia previsionale
• La valutazione del risultato del modello sul campione di stima distorce verso l’alto l’accuratezza di classificazione.
• Sono state elaborate alcune tecniche che permettono di simulare la performance previsionale del modello (es. Jackknife). Possono essere utili soprattutto nella scelta tra diversi modelli alternativi.
• La verifica dell’efficacia deve essere out-of-sample, magari con dati relativi a un periodo di tempo successivo (out-of-time).
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze – I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
L’approccio univariato• Discriminare le imprese sane da quelle deboli in base a
un singolo indicatore
• Esame individuale o sistema strutturato
• Confronti con dati di settore e con parametri di riferimento, esame dei conti aziendali, uso integrato di altre informazioni di natura qualitativa
• L’analisi univariata non fa alcun tentativo di combinare i singoli indicatori in una misura quantitativa di sintesi.
L’approccio univariato• Sistematica differenza di livello e di andamento degli
indicatori delle società anomale rispetto a quelli delle società sane.
• Il paragone dei soli valori medi concentra l’intera distribuzione dei valori degli indicatori in un solo punto.
• Esame della sovrapposizione delle distribuzioni calcolate separatamente sulle società sane e su quelle anomale,
• Individuazione di un punto ottimale di separazione (cut-off) per gli indicatori, in grado di ridurre al minimo gli errori di attribuzione delle società ai due insiemi (sane -anomale).
La classificazione sulla base di un singolo indicatore di rischio
Xi, ad es. ROE
Anomale SaneCut-off
Frequenze
Se Xi > cut-off => gruppo delle “sane”, altrimenti “anomale”
Errori di primo e secondo tipo
Classificazione ottenuta
Fallite Sane TotaleFallite n. di corrette
classificazionin. di errori del
I tipon. di aziende
falliteReale situazione
delle aziendeSane n. di errori del
II tipon. di corrette
classificazionin. di aziende
saneTotale n. aziende
classificate falliten. aziende
classificate sanen. totale imprese
del campione
Considerando il valore critico (cut-off) è possibile1. Calcolare la % di errore per ogni gruppo (Ei / Ni)2. Calcolare il tasso medio di errore di classificazione
(E1 + E2) / (N1+N2)
– definizione del concetto di insolvenza– indicatori di bilancio e di Centrale dei Rischi:
pro e contro – composizione dei campioni– presenza di valori anomali– indicatori con denominatore negativo– forme anomale della distribuzione
L’approccio univariato: difficoltà implementative
I risultati dell’analisi univariata• Ricerche evidenziano che il migliore indicatore per la
previsione delle insolvenze è il rapporto tra cash flow ed i debiti totali
• Gli altri indicatori tratti da dati di bilancio mettono in luce risultati inferiori, con percentuali di classificazione fortemente degradanti col procedere a ritroso dell’anno di osservazione delle variabili di bilancio.
• L’analisi del comportamento nel tempo delle distribuzioni degli indicatori: – società sane: distribuzioni stabili nel tempo– società anomale: progressivo spostamento verso la parte
peggiore dei valori con l’avvicinarsi al momento dell’insolvenza, riducendo l’area della sovrapposizione con le distribuzioni delle sane.
I n d i c e C a s h F l o w / O n e r i F i n a n z i a r i , A n n o - 1
I n d i c e C a s h F l o w / O n e r i F i n a n z i a r i , A n n o - 2
I n d i c e C a s h F l o w / O n e r i F i n a n z i a r i , A n n o - 3
0 %
5 %
1 0 %
1 5 %
2 0 %
2 5 %
3 0 %
3 5 %
-2.7
5
-2.3
8
-2.0
0
-1.6
3
-1.2
5
-0.8
8
-0.5
0
-0.1
3
0.25
0.63
1.00
1.38
1.75
2.13
2.50
2.88
3.25
3.63
4.00
4.38
Freq
uenz
e (%
)
S o f f e r e n z e
" S a n e "
0 %
5 %
1 0 %
1 5 %
2 0 %
2 5 %
3 0 %
3 5 %
-2.7
5
-2.3
8
-2.0
0
-1.6
3
-1.2
5
-0.8
8
-0.5
0
-0.1
3
0.25
0.63
1.00
1.38
1.75
2.13
2.50
2.88
3.25
3.63
4.00
4.38
Freq
uenz
e (%
)
S o f f e r e n z e
" S a n e "
0 %
5 %
1 0 %
1 5 %
2 0 %
2 5 %
3 0 %
3 5 %
-2.7
5
-2.3
8
-2.0
0
-1.6
3
-1.2
5
-0.8
8
-0.5
0
-0.1
3
0.25
0.63
1.00
1.38
1.75
2.13
2.50
2.88
3.25
3.63
4.00
4.38
Freq
uenz
e (%
)
S o f f e r e n z e
" S a n e "
Cash flow / oneri finanziari
Indicatori di Centrale dei Rischi• Tipologie:
1. indicatori della “dimensione” del finanziamento2. indicatori della composizione del finanziamento3. indicatori di tensione finanziaria
• Riflettono il giudizio del sistema bancario nei confronti dell’impresa. Informazioni ulteriori rispetto agli indici di bilancio?
• La composizione dei finanziamenti si modifica con l’approssimarsi della crisi
• Gli indici che evidenziano l’esistenza di tensioni finanziarie sono le più efficaci nel separare i due gruppi. (ad es., “utilizzo di c/c / accordato di c/c”)
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze – I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
L’approccio multivariato• Uso individuale delle variabili economico-
finanziarie: considerazione separata dei vari elementi dell’impresa (redditività, struttura finanziaria, liquidità, etc.)
• Passo successivo: combinare insieme tutti i segnali che arrivano dalle diverse variabili e cercare di ottenere una misura sinteticadello stato di salute dell’impresa
• Valutazione simultanea anziché sequenziale
L’analisi discriminante lineare• Classificazione di un oggetto in due (o più) popolazioni
note a priori (ciascuna popolazione è dotata di caratteristiche proprie, descritte in un contesto multivariato da una serie di variabili)
• L’oggetto da classificare viene osservato sulle stesse variabili ed in base alla maggiore o minore distanza complessiva, costruita pesando opportunamente le distanze individuali delle singole variabili, viene attribuito alla popolazione più prossima.
• Come ricavare i pesi relativi dei diversi indicatori?
• L’analisi del comportamento individuale degli indicatori resta un passo importante
L’analisi discriminante lineareAspetto descrittivo: costruire una regola di classificazione
che permetta di individuare le caratteristiche delle unitàstatistiche che meglio discriminano tra i gruppi
Aspetto predittivo: classificare una nuova unità statistica, di cui non si conosce la provenienza, in uno dei gruppi individuati a priori.
L’aspetto predittivo è lo scopo principale perseguito nell’utilizzo della analisi discriminante per la costruzione di modelli per la previsione delle insolvenze aziendali.
Il modello discriminante: interpretazione grafica
• (X1, X2) piano che riporta le imprese appartenenti ai due campioni delle popolazioni A e B
• XA e XB medie complessive (centroidi) • Y retta che meglio separa i due insiemi (minor numero di errori di
attribuzione) • Tale retta ha la proprietà che le proiezioni delle nuvole dei punti
sulla retta S, perpendicolare ad essa, disegna delle distribuzioni con la minor area di sovrapposizione
• S è la retta che rappresenta il luogo delle combinazioni lineari delle variabili, ovvero rappresenta la funzione discriminante lineareottima, date le caratteristiche X1 e X2.
• Riduzione della dimensione delle caratteristiche osservate, ovvero grazie al passaggio dello spazio ad n dimensioni delle variabili X ad 1 dimensione della linea di punti S (la riduzione dimensionale in realtà passa da n a g-1 ove g è il numero delle popolazioni; nel caso in questione g = 2).
Il modello discriminante: interpretazione grafica
Due variabili (X1; X2) e due popolazioni (A; B)
Il modello discriminante• Le imprese da classificare sono rappresentate da punti sulla retta
degli score, sulla base dei quali è immediato e non equivoco effettuare degli ordinamenti.
• La scelta dei pesi (ai) non è effettuata soggettivamente dall’analista, ma è oggettiva e dipendente dalle caratteristiche delle due popolazioni (NB l’elemento soggettivo dell’analista finanziario può entrare in gioco nella scelta delle variabili (X) con le quali osservare le imprese).
• Più è ampia l’area della sovrapposizione tra le due distribuzioni, maggiore è l’incertezza della classificazione (errore di classificazione P(B|A)≠0)
• Nel caso limite di due distribuzioni nettamente separate non vi sono errori, nell’altro caso di perfetta sovrapposizione vi è la massima incertezza di attribuzioni.
Il modello discriminante• L’approccio di Fisher alla classificazione in un contesto multivariato: tra
tutte le combinazioni lineari possibili delle variabili osservate sulle due popolazioni si utilizza quelle che rende massima la distanza media delle due popolazioni.
• Dal punto di vista analitico si tratta di massimizzare il rapporto tra la varianza tra le popolazioni e la varianza nelle popolazioni.
• Le osservazioni delle variabili sull’oggetto (impresa) j-esimo vengono sintetizzate in un unico valore (score), che ne determina la classificazione sulla base della distanza dagli score medi delle due popolazioni:
• Zj=λ1X1j + λ 2X2j + .... λ iXij + .... + λ nXnj = λ‘Xcon
• Zj = score dell’impresa j-esima• λi = coefficiente della variabile Xi
• Xi = variabile descrittiva della caratteristica i-esima dell’impresa (xi indica il vettore colonna di tali variabili)
La stima di un modello mediante l’analisi discriminante lineare
• L'analisi discriminante individua il vettore di coef-ficienti λ che massimizza la distanza tra i due gruppi
Con– Xi1 il vettore delle variabili indipendenti rilevato per l'azienda
i appartenente al gruppo 1, indicativo delle imprese in crisi;– Xj2 il vettore delle variabili indipendenti rilevato per l'azienda
j appartenente al gruppo 2, indicativo delle imprese “normali”;
– Zα la media dei valori della funzione discriminante per le osservazioni del gruppo α (con α = 1,2), dato che Ziα = Xiα'λ.
)(
)()( 221
λ
λλ′
′−′
XVar
XEXE ji2
21 )(
Z
ZZσ−
=
• La zona di sovrapposizione tra le due curve viene minimizzata ponendo
λ = Σ-1 (μ1 - μ2), con
Σ la matrice varianze-covarianze per le due popolazioni;μα il vettore media delle variabili considerate per la popolazione α.
• La classificazione dell'impresa i avverrà nel gruppo 1 (nell'ipotesi in cui Z1 > Z2) se
Xi ' λ ≥ (μ1 + μ2)' λ , cioè se 2
)( 21 ZZZi−
≥
L’analisi discriminante lineare
Si osserva che • i coefficienti della funzione discriminante non
sono unici dato che possono essere trasformati linearmente mantenendo la stessa capacità di separare i due gruppi (infatti, se λ∗ = α + λ β, si ottiene Z* = α +Z β , dato che Ziα = Xiα'λ.
• i coefficienti della funzione discriminante sono proporzionali a quelli che derivano dalla regressione con i minimi quadrati Y = a + b X, con yi = 1 se in crisi, yi = 0 se “normale”
L’analisi discriminante lineare
Lo Z score di Altman
Zi = 1,2 Xi,1 + 1,4 Xi,2 + 3,3 Xi,3 + 0,6 Xi,4 + 1,0 Xi,5
• X1 = capitale circolante / totale attivo• X2 = utili non distribuiti / totale attivo• X3 = EBIT / totale attivo • X4 = valore di mercato patrimonio / valore
contabile debiti l.t.• X5 = fatturato / totale attivo
Lo Z score di Altman
• Al crescere di Z diminuisce la probabilità d’insolvenza
• Valore soglia = 2,6– Z > soglia sup.: impresa sana– Z < soglia inf.: impresa debole
• Due valori soglia: – soglia inf. 1,81 < Z < 3 soglia sup.: grey area
• In generale un’impresa da classificare può essere assegnata considerando la probabilità che – data l’appartenenza al gruppo g – presenti il vettore di variabili esplicative Xi
Si assegna a “S” sef(Xi | S) > f(Xi | F),f(Xi|S) / f(Xi|F) >1(max likelihood)
NB: in pratica, si devestimare P(Xi | g) dal campione in esame
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
40,00%
45,00%
Densità(S)Densità(F)
La classificazione nei gruppi
• Se la numerosità dei due gruppi è diversa, la regola di classificazione deve tenere conto della diversa probabilità a priori di estrarre casualmente un’azienda sana o in crisi
Si assegna a “S” se
pS f(Xi | S) > pF f(Xi | F),
f(Xi|S) / f(Xi|F) > pF / pS
-9,0
0
-8,0
0
-7,0
0
-6,0
0
-5,0
0
-4,0
0
-3,0
0
-2,0
0
-1,0
0
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
Le probabilità a priori
• Se la distribuzione delle variabili utilizzate è una normale multivariata,
... e se le matrici di covarianza per i due gruppi sono uguali, la regola di assegnazione equivale alla funzione lineare vista in precedenza:
• La probabilità a priori ha un effetto solo sul termine noto, non sui coefficienti della funzione discriminante. E’ possibile quindi adeguare a posteriori la regola di classificazione.
( ) ( ) ( )
( )S
FFSiFSi
S
FFSFSiFS
ppZZZ
ppX
ppX
ln)(21ln
21
ln21
2
1
11
+−>⇒+−>
+−Σ′−>Σ′− −−
μμλλ
μμμμμμ
Le probabilità a priori
1. Uguali matrici var-cov per le due popolazioni
2. Indipendenza del vettore X delle osservazioni
3. Normalità multivariata
Ipotesi del modello discriminante lineare
• Sul punto 1, alcuni test hanno verificato una sufficiente robustezza delle stime, se la numerosità dei campioni è ampia o uguale (altrimenti, i livelli di significatività sono inattendibili e i coefficienti λ distorti)
• Non è chiaro l’effetto della non normalità; se la distribuzione ha fat tails ma è simmetrica, l’effetto non è particolarmente rilevante; è invece sensibile ad una forte asimmetria.
• La LDA funziona bene anche con variabili categoriche
• Gli outlier possono aver un effetto rilevante sulle stime. Alcune procedure che permettono di ottenere stime robuste di media e var-cov possono migliorare l’efficacia di classificazione
Ipotesi del modello discriminante lineare
• La probabilità a priori è la probabilità che, prima dell’osservazione del vettore Xi utilizzato per la classificazione, si estragga un’impresa appartenente ad uno dei due gruppi
• È possibile classificare l’impresa i, della quale non è nota l’appartenenza al gruppo “S” o “F” considerando la probabilità “a posteriori” che, date le variabili Xi, essa appartenga al gruppo g (“S” o “F”)
• Dal teorema di Bayes si ottiene che
P(g | Xi) P(g) P(Xi | g) P(g) P(Xi | g) _ P(Xi) P(S) P(Xi|S) + P(F) P(Xi|F)
pg P(Xi | g) _ pS P(Xi | “S”) + pF P(Xi | “F”)
=
==
La probabilità a posteriori
Teorema di BayesP[A ∩ B]
P[ B]Prob [A | B] =
A B
t s
τ τ0
La decisione di assegnare l’osservazione in base alla probabilità a posteriori è:
Assegna a “S” se P(“S” | Xi) > P(“F” | Xi)
Sulla base della relazione precedente, ciò equivale a pS P(Xi | “S”) > pF P(Xi | “F”)
P(Xi | “S”) / P(Xi | “F”) > pF / pS
Si ottiene quindi lo stessa regola di classificazione ottenuta considerando le probabilità a priori
La probabilità a posteriori
Il costo degli errori di classificazione • Il costo delle errate classificazioni è diverso tra i due gruppi
• Anche in questo caso, l’effetto è solo sul termine noto
• Considerando congiuntamente probabilità a priori e costi di classificazione, la costante deve essere modificata di
ln C(1|2)*π2 / C(2|1)*π1.
• Se la probabilità a priori è 2% per le imprese in crisi e 98% per le imprese sane e se il costo di effettuare un errore di classificazione è 100 volte superiore per le imprese in crisi, Δcutoff = (100 * 2%) / (1 * 98%) = 0.71
Difficoltà implementative analisi disciminante
• Definizione di default• Numerosità dei campioni di stima• Omogeneità dei campioni• Individuazione degli indicatori• Veridicità delle ipotesi di normalità
multivariata delle distribuzioni delle variabili e uguaglianza delle matrici di varianza e covarianza
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze – I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
La regressione multipla per la stima della probabilità d’insolvenza
• Stimare un modello che ha come dipendente una variabile dicotomica che descrive l’appartenenza all’insieme delle societàsane o anomale:
Y =
mentre gli indicatori di bilancio sono le variabili indipendenti.
• Linear probability model: interpreta la y come probabilità di appartenenza al gruppo.
• Difficoltà:– la varianza degli errori della stima non è costante,determinando un
problema di eteroschedasticità; – la stima della y non determina valori compresi tra 0 ed 1, necessari per
interpretare i risultati in termini di probabilità.
1 se impresa anomala
0 se impresa sana
Regressione lineare vs regressione logistica
regressione lineare stimata tra la variabile dipendente (0;1) ed un indicatore di bilancio (X); le stime escono dall’intervallo ammissibile per le probabilità.
Il modello logistico• Il modello logistico (logit) consente di ottenere dei valori che
appartengono tutti monotonicamente all’intervallo 0 ; 1
• Rispetto all’analisi discriminante, le ipotesi sottostanti l’applicabilità del modello sono meno gravose.
• L’unica condizione richiesta è che, per ogni variabile esplicativa, le osservazioni siano indipendenti, mentre non risultano necessarie le ipotesi di normalità distributiva dei regressori e di uniformità delle matrici di varianza e covarianza nei gruppi
• L’idea che sta al di sotto del modello logistico consiste nel supporre che esista una relazione causale tra la probabilità di un’impresa di diventare insolvente (variabile inosservabile) ed una serie di grandezze osservabili che sono strettamente connesse con l’evento insolvenza.
Il modello logistico• Identificate con p le probabilità di insolvenza,
con X il vettore delle variabili indipendenti e con a e b il termine costante ed i coefficienti del modello si ha:
p = F(α + βX)ove F identifica la funzione standard cumulativa logistica
Il modello logistico
• f (h) indica la funzione di densità logistica
• odd-ratio (rapporto tra le probabilità dell’evento edil suo complemento).
Analisi discriminante vs modellologistico.
Analisi discriminante• L’analisi discriminante ipotizza che le
imprese osservabili siano tratte da due universi distinti dati;
• La rilevazione delle variabili di bilancio sulle imprese può essere di aiuto per trovare le caratteristiche rilevanti e per individuare da quale universo esse provengono.
• L’analisi discriminante cerca di prevedere l’appartenenza a un gruppo, dopo aver osservato le variabili ritenute rilevanti per caratterizzare le diversità tra i due universi.
• Nell’analisi discriminante gli indicatori vanno interpretati come segnali individuali che giustificano la loro presenza per il contributo marginale che danno al segnale complessivo.
Modello logistico• Il modello logistico ipotizza che le imprese
siano tratte casualmente da un unico universo cui appartengono e cerca di stimare il grado di salute ovvero la probabilità di insolvenza/fallimento.
• Relazione causale tra variabili di bilancio e stato di salute dell’impresa.
• Non si stima l’appartenenza dell’impresa ad un gruppo, ma il grado dello stato di difficoltà economico- finanziaria in cui versa l’impresa.
• Nella logistica, gli indicatori rappresentano le variabili esogene che sono funzionali a spiegare la situazione dell’impresa dal punto di vista del creditore
• Rispetto all’analisi discriminante lineare, gli studi empirici di solito non rilevano risultati molto diversi. Ricerche hanno comunque evidenziato– Se i dati sono normali e ΣF = ΣS, LDA è ottimale per
campioni piccoli (ma la performance risulta molto simile)
– Se ΣF # ΣS, logit sembra leggermente superiore– Per distribuzioni non normali, Logit sembra
chiaramente superiore• Secondo alcune ricerche, preferibile l’uso della
logit analysis per i dati bilancio
Analisi discriminante vs modellologistico.
Selezione delle variabili discriminanti
• Metodo simultaneo (diretto): in base ad "a priori" teorici (inclusione delle variabili che ci si attende siano rilevanti)
• Metodo stepwise: si parte da un elevato numero di variabili e – si eliminano via via quelle con minor potere
esplicativo (backward elimination) oppure– si inseriscono progressivamente quelle con maggior
potere esplicativo (forward selection) oppure– si inserisce una variabile alla volta che poi viene
eliminata se perde potere discriminante a seguito dell'inserimento di altre (stepwise selection)
La performance dell’analisi• Accuracy ratio (AR): misura la capacità del modello di individuare le
imprese deboli nelle classi peggiori di Score.
• La frequenza cumulata della popolazione, ordinata secondo uno score crescente, viene messa a confronto con la frequenza cumulata dei passaggi a default effettivamente registrati.
• Un modello efficace tenderà a concentrare la maggior parte dei default entro gli ultimi percentili della distribuzione dello score. Nella figura, il modello esaminato viene confrontato con un modello “ideale” per il quale il 100% dei default cade nell’ultimo x% della popolazione e con un modello completamente “casuale”, dove score e defaultsono completamente indipendenti (retta a 45°).
• L’AR misura la concentrazione statistica dei clienti “Bad” nelle classi di rating di rischio più elevato. Esso presenta un campo di variazione tra 0 e 100 e si ottiene rapportando le seguenti aree:
AR=A/(A+B)
La performance dell’analisi
A
B
Caso non informativo
ScoreCaso ideale
Agenda CreditRisk• Definizioni
• I sistemi di rating interni
• La previsione delle insolvenze – I modelli di scoring
• L’approccio univariato• L’approccio multivariato:
– Il modello discriminante– Il modello logistico
• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali
• Structural models• Reduced form models
• La stima dei tassi di recupero e dell’esposizione al momento deldefault
• Il VaR di un portafoglio creditizio
Dagli score alle PD• Nella maggior parte dei casi, il punto di partenza è costituito dagli score
prodotti da modelli logistici. Tali valori, pur essendo compresi tra 0 e 1, possono essere, di norma, interpretati quali indicatori “ordinali” di rischio (ranking) e non direttamente quali PD (indicatori “cardinali”).
• Fa eccezione il caso – minoritario – delle banche che stimano direttamente i modelli sulla popolazione (gli score logistici possono essere interpretati direttamente quali probabilità di default).
• Nella maggioranza dei casi, le banche stimano i modelli su campioni la cui ripartizione tra bonis e default non rispetta le caratteristiche della popolazione. In questi casi, per interpretare gli score quali PD è necessario ricorrere ad alcuni meccanismi di aggiustamento o di ricalibrazione.
• Un concetto importante: Tendenza centrale: concetto equivalente alla frequenza di default osservata sul portafoglio in un determinato arco di tempo (in base alle regole, un ciclo economico, e comunque non meno di 2/5 anni)
Metodologie di calibrazione
• Aggiustamento 1: correzione dell’intercetta
Di cui:
I meccanismi di aggiustamento
Metodologie di calibrazione
• Aggiustamento 2: riponderazione dei default• Aggiustamento 3: approccio misto
1. Filtro bayesiano per riportare alla tendenza centrale la PD individuale campionaria;
2. Creazione di n bucket score/pd;3. Stima di exponential smoothing function;4. Uso della ESF per passare dagli score alle PD
Segue: I meccanismi di aggiustamento
Metodologie di calibrazione
(segue) Aggiustamento 3: approccio misto
ΣNi…
0,21%0,28%-1,22.000
0,07%0,09%-2,42.000
PD adj iPD indScore medianoi
N
PD adj i = e a + b*score i
. . . . . . ..
.PD
adj
Score
)|(1)(1)),|(1(
)|()(),|(
)|()(),|(
)(
sDPDPsiDP
sDPDPsiDP
sDPDPsiDP
iDP
−−
−+=
Le modalità di costruzione dei bucket(numero, composizione) diventano un elemento cruciale
Metodologie di calibrazione
• Aggiustamento 4: multicalibrazione1. L’approccio misto esaminato in precedenza si presta
alla realizzazione di calibrazioni multiple;2. Alcuni gruppi bancari hanno realizzato calibrazioni
separate per aree geografiche ovvero settori di attività;
3. Ratio: i) ovviare a situazioni di bassa perfomance dei sistemi/inadeguata rappresentatività nei campioni; ii) adottare approcci più conservativi
• Consente di passare dagli score/PD individuali alle PD regolamentari.• Tutte le banche esaminate utilizzano apposite scale maestre; non
sempre tali scale sono uniche (cioè, utilizzabili per tutti i diversi modelli nell’ambito del portafoglio corporate)
• Tutte le master scale presentano, per ogni classe di rating, estremi inferiori e superiori definiti in termini di score/pd individuali che “guidano” l’assegnazione degli obligors alle diverse classi
• Ad ogni classe di rating è associata una pooled pd, o PD di classe, da abbinare, per fini regolamentari, a tutti gli obligors inclusi nella stessa classe.
Aspetti Rilevanti
Modalità di costruzione delle scaleQuantificazione delle pooled pd
La Masterscale
La Masterscale
• Approccio # 1
Modalità di costruzione delle scale
Gli estremi delle classi (“cut-off”) vengono definiti sulla base della distribuzione degli score/PD individuali. Una volta fissati i limiti, viene definita, in base a differenti modalità, la PD di classe.
• Approccio # 2
Vengono prima individuate le PD di classe – facendo, ad esempio, riferimento a scale esterne – e, successivamente, gli estremi di ciascuna classe (in genere, posti pari alla media dei logaritmi di due pd di classe contigue)
La Masterscale
• L’approccio # 1 è basato, tipicamente, su tecniche statistiche quali la cluster analysis e la kernel analysis. Talvolta la scelta dei cut-off non è “indipendente” da valutazioni judgementalUn vantaggio è quello di costruire classi di rating giustificabili – in teoria – dal punto di vista statistico
Modalità di costruzione delle scale
• L’approccio # 2 parte dall’assunto di volere massimizzare la valenza “comunicativa” della scala maestra, che viene “ancorata” a metriche pubbliche, con vantaggi evidenti anche in termini di benchmarking.
La Masterscale
• Approccio # 1 (“storico”)
Modalità di quantificazione della pooled pd
La pd pooled è posta eguale alla frequenza di default “storica” osservata per ciascuna classe di rating (non sono necessarie pd individuali)Richiede il ricalcolo dei rating a ritroso su tutta la popolazione per un congruo numero di anni. Può comportare problemi per quanto riguarda le componenti qualitative
1
10
100
1000
1 2 3 4 5
1
10
100
1000
1 2 3 4 5
1
10
100
1000
1 2 3 4 5
Default T-2
Bonis T-3ODFi t-2=
Default T-1
Bonis T-2ODFi t-1=
Default T
Bonis T-1ODFi t=
Pdi (=ODFi) = Σ ODFij
n
n
La Masterscale
• Approccio # 2 (“modelli statistici”)
Modalità di quantificazione della pooled pd
La pd pooled è posta eguale alla media/mediana delle pd individuali delle controparti rientranti in ciascuna classe di ratingNon richiede necessariamente il ricalcolo dei rating a ritroso su tutta la popolazione per tutta la serie storica disponibileDiventa essenziale verificare la distribuzione per ciascuna classe di rating e riscontrare la coerenza con le ODF storiche.
AAA AA A BBB BB ….
Masterscale a confronto
….
0,04%
0,13%
0,29%
0,53%0,85%
1,48%
2,95%
8,75%
0,02%
0,13%
0,25%0,38%
0,68%0,98%1,40%
2,43%
0,00%
0,06%0,09%
0,26%
0,84%
1,93%
4,72%
11,86%19,37%
0,07%0,10%0,15%0,22%0,33%0,50%0,74%1,10%1,64%2,45%3,66%5,46%8,15%12,15%18,13%
0,00%
0,05%
0,10%
0,19%
0,52%
0,94%1,41%
3,40%4,79%7,10%9,36%14,30%17,20%27,60%
0,01%
0,02%0,03%0,04%0,05%0,07%0,09%0,14%0,22%
0,39%0,63%0,89%1,17%1,54%2,03%2,67%3,51%4,62%6,08%8,01%11,29%16,66%
0,07%
0,15%
0,28%0,43%0,63%0,88%1,25%1,75%2,50%4,00%
7,50%
15,00%25,00%
0,00%
0,00%
0,01%
0,10%
1,00%
10,00%
100,00%0 1 2 3 4 5 6 7 8