Credit risk Roma3 2009 set1 - Area Sistemi …host.uniroma3.it/facolta/economia/db/materiali/...Agenda CreditRisk • Definizioni • I sistemi di rating interni • La previsione

Il rischio di credito

Francesco Romito

Università RomaTre, 1Q 2009

Agenda CreditRisk• Definizioni

• I sistemi di rating interni

• La previsione delle insolvenze – I modelli di scoring

• L’approccio univariato• L’approccio multivariato:

– Il modello discriminante– Il modello logistico

• Calibrazione e Masterscale– I modelli fondati sul mercato dei capitali

• Structural models• Reduced form models

• La stima dei tassi di recupero e dell’esposizione al momento deldefault

• Il VaR di un portafoglio creditizio

Default risk e credit risk• Default risk: rischio che un affidato, un emittente ovvero

una controparte non onori i suoi obblighi di pagamento • Credit risk: rischio di default ovvero di riduzione del

valore di mercato causata da cambiamenti del merito creditizio dell’emittente, dell’affidato ovvero della controparte

• Rischio collegato: Liquidity Risk– Effetti prezzo e quantità– Esempi recenti default Russia nel 1998, scandalo Enron 2001,

subprime crisis 2007.• Default events

– I default sono rari e accadono inaspettatamente– Comportano perdite significative il cui importo è ignoto prima del

default

Default: le possibili definizioni

• Status giuridico: amministrazione straordinaria, Liquidazione, Chapter 11

• Regolamentazione finanziaria: sofferenze, incagli, ristrutturate, Past due

• Classificazioni interne degli intermediari• Prassi di specifici mercati (es., CDS)

Definizione regolamentare post Basilea II

• Per esposizioni in default si intendono: sofferenze, incagli, crediti ristrutturati, crediti scaduti e/o sconfinanti (past due).

• Rientrano tra i crediti scaduti e/o sconfinanti quelli per cui:– il debitore è in ritardo su una obbligazione creditizia rilevante verso la banca o il

gruppo bancario da: • (i) oltre 180 per i crediti al dettaglio e quelli verso gli enti del settore pubblico; • (ii) oltre 180 - fino al 31.12.2011 - per i crediti verso le imprese; • (iii) oltre 90 per gli altri;

– la soglia di “rilevanza” è pari al 5% dell’esposizione.

• Resta ferma la possibilità di utilizzare, per le filiazioni del gruppo operanti in altri Stati comunitari o del Gruppo dei Dieci, la definizione di default adottata dalle locali autorità di vigilanza.

• Non determinano un default le seguenti modifiche delle originarie condizioni contrattuali: il riscadenzamento dei crediti e la concessione di proroghe, dilazioni, rinnovi o ampliamenti di linee di credito. Tali modifiche non devono dipendere dal deterioramento delle condizioni economico-finanziarie del debitore ovvero non devono dare luogo a una perdita.

Rilevanza del rischio di credito• Durante la crisi giapponese negli anni ’90 le

perdite cumulate sono state pari a $ 550 billion• Attuale crisi: stimati più di $ 1000 billion ??

• Principali cause:– Elevato livello di leverage e scoppio della real estate

bubble– Deficienze nel risk management– Inadeguati standard di concessione– Carenze della supervisione finanziaria

E’ più importante del rischio di mercato?

• Derivatives market– Orange County (Dec 1994) Reverse repos 1,810– Showa Shell Sekiyu (Feb. 1993) Currency forwards 1,580– Kashima Oil (Apr. 1994) Currency forwards 1,450– Metallgesellschaft (Jan. 1994) Oil futures 1,340– Barings (Feb. 1995) Stock index futures 1,330

• Credit market– Japan (1990s) Bad loans 550,000– China (1990s) 4 state banks insolvent 498,000– US (1984-91) 1400 S&L, 1300 banks fail 150,000– South Korea (1998-) Restructuring of banks 90,000– Worldwide (2007-20??) Subprime and delevereging ??

Le misure del rischio di credito: credit rating

I credit ratings delle tre grandi agenzie di rating (Standard & Poor’s, Moody’s e Fitch) forniscono indicazioni sul merito creditizio degli emittenti

I Credit ratings poossono essere divisi in due classi:1 Investment grade (da “Aaa” a “Baa” ovvero da “AAA” a “BBB”)2 Speculative grade

Corporate spreads

Mortage e FED rates

Corporate spreads e maturity

La probabilità di default o di insolvenza cresce al peggiorare del rating…

Historical Default Probabilities

Average default frequencies delle classi di rating S&Pper diversi orizzonti temporali da 1 a 10 anni (in %).

Come cambia il rischio (ed il rating)?

Fonte: Standard & Poor’s

Componenti del rischio di credito• Arrival Risk: incertezza derivante dalla manifestazione o meno del default

– Probability of Default (PD)

• Timing Risk: incertezza connessa al tempo della manifestazione del default

• Recovery Risk: severità delle perdite in caso di default– Distribuzione del recovery rate (RR=1-LGD)

• Market Risk: cambiamenti nel valore di mercato di uno strumento dovuti a cambiamento del merito creditizio o delle condizioni di mercato (incl. migrationrisk).

• Default Correlation Risk: rischio che più emittenti/affidati/controparti vadano in default simultaneamente ovvero in sequenza– Arrival & Timing Risks










Sistema di rating• Insieme strutturato e documentato delle metodologie,

dei processi organizzativi e di controllo, delle modalità di organizzazione delle basi dati che consente la raccolta e l’elaborazione delle informazioni rilevanti per la formulazione di valutazioni sintetiche della rischiosità di una controparte e delle singole operazioni creditizie.

• Il rischio connesso con un’esposizione è espresso attraverso quattro componenti:– probabilità di default (PD), che attiene al debitore; – tasso di perdita in caso di default (LGD), – esposizione al momento del default (EAD) – scadenza effettiva (M).

Definizione

Elementi Rischio di Credito attengono alla

singola operazione

Portafogli creditizi: altri elementi per la determinazione della rischiosità

• Granularità: grado di concentrazione (hpBIS II granularità infinita)

• Correlazione tra prenditori, aree geografiche, settori di attività (nell’accordo approccio semplificato per portafogli e livelli di PD)

Sistema di rating• Attraverso il sistema di rating la banca:

– attribuisce al debitore il grado interno di merito creditizio (rating), ordinando le controparti in relazione alla loro rischiosità;

– perviene a una stima delle componenti di rischio.

• Il rating rappresenta la valutazione, riferita a un dato orizzonte temporale, effettuata sulla base di tutte le informazioni ragionevolmente accessibili – di natura sia quantitativa sia qualitativa – ed espressa mediante una classificazione su scala ordinale, della capacità di un soggetto affidato o da affidare di onorare le obbligazioni contrattuali.

• Ad ogni classe di rating è associata una probabilità di default.

• Le classi di rating sono ordinate in funzione del rischio creditizio: muovendo da una classe meno rischiosa a una più rischiosa, la probabilità che i debitori risultino in default è crescente.

Il Nuovo Accordo di Basilea consente di scegliere tra tre approcci per il calcolo del requisito patrimoniale minimo per il rischio di credito

Standard

IRB Foundation

IRB Advanced

L’attivo ponderato viene calcolato come per Basilea I in base a ponderazioni fisse. Sono introdotti rating “esterni” per le controparti Corporate Banche e Paesi e definito un nuovo trattamento delle garanzie, dei derivati e delle cartolarizzazioni

L’attivo ponderato viene calcolato come funzione di 4 elementi costituenti il rischio di credito , con utilizzo di stime interne per determinare la PD, mentre gli altri elementi (LGD/EAD/M) sonostandard in quanto definiti a priori dalla normativa

L’attivo ponderato viene calcolato come funzione dei 4 elementi costituenti il rischio di credito con utilizzo di stime interne

Inte

rnal

Rati

ng

B

ase

d(I

RB

)

Il nuovo Accordo: Basilea 2Il nuovo Accordo: Basilea 2

Sistema IRB: overview

Classi di attività

SISTEMA DI RATING

PD LGD EAD M

Criteri minimi

Funzioni di ponderazione

Ponderazioni e requisiti



• La previsione delle insolvenze– I modelli di scoring







Le fasi della stima di un modello quantitativo per la PD

• L’obiettivo è ottenere un indicatore – che differenzi in modo significativo imprese

“normali” e in crisi– che permetta di ottenere una graduazione del

livello di rischio associato ad ogni impresa

• Le fasi della stima di un modello:1) Definizione del default2) Formazione del campione di stima 3) Stima del modello4) Verifica dell’efficacia su un campione indipendente

La formazione del campione di stima

• Una volta definito il default, si selezionano le imprese appartenenti ai due gruppi alternativi (default vs. non default)

1) ... cercando di costruire campioni ampi;2) e che rappresentino l’universo delle imprese da

classificare

NB. L’utilizzo di “filtri” arbitrari nella selezione delle imprese (ad esempio, per eliminare “dati anomali”) può distorcere:

• L’individuazione della regola di classificazione• La valutazione della performance del modello nel

separare i due gruppi

• Per ogni impresa selezionata è opportuno raccogliere informazioni precedenti il default, per identificare i “sintomi” più efficaci della crisi.

• Normalmente si ritiene adeguato un orizzonte di valutazione annuale

• Non è importante rispettare esattamente la proporzione numerica tra i due gruppi nell’universo, ma è opportuno un bilanciamento delle caratteristiche “operative” (es. dimensione, settore di appartenenza)

La formazione del campione di stima

La stima del modello• Ogni metodologia richiede alcune scelte a priori da parte

dell’analista, relativamente– All’individuazione degli indicatori– Alla gestione di eventuali dati anomali– Alla procedura di stima utilizzata– All’obiettivo che si vuole conseguire

• Non sembra possibile individuare una tecnica “dominante”. Obiettivi che può essere opportuno perseguire sono comunque:– Una buona stabilità della performance a livello

previsionale– Una sufficiente stabilità nelle diverse fasi del ciclo

economico

La verifica dell’efficacia previsionale

• La valutazione del risultato del modello sul campione di stima distorce verso l’alto l’accuratezza di classificazione.

• Sono state elaborate alcune tecniche che permettono di simulare la performance previsionale del modello (es. Jackknife). Possono essere utili soprattutto nella scelta tra diversi modelli alternativi.

• La verifica dell’efficacia deve essere out-of-sample, magari con dati relativi a un periodo di tempo successivo (out-of-time).










L’approccio univariato• Discriminare le imprese sane da quelle deboli in base a

un singolo indicatore

• Esame individuale o sistema strutturato

• Confronti con dati di settore e con parametri di riferimento, esame dei conti aziendali, uso integrato di altre informazioni di natura qualitativa

• L’analisi univariata non fa alcun tentativo di combinare i singoli indicatori in una misura quantitativa di sintesi.

L’approccio univariato• Sistematica differenza di livello e di andamento degli

indicatori delle società anomale rispetto a quelli delle società sane.

• Il paragone dei soli valori medi concentra l’intera distribuzione dei valori degli indicatori in un solo punto.

• Esame della sovrapposizione delle distribuzioni calcolate separatamente sulle società sane e su quelle anomale,

• Individuazione di un punto ottimale di separazione (cut-off) per gli indicatori, in grado di ridurre al minimo gli errori di attribuzione delle società ai due insiemi (sane -anomale).

La classificazione sulla base di un singolo indicatore di rischio

Xi, ad es. ROE

Anomale SaneCut-off

Frequenze

Se Xi > cut-off => gruppo delle “sane”, altrimenti “anomale”

Errori di primo e secondo tipo

Classificazione ottenuta

Fallite Sane TotaleFallite n. di corrette

classificazionin. di errori del

I tipon. di aziende

falliteReale situazione

delle aziendeSane n. di errori del

II tipon. di corrette

classificazionin. di aziende

saneTotale n. aziende

classificate falliten. aziende

classificate sanen. totale imprese

del campione

Considerando il valore critico (cut-off) è possibile1. Calcolare la % di errore per ogni gruppo (Ei / Ni)2. Calcolare il tasso medio di errore di classificazione

(E1 + E2) / (N1+N2)

– definizione del concetto di insolvenza– indicatori di bilancio e di Centrale dei Rischi:

pro e contro – composizione dei campioni– presenza di valori anomali– indicatori con denominatore negativo– forme anomale della distribuzione

L’approccio univariato: difficoltà implementative

I risultati dell’analisi univariata• Ricerche evidenziano che il migliore indicatore per la

previsione delle insolvenze è il rapporto tra cash flow ed i debiti totali

• Gli altri indicatori tratti da dati di bilancio mettono in luce risultati inferiori, con percentuali di classificazione fortemente degradanti col procedere a ritroso dell’anno di osservazione delle variabili di bilancio.

• L’analisi del comportamento nel tempo delle distribuzioni degli indicatori: – società sane: distribuzioni stabili nel tempo– società anomale: progressivo spostamento verso la parte

peggiore dei valori con l’avvicinarsi al momento dell’insolvenza, riducendo l’area della sovrapposizione con le distribuzioni delle sane.

I n d i c e C a s h F l o w / O n e r i F i n a n z i a r i , A n n o - 1



0 %

5 %

1 0 %

1 5 %

2 0 %

2 5 %

3 0 %

3 5 %

-2.7

5

-2.3

8

-2.0

0

-1.6

3

-1.2

5

-0.8

8

-0.5

0

-0.1

3

0.25

0.63

1.00

1.38

1.75

2.13

2.50

2.88

3.25

3.63

4.00

4.38

Freq

uenz

e (%

)

S o f f e r e n z e

" S a n e "

0 %

5 %

1 0 %

1 5 %

2 0 %

2 5 %

3 0 %

3 5 %

-2.7

5

-2.3

8

-2.0

0

-1.6

3

-1.2

5

-0.8

8

-0.5

0

-0.1

3

0.25

0.63

1.00

1.38

1.75

2.13

2.50

2.88

3.25

3.63

4.00

4.38

Freq

uenz

e (%

)

S o f f e r e n z e

" S a n e "

0 %

5 %

1 0 %

1 5 %

2 0 %

2 5 %

3 0 %

3 5 %

-2.7

5

-2.3

8

-2.0

0

-1.6

3

-1.2

5

-0.8

8

-0.5

0

-0.1

3

0.25

0.63

1.00

1.38

1.75

2.13

2.50

2.88

3.25

3.63

4.00

4.38

Freq

uenz

e (%

)

S o f f e r e n z e

" S a n e "

Cash flow / oneri finanziari

Indicatori di Centrale dei Rischi• Tipologie:

1. indicatori della “dimensione” del finanziamento2. indicatori della composizione del finanziamento3. indicatori di tensione finanziaria

• Riflettono il giudizio del sistema bancario nei confronti dell’impresa. Informazioni ulteriori rispetto agli indici di bilancio?

• La composizione dei finanziamenti si modifica con l’approssimarsi della crisi

• Gli indici che evidenziano l’esistenza di tensioni finanziarie sono le più efficaci nel separare i due gruppi. (ad es., “utilizzo di c/c / accordato di c/c”)










L’approccio multivariato• Uso individuale delle variabili economico-

finanziarie: considerazione separata dei vari elementi dell’impresa (redditività, struttura finanziaria, liquidità, etc.)

• Passo successivo: combinare insieme tutti i segnali che arrivano dalle diverse variabili e cercare di ottenere una misura sinteticadello stato di salute dell’impresa

• Valutazione simultanea anziché sequenziale

L’analisi discriminante lineare• Classificazione di un oggetto in due (o più) popolazioni

note a priori (ciascuna popolazione è dotata di caratteristiche proprie, descritte in un contesto multivariato da una serie di variabili)

• L’oggetto da classificare viene osservato sulle stesse variabili ed in base alla maggiore o minore distanza complessiva, costruita pesando opportunamente le distanze individuali delle singole variabili, viene attribuito alla popolazione più prossima.

• Come ricavare i pesi relativi dei diversi indicatori?

• L’analisi del comportamento individuale degli indicatori resta un passo importante

L’analisi discriminante lineareAspetto descrittivo: costruire una regola di classificazione

che permetta di individuare le caratteristiche delle unitàstatistiche che meglio discriminano tra i gruppi

Aspetto predittivo: classificare una nuova unità statistica, di cui non si conosce la provenienza, in uno dei gruppi individuati a priori.

L’aspetto predittivo è lo scopo principale perseguito nell’utilizzo della analisi discriminante per la costruzione di modelli per la previsione delle insolvenze aziendali.

Il modello discriminante: interpretazione grafica

• (X1, X2) piano che riporta le imprese appartenenti ai due campioni delle popolazioni A e B

• XA e XB medie complessive (centroidi) • Y retta che meglio separa i due insiemi (minor numero di errori di

attribuzione) • Tale retta ha la proprietà che le proiezioni delle nuvole dei punti

sulla retta S, perpendicolare ad essa, disegna delle distribuzioni con la minor area di sovrapposizione

• S è la retta che rappresenta il luogo delle combinazioni lineari delle variabili, ovvero rappresenta la funzione discriminante lineareottima, date le caratteristiche X1 e X2.

• Riduzione della dimensione delle caratteristiche osservate, ovvero grazie al passaggio dello spazio ad n dimensioni delle variabili X ad 1 dimensione della linea di punti S (la riduzione dimensionale in realtà passa da n a g-1 ove g è il numero delle popolazioni; nel caso in questione g = 2).

Il modello discriminante: interpretazione grafica

Due variabili (X1; X2) e due popolazioni (A; B)

Il modello discriminante• Le imprese da classificare sono rappresentate da punti sulla retta

degli score, sulla base dei quali è immediato e non equivoco effettuare degli ordinamenti.

• La scelta dei pesi (ai) non è effettuata soggettivamente dall’analista, ma è oggettiva e dipendente dalle caratteristiche delle due popolazioni (NB l’elemento soggettivo dell’analista finanziario può entrare in gioco nella scelta delle variabili (X) con le quali osservare le imprese).

• Più è ampia l’area della sovrapposizione tra le due distribuzioni, maggiore è l’incertezza della classificazione (errore di classificazione P(B|A)≠0)

• Nel caso limite di due distribuzioni nettamente separate non vi sono errori, nell’altro caso di perfetta sovrapposizione vi è la massima incertezza di attribuzioni.

Il modello discriminante• L’approccio di Fisher alla classificazione in un contesto multivariato: tra

tutte le combinazioni lineari possibili delle variabili osservate sulle due popolazioni si utilizza quelle che rende massima la distanza media delle due popolazioni.

• Dal punto di vista analitico si tratta di massimizzare il rapporto tra la varianza tra le popolazioni e la varianza nelle popolazioni.

• Le osservazioni delle variabili sull’oggetto (impresa) j-esimo vengono sintetizzate in un unico valore (score), che ne determina la classificazione sulla base della distanza dagli score medi delle due popolazioni:

• Zj=λ1X1j + λ 2X2j + .... λ iXij + .... + λ nXnj = λ‘Xcon

• Zj = score dell’impresa j-esima• λi = coefficiente della variabile Xi

• Xi = variabile descrittiva della caratteristica i-esima dell’impresa (xi indica il vettore colonna di tali variabili)

La stima di un modello mediante l’analisi discriminante lineare

• L'analisi discriminante individua il vettore di coef-ficienti λ che massimizza la distanza tra i due gruppi

Con– Xi1 il vettore delle variabili indipendenti rilevato per l'azienda

i appartenente al gruppo 1, indicativo delle imprese in crisi;– Xj2 il vettore delle variabili indipendenti rilevato per l'azienda

j appartenente al gruppo 2, indicativo delle imprese “normali”;

– Zα la media dei valori della funzione discriminante per le osservazioni del gruppo α (con α = 1,2), dato che Ziα = Xiα'λ.

)(

)()( 221

λ

λλ′

′−′

XVar

XEXE ji2

21 )(

Z

ZZσ−

=

• La zona di sovrapposizione tra le due curve viene minimizzata ponendo

λ = Σ-1 (μ1 - μ2), con

Σ la matrice varianze-covarianze per le due popolazioni;μα il vettore media delle variabili considerate per la popolazione α.

• La classificazione dell'impresa i avverrà nel gruppo 1 (nell'ipotesi in cui Z1 > Z2) se

Xi ' λ ≥ (μ1 + μ2)' λ , cioè se 2

)( 21 ZZZi−

≥

L’analisi discriminante lineare

Si osserva che • i coefficienti della funzione discriminante non

sono unici dato che possono essere trasformati linearmente mantenendo la stessa capacità di separare i due gruppi (infatti, se λ∗ = α + λ β, si ottiene Z* = α +Z β , dato che Ziα = Xiα'λ.

• i coefficienti della funzione discriminante sono proporzionali a quelli che derivano dalla regressione con i minimi quadrati Y = a + b X, con yi = 1 se in crisi, yi = 0 se “normale”

L’analisi discriminante lineare

Lo Z score di Altman

Zi = 1,2 Xi,1 + 1,4 Xi,2 + 3,3 Xi,3 + 0,6 Xi,4 + 1,0 Xi,5

• X1 = capitale circolante / totale attivo• X2 = utili non distribuiti / totale attivo• X3 = EBIT / totale attivo • X4 = valore di mercato patrimonio / valore

contabile debiti l.t.• X5 = fatturato / totale attivo

Lo Z score di Altman

• Al crescere di Z diminuisce la probabilità d’insolvenza

• Valore soglia = 2,6– Z > soglia sup.: impresa sana– Z < soglia inf.: impresa debole

• Due valori soglia: – soglia inf. 1,81 < Z < 3 soglia sup.: grey area

• In generale un’impresa da classificare può essere assegnata considerando la probabilità che – data l’appartenenza al gruppo g – presenti il vettore di variabili esplicative Xi

Si assegna a “S” sef(Xi | S) > f(Xi | F),f(Xi|S) / f(Xi|F) >1(max likelihood)

NB: in pratica, si devestimare P(Xi | g) dal campione in esame

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

45,00%

Densità(S)Densità(F)

La classificazione nei gruppi

• Se la numerosità dei due gruppi è diversa, la regola di classificazione deve tenere conto della diversa probabilità a priori di estrarre casualmente un’azienda sana o in crisi

Si assegna a “S” se

pS f(Xi | S) > pF f(Xi | F),

f(Xi|S) / f(Xi|F) > pF / pS

-9,0

0

-8,0

0

-7,0

0

-6,0

0

-5,0

0

-4,0

0

-3,0

0

-2,0

0

-1,0

0

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

9,00

Le probabilità a priori

• Se la distribuzione delle variabili utilizzate è una normale multivariata,

... e se le matrici di covarianza per i due gruppi sono uguali, la regola di assegnazione equivale alla funzione lineare vista in precedenza:

• La probabilità a priori ha un effetto solo sul termine noto, non sui coefficienti della funzione discriminante. E’ possibile quindi adeguare a posteriori la regola di classificazione.

( ) ( ) ( )

( )S

FFSiFSi

S

FFSFSiFS

ppZZZ

ppX

ppX

ln)(21ln

21

ln21

2

1

11

+−>⇒+−>

+−Σ′−>Σ′− −−

μμλλ

μμμμμμ

Le probabilità a priori

1. Uguali matrici var-cov per le due popolazioni

2. Indipendenza del vettore X delle osservazioni

3. Normalità multivariata

Ipotesi del modello discriminante lineare

• Sul punto 1, alcuni test hanno verificato una sufficiente robustezza delle stime, se la numerosità dei campioni è ampia o uguale (altrimenti, i livelli di significatività sono inattendibili e i coefficienti λ distorti)

• Non è chiaro l’effetto della non normalità; se la distribuzione ha fat tails ma è simmetrica, l’effetto non è particolarmente rilevante; è invece sensibile ad una forte asimmetria.

• La LDA funziona bene anche con variabili categoriche

• Gli outlier possono aver un effetto rilevante sulle stime. Alcune procedure che permettono di ottenere stime robuste di media e var-cov possono migliorare l’efficacia di classificazione

Ipotesi del modello discriminante lineare

• La probabilità a priori è la probabilità che, prima dell’osservazione del vettore Xi utilizzato per la classificazione, si estragga un’impresa appartenente ad uno dei due gruppi

• È possibile classificare l’impresa i, della quale non è nota l’appartenenza al gruppo “S” o “F” considerando la probabilità “a posteriori” che, date le variabili Xi, essa appartenga al gruppo g (“S” o “F”)

• Dal teorema di Bayes si ottiene che

P(g | Xi) P(g) P(Xi | g) P(g) P(Xi | g) _ P(Xi) P(S) P(Xi|S) + P(F) P(Xi|F)

pg P(Xi | g) _ pS P(Xi | “S”) + pF P(Xi | “F”)

=

==

La probabilità a posteriori

Teorema di BayesP[A ∩ B]

P[ B]Prob [A | B] =

A B

t s

τ τ0

La decisione di assegnare l’osservazione in base alla probabilità a posteriori è:

Assegna a “S” se P(“S” | Xi) > P(“F” | Xi)

Sulla base della relazione precedente, ciò equivale a pS P(Xi | “S”) > pF P(Xi | “F”)

P(Xi | “S”) / P(Xi | “F”) > pF / pS

Si ottiene quindi lo stessa regola di classificazione ottenuta considerando le probabilità a priori

La probabilità a posteriori

Il costo degli errori di classificazione • Il costo delle errate classificazioni è diverso tra i due gruppi

• Anche in questo caso, l’effetto è solo sul termine noto

• Considerando congiuntamente probabilità a priori e costi di classificazione, la costante deve essere modificata di

ln C(1|2)*π2 / C(2|1)*π1.

• Se la probabilità a priori è 2% per le imprese in crisi e 98% per le imprese sane e se il costo di effettuare un errore di classificazione è 100 volte superiore per le imprese in crisi, Δcutoff = (100 * 2%) / (1 * 98%) = 0.71

Difficoltà implementative analisi disciminante

• Definizione di default• Numerosità dei campioni di stima• Omogeneità dei campioni• Individuazione degli indicatori• Veridicità delle ipotesi di normalità

multivariata delle distribuzioni delle variabili e uguaglianza delle matrici di varianza e covarianza










La regressione multipla per la stima della probabilità d’insolvenza

• Stimare un modello che ha come dipendente una variabile dicotomica che descrive l’appartenenza all’insieme delle societàsane o anomale:

Y =

mentre gli indicatori di bilancio sono le variabili indipendenti.

• Linear probability model: interpreta la y come probabilità di appartenenza al gruppo.

• Difficoltà:– la varianza degli errori della stima non è costante,determinando un

problema di eteroschedasticità; – la stima della y non determina valori compresi tra 0 ed 1, necessari per

interpretare i risultati in termini di probabilità.

1 se impresa anomala

0 se impresa sana

Regressione lineare vs regressione logistica

regressione lineare stimata tra la variabile dipendente (0;1) ed un indicatore di bilancio (X); le stime escono dall’intervallo ammissibile per le probabilità.

Il modello logistico• Il modello logistico (logit) consente di ottenere dei valori che

appartengono tutti monotonicamente all’intervallo 0 ; 1

• Rispetto all’analisi discriminante, le ipotesi sottostanti l’applicabilità del modello sono meno gravose.

• L’unica condizione richiesta è che, per ogni variabile esplicativa, le osservazioni siano indipendenti, mentre non risultano necessarie le ipotesi di normalità distributiva dei regressori e di uniformità delle matrici di varianza e covarianza nei gruppi

• L’idea che sta al di sotto del modello logistico consiste nel supporre che esista una relazione causale tra la probabilità di un’impresa di diventare insolvente (variabile inosservabile) ed una serie di grandezze osservabili che sono strettamente connesse con l’evento insolvenza.

Il modello logistico• Identificate con p le probabilità di insolvenza,

con X il vettore delle variabili indipendenti e con a e b il termine costante ed i coefficienti del modello si ha:

p = F(α + βX)ove F identifica la funzione standard cumulativa logistica

Il modello logistico

• f (h) indica la funzione di densità logistica

• odd-ratio (rapporto tra le probabilità dell’evento edil suo complemento).

Analisi discriminante vs modellologistico.

Analisi discriminante• L’analisi discriminante ipotizza che le

imprese osservabili siano tratte da due universi distinti dati;

• La rilevazione delle variabili di bilancio sulle imprese può essere di aiuto per trovare le caratteristiche rilevanti e per individuare da quale universo esse provengono.

• L’analisi discriminante cerca di prevedere l’appartenenza a un gruppo, dopo aver osservato le variabili ritenute rilevanti per caratterizzare le diversità tra i due universi.

• Nell’analisi discriminante gli indicatori vanno interpretati come segnali individuali che giustificano la loro presenza per il contributo marginale che danno al segnale complessivo.

Modello logistico• Il modello logistico ipotizza che le imprese

siano tratte casualmente da un unico universo cui appartengono e cerca di stimare il grado di salute ovvero la probabilità di insolvenza/fallimento.

• Relazione causale tra variabili di bilancio e stato di salute dell’impresa.

• Non si stima l’appartenenza dell’impresa ad un gruppo, ma il grado dello stato di difficoltà economico- finanziaria in cui versa l’impresa.

• Nella logistica, gli indicatori rappresentano le variabili esogene che sono funzionali a spiegare la situazione dell’impresa dal punto di vista del creditore

• Rispetto all’analisi discriminante lineare, gli studi empirici di solito non rilevano risultati molto diversi. Ricerche hanno comunque evidenziato– Se i dati sono normali e ΣF = ΣS, LDA è ottimale per

campioni piccoli (ma la performance risulta molto simile)

– Se ΣF # ΣS, logit sembra leggermente superiore– Per distribuzioni non normali, Logit sembra

chiaramente superiore• Secondo alcune ricerche, preferibile l’uso della

logit analysis per i dati bilancio

Analisi discriminante vs modellologistico.

Selezione delle variabili discriminanti

• Metodo simultaneo (diretto): in base ad "a priori" teorici (inclusione delle variabili che ci si attende siano rilevanti)

• Metodo stepwise: si parte da un elevato numero di variabili e – si eliminano via via quelle con minor potere

esplicativo (backward elimination) oppure– si inseriscono progressivamente quelle con maggior

potere esplicativo (forward selection) oppure– si inserisce una variabile alla volta che poi viene

eliminata se perde potere discriminante a seguito dell'inserimento di altre (stepwise selection)

La performance dell’analisi• Accuracy ratio (AR): misura la capacità del modello di individuare le

imprese deboli nelle classi peggiori di Score.

• La frequenza cumulata della popolazione, ordinata secondo uno score crescente, viene messa a confronto con la frequenza cumulata dei passaggi a default effettivamente registrati.

• Un modello efficace tenderà a concentrare la maggior parte dei default entro gli ultimi percentili della distribuzione dello score. Nella figura, il modello esaminato viene confrontato con un modello “ideale” per il quale il 100% dei default cade nell’ultimo x% della popolazione e con un modello completamente “casuale”, dove score e defaultsono completamente indipendenti (retta a 45°).

• L’AR misura la concentrazione statistica dei clienti “Bad” nelle classi di rating di rischio più elevato. Esso presenta un campo di variazione tra 0 e 100 e si ottiene rapportando le seguenti aree:

AR=A/(A+B)

La performance dell’analisi

A

B

Caso non informativo

ScoreCaso ideale










Dagli score alle PD• Nella maggior parte dei casi, il punto di partenza è costituito dagli score

prodotti da modelli logistici. Tali valori, pur essendo compresi tra 0 e 1, possono essere, di norma, interpretati quali indicatori “ordinali” di rischio (ranking) e non direttamente quali PD (indicatori “cardinali”).

• Fa eccezione il caso – minoritario – delle banche che stimano direttamente i modelli sulla popolazione (gli score logistici possono essere interpretati direttamente quali probabilità di default).

• Nella maggioranza dei casi, le banche stimano i modelli su campioni la cui ripartizione tra bonis e default non rispetta le caratteristiche della popolazione. In questi casi, per interpretare gli score quali PD è necessario ricorrere ad alcuni meccanismi di aggiustamento o di ricalibrazione.

• Un concetto importante: Tendenza centrale: concetto equivalente alla frequenza di default osservata sul portafoglio in un determinato arco di tempo (in base alle regole, un ciclo economico, e comunque non meno di 2/5 anni)

Metodologie di calibrazione

• Aggiustamento 1: correzione dell’intercetta

Di cui:

I meccanismi di aggiustamento


• Aggiustamento 2: riponderazione dei default• Aggiustamento 3: approccio misto

1. Filtro bayesiano per riportare alla tendenza centrale la PD individuale campionaria;

2. Creazione di n bucket score/pd;3. Stima di exponential smoothing function;4. Uso della ESF per passare dagli score alle PD

Segue: I meccanismi di aggiustamento


(segue) Aggiustamento 3: approccio misto

ΣNi…

0,21%0,28%-1,22.000

0,07%0,09%-2,42.000

PD adj iPD indScore medianoi

N

PD adj i = e a + b*score i

. . . . . . ..

.PD

adj

Score

)|(1)(1)),|(1(

)|()(),|(

)|()(),|(

)(

sDPDPsiDP

sDPDPsiDP

sDPDPsiDP

iDP

−−

−+=

Le modalità di costruzione dei bucket(numero, composizione) diventano un elemento cruciale


• Aggiustamento 4: multicalibrazione1. L’approccio misto esaminato in precedenza si presta

alla realizzazione di calibrazioni multiple;2. Alcuni gruppi bancari hanno realizzato calibrazioni

separate per aree geografiche ovvero settori di attività;

3. Ratio: i) ovviare a situazioni di bassa perfomance dei sistemi/inadeguata rappresentatività nei campioni; ii) adottare approcci più conservativi

• Consente di passare dagli score/PD individuali alle PD regolamentari.• Tutte le banche esaminate utilizzano apposite scale maestre; non

sempre tali scale sono uniche (cioè, utilizzabili per tutti i diversi modelli nell’ambito del portafoglio corporate)

• Tutte le master scale presentano, per ogni classe di rating, estremi inferiori e superiori definiti in termini di score/pd individuali che “guidano” l’assegnazione degli obligors alle diverse classi

• Ad ogni classe di rating è associata una pooled pd, o PD di classe, da abbinare, per fini regolamentari, a tutti gli obligors inclusi nella stessa classe.

Aspetti Rilevanti

Modalità di costruzione delle scaleQuantificazione delle pooled pd

La Masterscale

La Masterscale

• Approccio # 1

Modalità di costruzione delle scale

Gli estremi delle classi (“cut-off”) vengono definiti sulla base della distribuzione degli score/PD individuali. Una volta fissati i limiti, viene definita, in base a differenti modalità, la PD di classe.

• Approccio # 2

Vengono prima individuate le PD di classe – facendo, ad esempio, riferimento a scale esterne – e, successivamente, gli estremi di ciascuna classe (in genere, posti pari alla media dei logaritmi di due pd di classe contigue)

La Masterscale

• L’approccio # 1 è basato, tipicamente, su tecniche statistiche quali la cluster analysis e la kernel analysis. Talvolta la scelta dei cut-off non è “indipendente” da valutazioni judgementalUn vantaggio è quello di costruire classi di rating giustificabili – in teoria – dal punto di vista statistico

Modalità di costruzione delle scale

• L’approccio # 2 parte dall’assunto di volere massimizzare la valenza “comunicativa” della scala maestra, che viene “ancorata” a metriche pubbliche, con vantaggi evidenti anche in termini di benchmarking.

La Masterscale

• Approccio # 1 (“storico”)

Modalità di quantificazione della pooled pd

La pd pooled è posta eguale alla frequenza di default “storica” osservata per ciascuna classe di rating (non sono necessarie pd individuali)Richiede il ricalcolo dei rating a ritroso su tutta la popolazione per un congruo numero di anni. Può comportare problemi per quanto riguarda le componenti qualitative

1

10

100

1000

1 2 3 4 5

1

10

100

1000

1 2 3 4 5

1

10

100

1000

1 2 3 4 5

Default T-2

Bonis T-3ODFi t-2=

Default T-1

Bonis T-2ODFi t-1=

Default T

Bonis T-1ODFi t=

Pdi (=ODFi) = Σ ODFij

n

n

La Masterscale

• Approccio # 2 (“modelli statistici”)

Modalità di quantificazione della pooled pd

La pd pooled è posta eguale alla media/mediana delle pd individuali delle controparti rientranti in ciascuna classe di ratingNon richiede necessariamente il ricalcolo dei rating a ritroso su tutta la popolazione per tutta la serie storica disponibileDiventa essenziale verificare la distribuzione per ciascuna classe di rating e riscontrare la coerenza con le ODF storiche.

AAA AA A BBB BB ….

Masterscale a confronto

….

0,04%

0,13%

0,29%

0,53%0,85%

1,48%

2,95%

8,75%

0,02%

0,13%

0,25%0,38%

0,68%0,98%1,40%

2,43%

0,00%

0,06%0,09%

0,26%

0,84%

1,93%

4,72%

11,86%19,37%

0,07%0,10%0,15%0,22%0,33%0,50%0,74%1,10%1,64%2,45%3,66%5,46%8,15%12,15%18,13%

0,00%

0,05%

0,10%

0,19%

0,52%

0,94%1,41%

3,40%4,79%7,10%9,36%14,30%17,20%27,60%

0,01%

0,02%0,03%0,04%0,05%0,07%0,09%0,14%0,22%

0,39%0,63%0,89%1,17%1,54%2,03%2,67%3,51%4,62%6,08%8,01%11,29%16,66%

0,07%

0,15%

0,28%0,43%0,63%0,88%1,25%1,75%2,50%4,00%

7,50%

15,00%25,00%

0,00%

0,00%

0,01%

0,10%

1,00%

10,00%

100,00%0 1 2 3 4 5 6 7 8

Credit risk Roma3 2009 set1 - Area Sistemi …host.uniroma3.it/facolta/economia/db/materiali/...Agenda CreditRisk • Definizioni • I sistemi di rating interni • La previsione

Documents