1 Operatori negli spazi di Hilbertzaffaron/operatori.pdflo spazio vettoriale degli operatori lineari continui in uno spazio di Hilbert, e uno spazio di Banach. 1.2 Isomor smo tra spazi

1 Operatori negli spazi di Hilbert

1.1 Operatori lineari in spazi normati

Definizione 1 Una mappa lineare (operatore) tra spazi normati f : X → Y è unamappa che preserva la struttura lineare

f(αx+ βy) = αf(x) + βf(y), x, y ∈ X, α, β ∈ C (1)

Un operatore che abbia come immagine C (X → C) viene anche chiamato funzionalelineare.

Definizione 2 Una mappa lineare tra spazi normati f : X → Y si dice limitata seesiste una costante K tale per cui

‖f(x)‖ ≤ K‖x‖ ∀x ∈ X. (2)

Una mappa limitata manda insiemi limitati in insiemi limitati. Infatti, un insieme è

limitato se è contenuto in una sfera di raggio r (‖x‖ ≤ r); l’immagine della sfera di raggior è però contenuta nella sfera di raggio Kr a causa della definizione 2 (‖f(x)‖ ≤ Kr).

Negli spazi normati il concetto di limitatezza è equivalente a quello di continuità.

Vale infatti il seguente teorema,

Teorema 1 Sia f : X → Y una mappa lineare tra spazi normati. Le seguenti affermazionisono tra loro equivalenti:

a) f è limitata

b) f è continua

c) f è continua in un punto

Dim: a) → b): da ‖f(y) − f(x)‖ = ‖f(y − x)‖ ≤ K‖x − y‖, segue che x → y implicaf(x) → f(y). b) → c): ovvio. c) → a): f sia continua in x0. Per ogni � esiste un δ taleper cui

‖f(x+ x0)− f(x0)‖ = ‖f(x) + f(x0)− f(x0)‖ = ‖f(x)‖ < � (3)

per ogni ‖x‖ < δ. Fissato � e un generico y ∈ X, x = δy(2‖y‖) soddisfa ‖x‖ =

δ2< δ. Quindi

‖f( δy2‖y‖)‖ < � e, di conseguenza, ‖f(y)‖ <

2�δ‖y‖. f è quindi limitata. 2

Definizione 3 Si definisce norma della mappa lineare f il più piccolo dei numeri K per

cui l’identità (2) è valida. La norma di f viene indicata con ‖f‖. Vale quindi

‖f(x)‖ ≤ ‖f‖‖x‖ (4)

1

per ogni x ∈ X. Poichè f è lineare, questa identità si può riscrivere come ‖f( x‖x‖)‖ ≤ ‖f‖.La formula (4) è quindi equivalente a

‖f(x)‖ ≤ ‖f‖, ‖x‖ = 1 (5)

e ‖f‖ può anche essere definito come

‖f‖ = sup‖x‖=1‖f(x)‖. (6)

L’insieme degli operatori continui tra due spazi normati X e Y

B(X, Y ) = {f : X → Y |f lineare limitato} (7)

munito della mappa f → ‖f‖ è uno spazio vettoriale normato.

Teorema 2 B(X, Y ) è uno spazio vettoriale normato. È completo se Y è completo.Dim: È immediato verificare che ‖f‖ definisce una norma. Sia An una successione diCauchy in B(X, Y ). Vale quindi ‖An − Am‖ < � per n,m > n0. Da

‖An(x)− Am(x)‖ = ‖(An − Am)(x)‖ ≤ ‖An − Am‖‖x‖ < �‖x‖ (8)

concludiamo che ‖An(x)‖ è una successione di Cauchy in Y per ogni x fissato. Poichè Yè completo, An(x) convergerà a un vettore in Y che chiamiamo A(x). A è ovviamente

un operatore lineare ed è anche continuo; infatti passando al limite nell’equazione (8)

otteniamo ‖A(x)−An(x)‖ ≤ �‖x‖ e ‖A(x)‖ = ‖(A(x)−An(x))+An(x)‖ ≤ (�+‖An‖)‖x‖.Quindi A ∈ B(X, Y ). Infine dalle stesse equazioni segue che ‖An − A‖ ≤ � e che lasuccessione An converge ad A nella norma di B(X, Y ). 2

Ricordiamo che uno spazio vettoriale normato completo si chiama spazio di Banach.

Se Y è uno spazio di Banach anche B(X, Y ) lo è. In particolare, B(H) ≡ B(H,H), cioèlo spazio vettoriale degli operatori lineari continui in uno spazio di Hilbert, è uno spazio

di Banach.

1.2 Isomorfismo tra spazi di Hilbert

Definizione 3: Un isomorfismo tra spazi normati (o spazi di Hilbert) è una mappa

lineare biunivoca che preserva la norma: ‖f(x)‖ = ‖x‖.

Osservazioni: una mappa che preserva la norma si chiama anche isometria. In gen-

erale, un isomorfismo tra spazi è una mappa biunivoca che preserva le proprietà (alge-

briche, topologiche, etc...) che sono definite su questi spazi. Nel caso particolare in cui lo

spazio normato sia anche uno spazio di Hilbert sembrerebbe più naturale definire un iso-

morfismo come una mappa lineare che preserva il prodotto scalare: (f(x), f(y)) = (x, y).

2

Le due definizioni sono in realtà equivalenti: qualora in uno spazio siano definiti sia un

prodotto scalare che l’associata norma, una mappa lineare che preserva l’uno preserva

anche l’altra, e viceversa. Infatti, norma e prodotto scalare si possono ricostruire una

dall’altro attraverso le identità

‖x‖2 = (x, x)4(x, y) = ‖x+ y‖2 − ‖x− y‖2 + i(‖x+ iy‖2 − ‖x− iy‖2) (9)

Esempio 1: Ogni spazio di Hilbert H separabile è isomorfo a l2. Ricordiamo che uno

spazio di Hilbert si dice separabile quando possiede un sistema ortonormale completo

(s.o.n.c.) numerabile. In uno spazio di Hilbert separabile, scelto un s.o.n.c. {xi}, ognix ∈ H si scrive in maniera unica come x =

∑aixi. Questa identificazione induce una

mappa H → l2 : x → {ai} che è un isomorfismo di spazi di Hilbert. Innanzitutto, lamappa è ben definita ed è un’isometria perchè

∑|ai|2 = ‖x‖2. La mappa è iniettiva

per l’unicità dei coefficienti di Fourier, ed è suriettiva perchè, per ogni successione in l2

vale∑|ai|2 < ∞ e di conseguenza la formula x =

∑aixi definisce un elemento di H.

L’isomorfismo in questione non è naturale perchè richiede la scelta di una base.

Esempio 2: La trasformata di Fourier può essere pensata come una mappa lineare da

L2(R) in L2(R). Preserva la norma ‖f̂‖ = ‖f‖ (teorema di Parseval) ed è biunivoca. Èpertanto un isomorfismo.

1.3 Il teorema di Riesz

Il teorema di Riesz caratterizza i funzionali lineari continui in uno spazio di Hilbert.

Ricordiamo dall’algebra lineare che l’insieme dei funzionali lineari in uno spazio vettoriale

V è anch‘esso uno spazio vettoriale che prende il nome di spazio duale V ∗. Nel caso di

spazi normati è utile modificare la definizione richiedendo che V ∗ sia lo spazio vettoriale

dei funzionali lineari continui. Dal teorema 2, segue che V ∗ è uno spazio vettoriale

normato completo. Nel caso finito-dimensionale, V e V ∗ hanno la stessa dimensione e

sono quindi banalmente isomorfi. La struttura di spazio di Hilbert consente di definire

un isomorfismo naturale tra H e il suo duale H∗ per ogni spazio di Hilbert. Per ogni

x0 ∈ H possiamo definire un particolare funzionale lineare continuo H → C : x→ (x, x0).Il teorema di Riesz garantisce che ogni funzionale continuo ha questa forma e stabilisce

un’isomorfismo tra H e H∗.

Teorema 3 (Riesz): Ogni funzionale lineare continuo L su uno spazio di Hilbert H si

può scrivere in maniera univoca come L(x) = (x, x0). Vale inoltre ‖L‖ = ‖x0‖.

3

Dimostrazione: Nel caso particolare L = 0, x0 = 0 e il teorema è ovvio. Possiamo

quindi supporre L 6= 0. Definiamo M = {x ∈ H|Lx = 0}. Poichè L è lineare e continuo,M è un sottospazio chiuso di H ed ammette quindi un complemento ortogonale M⊥.

Scegliamo un particolare z ∈ M⊥ con ‖z‖ = 1. Definito u = L(x)z − L(z)x, abbiamoche L(u) = L(x)L(z) − L(z)L(x) = 0; quindi u ∈ M . Visto che u ∈ M e z ∈ M⊥,0 = (u, z) = L(x)(z, z) − L(z)(x, z). Ne segue che L(x) = L(z)(x, z) = (x, L(z)z).Quindi il teorema vale con x0 = L(z)z. Da |L(x)| = |(x, x0)| ≤ ‖x‖‖x0‖ segue che‖L‖ ≤ ‖x0‖. Visto che |L(x0)| = ‖x0‖2, la disuguaglianza precedente è certamentesaturata e ‖L‖ = ‖x0‖. L’unicità segue dal fatto che, se L(z) = (x, x0) = (x, x′0), allora(x, x0−x′0) = 0; x0−x′0 è quindi nullo perchè ortogonale a qualunque vettore nello spaziodi Hilbert. 2

1.4 Esempi di operatori negli spazi di Hilbert

Consideremo operatori lineari A : H → H. Per semplicità le parentesi tonde in A(x)saranno a volte omesse: Ax sta per A(x). Se non altrimenti specificato, useremo lettere

maiuscole dell’alfabeto latino per indicare operatori negli spazi di Hilbert, lettere minus-

cole (della parte finale) dell’alfabeto latino per indicare vettori in H e lettere greche per

indicare scalari.

Esempio 1: caso finito dimensionale. A : H → H, dimH = N . Scegliamo unabase ei, i = 1, ..., N . Consideriamo lo sviluppo di x e di Ax: x =

∑Ni=1 xiei e Ax =∑N

i=1(Ax)iei. Si ha che

(Ax)i = (Ax, ei) = (A(N∑j=1

xjej), ei) =N∑j=1

xj(Aej, ei) (10)

Vediamo che A, in termini delle coordinate rispetto alla base scelta, è rappresentato da

una matrice

(Ax)i =N∑j=1

Aijxj, Aij = (Aej, ei) (11)

Gli operatori negli spazi infinito dimensionali generalizzano il concetto di matrice.

Come dimostrano i seguenti esempi, molte proprietà valide negli spazi di dimensione

finita sono false negli spazi di dimensione infinita.

Esempio 2: operatore di shift in H = l2. A({a1, a2, ....}) = {0, a1, a2, ....} definisce unoperatore lineare continuo con norma 1. È infatti un’isometria: ‖Ax‖ = ‖x‖. È iniettivoma non suriettivo: l’elemento z = {1, 0, 0, ....} non è infatti nell’immagine di A. A mappa

4

H biunivocamente in un suo sottoinsieme proprio A(H) = ({z})⊥. Questo è possibilesolo perchè H è infinito-dimensionale. A si può rappresentare come una matrice infinita

Aij, i, j = 1, 2.... le cui sole entrate non nulle sono Ai+1,i = 1, i = 1, 2....

Esempio 3: gli operatori posizione e momento della Meccanica Quantistica. Definiamo

in L2[a, b] −∞ ≤ a < b ≤ ∞ gli operatori

x̂ : x̂f(x) = xf(x)

p̂ : p̂f(x) = −i dfdx

(x) (12)

I due operatori soddisfano le regole di commutazione di Heisenberg [x̂, p̂] = i come segue

dal semplice calcolo

x̂p̂f(x)− p̂x̂f(x) = −ix ddxf(x) + i

d

dx(xf(x)) = if(x) (13)

Esistono operatori A e B che soddisfano l’algebra astratta di Heisenberg [A,B] = i

soltanto in spazi infinito dimensionali. Infatti, in uno spazio di dimensione finita N ,

A e B sarebbero rappresentabili da matrici N per N e l’equazione [A,B] = i sarebbe

inconsistente, come si vede prendendo la traccia:

0 = Tr[A,B] = Tr(AB)− Tr(BA) = Tr(AB)− Tr(AB) ≡ N (14)

dove si è usata la properietà di ciclicità della traccia.

Esempio 4: operatori differenziali in H = L2(X), X sottoinsieme di Rn. Per semplicità

consideriamo X = (a, b),−∞ ≤ a < b ≤ ∞ e il più semplice degli operatori differen-ziali: A = −i∂x. L’operatore A ha due seri problemi: 1) Non è continuo. Consideriamoad esempio yn(x) = e

−nx in L2[0, π]. Ayn = inyn e di conseguenza ‖Ayn‖/‖yn‖ = nnon può essere limitato. 2) Non è nemmeno definito ovunque. Infatti non tutte le fun-

zioni a quadrato sommabile sono derivabili con derivata ancora appartenente allo stesso

spazio. A è definito solo su un sottoinsieme D(A) di H che prende il nome di dominiodell’operatore. D(A) contiene almeno tutte le funzioni C1[a, b] ed è un sottoinsieme densodi L2[a, b]. I problemi 1)+2) sono comuni a tutti gli operatori differenziali.

Osservazione sul dominio: l’esempio 4 descrive una caratteristica generale della teoria

degli operatori negli spazi di Hilbert: gli operatori di maggior interesse non sono continui

e non sono nemmeno definiti sull’intero H. Gli operatori continui possono sempre estesi

all’intero H. Se un operatore continuo A è definito in un dominio D(A) può sempreessere esteso a D(A) per continuità. Vale infatti

5

Teorema 4: Un operatore lineare A in uno spazio normato completo X che sia definito

e continuo in un sottoinsieme denso U può essere esteso ad un operatore continuo definito

sull’intero X.

Dim: Vale ‖Ax‖ ≤ ‖A‖‖x‖ in U . Poichè U è denso in X, ogni x ∈ X sarà limite di unasuccessione di elementi xn in U . Poichè xn converge, sarà di Cauchy, quindi ‖xn−xm‖ < �per n,m sufficientemente grandi. Da ‖Axn −Axm‖ = ‖A(xn − xm)‖ ≤ ‖A‖‖xn − xm‖ <�‖A‖ segue che la successioneAxn è di Cauchy, e quindi, per la completezza diX, convergead un elemento che chiamiamo Ax. Prendendo il limite dell’equazione ‖Axn‖ ≤ ‖A‖‖xn‖otteniamo ‖Ax‖ ≤ ‖A‖‖x‖. La mappa x → Ax definisce quindi un’estensione di Aall’intero spazio X. L’estensione è ancora un operatore continuo con la stessa norma di

A definito in U .2

A si può poi estendere ad H in molti modi possibili. Il più semplice è richiedere, ad

esempio, che si annulli in D(A)⊥

. In questo modo si ottiene un’estensione continua di A

all’intero H. Nel seguito supporremo pertanto che ogni operatore continuo sia definito

sull’intero H.

Come abbiamo visto, gli operatori non continui sono invece definiti solo su un sottoin-

sieme di H e, in generale, non sono estendibili all’intero H. In questo caso è importante

specificare il dominio di definizione. Poichè le proprietà degli operatori possono variare

a seconda dell’insieme di definizione, nel seguito, la parola operatore implicitamente in-

dicherà la coppia (A,D(A)). È ragionevole richiedere almeno che il dominio D(A) siaun sottoinsieme denso di H. La mancanza di continuità viene solitamente rimpiazzata

da una condizione più debole ma sufficiente per molte applicazioni, la chiusura. Un

operatore si dice chiuso se le due condizioni xn → x e Axn → y implicano y = Ax1. Richiederemo sempre agli operatori non continui di essere densamente definiti (cioè

D(A) = H) e chiusi.

1.5 Operatori autoaggiunti e unitari

Dato un operatore (A,D(A)) densamente definito inH (cioèD(A) = H) esiste l’operatoreaggiunto (A∗,D(A∗)) che soddisfa

(Ax, y) = (x,A∗y), x ∈ D(A), y ∈ D(A∗) (15)

ed è definito in

D(A∗) = {y ∈ H|Ly : H → C, x→ (Ax, y) funzionale lineare continuo} (16)1Nel caso di operatori continui la sola condizione xn → x implica Axn → Ax. Nel caso di operatori

non continui Axn potrebbe anche non convergere. Per operatori chiusi, se xn converge a x e Axnconverge, quest’ultimo deve convergere a Ax. La definizione di chiusura si può riformulare in maniera

più semplice cos̀ı: un operatore A si dice chiuso se il suo grafico, cioè l’insieme delle coppie {(x,Ax)},è un sottoinsieme chiuso di H ×H.

6

Nel caso di operatori continui l’equazione (15) vale per tutti gli x, y ∈ H. Nel caso dioperatori non continui, l’aggiunto è definito nel dominio indicato, che potrebbe essere

diverso da quello di A.

L’esistenza dell’aggiunto è garantita dal teorema di Riesz. Per y ∈ D(A∗) fissato, lamappa Ly : D(A) → C : x → (Ax, y) è un funzionale lineare continuo definito inD(A). Poichè D(A) è denso in H, il teorema 4 garantisce che Ly si può estendere adun funzionale continuo su H. Per il teorema di Riesz, esiste allora z ∈ H tale per cuiLy(x) = (Ax, y) = (x, z) per ogni x. z dipenderà da y: chiamiamolo z = A

∗y. La mappa

A∗ che associa ad ogni y uno z è un operatore lineare che soddisfa l’equazione (15).

Esempio 1 Ogni operatore A in CN è associato ad una matrice Aij. Calcoliamo lamatrice associata a A∗. Usando l’equazione (11): (A∗)ij = (A

∗ej, ei) = (ej, Aei) =

(Aei, ej) = Aji. La matrice dell’aggiunto di A è quindi la matrice aggiunta (o coniugata

hermitiana), cioè la matrice trasposta coniugata: A∗ij = Aji.

Non è difficile dimostrare che

Teorema 3: Se A è continuo anche A∗ è un operatore continuo e ‖A∗‖ = ‖A‖. InoltreA∗∗ = A.

Dim: Se A è continuo, è anche limitato: ‖A‖ < ∞. Usando l’identità di Schwarz,otteniamo:

|(A∗x, y)| = |(x,Ay)| ≤ ‖x‖‖Ay‖ ≤ ‖x‖‖A‖‖y‖ (17)

Scegliendo y = A∗x otteniamo: ‖A∗x‖2 ≤ ‖x‖‖A‖‖A∗x‖ cioè ‖A∗x‖ ≤ ‖x‖‖A‖; ne segueche A∗ è limitato, quindi continuo, con

‖A∗‖ ≤ ‖A‖. (18)

In particolare, visto che A∗ è continuo, anche A∗∗ esiste ed è continuo; l’equazione (15)

ci dice che (A∗∗x, y) = (x,A∗y) = (Ax, y) per ogni x, y e quindi A∗∗ = A. La disug-

uaglianza (18) applicata a A∗∗ ci dice che ‖A‖ = ‖A∗∗‖ ≤ ‖A∗‖, da cui ‖A∗‖ = ‖A‖.2

Si può dimostrare [1] che il teorema precedente vale per operatori illimitati nella seguente

forma: se A è chiuso e densamente definito, A∗ è anch‘esso chiuso e densamente definito

e soddisfa A∗∗ = A.

Considereremo tre classi importanti di operatori:

1. Operatori autoaggiunti. A si dice autoaggiunto se A = A∗.

7

Osservazione importante: nella definizione di autoaggiuntezza, l’affermazione A = A∗

va intesa come: (A,D(A)) = (A∗,D(A∗)). può succedere che, dato A definito su D(A), A∗

esista e coincida con A in D(A) ma sia definito in un dominio più ampio D(A∗) ⊃ D(A).In questo caso l’operatore è solo formalmente autoaggiunto. Possiamo quindi definire

due forme di autoaggiuntezza:

A è simmetrico se vale

(Ax, y) = (x,Ay), x, y ∈ D(A) (19)

Questa condizione garantisce semplicemente che A∗ esiste e coincide con A in D(A). Ingenerale A∗ sarà un’estensione di A: D(A∗) ⊃ D(A).

A è autoaggiunto se vale A ≡ A∗, cioè se A e A∗ coincidono come operatori (dominioincluso!): D(A) = D(A∗).

Come vedremo, gli operatori autoaggiunti hanno proprietà che gli operatori simmetrici

non possiedono. Per operatori continui, che non hanno problemi di dominio, autoaggiun-

tezza e simmetria coincidono.

Esempio 1: nel caso finito-dimensionale, A è autoaggiunto se lo è la matrice corrispon-

dente: Aij = Aji. Una matrice con questa proprietà si chiama anche simmetrica (nel

caso reale) o hermitiana (nel caso complesso).

Esempio 2: un altro esempio importante di operatore autoaggiunto è l’operatore A =

−i∂x in L2[a, b], −∞ ≤ a < b ≤ ∞. L’operatore non è continuo. Consideriamo la formula(15) per funzioni f, g molto regolari, in modo che tutte le formule e le manipolazioni

formali abbiano senso (notare che la i nella definizione di A è importante):

(−i∂xf, g) =∫ ba

(−if ′(t)g(t))dt = −ifg|ba +∫ ba

f(t)(−ig′(t))dt = −ifg|ba + (f,−i∂xg)

(20)

Condizione necessaria perchè l’operatore sia autoaggiunto è che il termine di bordo si

annulli. È quindi necessario specificare un dominio D(A), ovvero dire quali sono le

condizioni al contorno delle funzioni considerate. In particolare, l’annullarsi dei termini

di bordo per tutte le funzioni f, g ∈ D(A) garantisce l’equazione

(Af, g) = (f, Ag), f, g ∈ D(A) (21)

garantisce cioè che l’operatore è simmetrico. A∗ è quindi un’estensione di A. Tipicamente

D(A) viene inizialmente scelto sulla base del problema in considerazione, in modo da

8

annullare i termini al bordo. Se una considerazione più attenta mostra che in realtà A∗ è

definito su un dominio più ampio, si può tentare di estendere il dominio di A sperando che

quello di A∗ si restringa. Per approssimazioni successive si può arrivare ad un operatore

autoaggiunto: D(A) ⊂ D(A1) ⊂ ... ⊂ D(Aaut) ⊂ ... ⊂ D(A∗1) ⊂ D(A∗), dove Aaut ≡A∗aut, dominio incluso. Esistono molti domini diversi in cui A risulta simmetrico, mentre

ne esiste uno solo in cui A è autoaggiunto.

Consideriamo, ad esempio, l’operatore −i∂x in L2(R). Ogni funzione in L2(R) si annullaall’infinito e i termini al bordo nell’equazione (20) si annullano automaticamente. Occorre

però scegliere ancora il dominio dell’operatore imponendo opportuni requisiti di regolarità

alle funzioni. La scelta più semplice di un dominio denso in L2(R) composto da funzionimolto regolari è S(R). L’operatore −i∂x non è però autoaggiunto S(R). Esistono infattifunzioni g /∈ S(R) che soddisfano la condizione (−i∂f, g) = (f,−i∂g) per ogni f ∈ S(R).Si può dimostrare che −i∂x in L2(R) è simmetrico nel dominio S(R) e autoaggiunto neldominio {fAC , f ′′ ∈ L2(R)} 2.Consideriamo ora l’operatore−i∂x definito sull’intervallo limitato [0, 1]. Definiamo cinqueoperatori diversi, che differiscono solo per la scelta del dominio :

AL = −i∂x D(AL) = {hAC , h′ ∈ L2[0, 1]|h(0) = 0}AR = −i∂x D(AR) = {hAC , h′ ∈ L2[0, 1]|h(1) = 0}A1 = −i∂x D(A1) = {hAC , h′ ∈ L2[0, 1]|h(0) = h(1) = 0}A2 = −i∂x D(A2) = {hAC , h′ ∈ L2[0, 1]|h(0) = h(1)}A3 = −i∂x D(A3) = {hAC , h′ ∈ L2[0, 1]} (22)

Non è difficile verificare che A1 è simmetrico, A2 è autoaggiunto, A∗1 = A3 e A

∗L = AR.

Cominciamo con l’osservare che i termini di bordo nell’equazione (20) non si annullano

per funzioni f, g che appartengono ai domini di AL, AR; questi operatori non sono quindi

simmetrici. Calcoliamo l’aggiunto di AL: questo dovrà soddisfare l’equazione (ALf, g) =

(f, A∗Lg) per ogni f ∈ D(AL) e g ∈ D(A∗L). Consideriamo la formula (20): AL e ARagiscono entrambi come −i∂x e, se scegliamo f(0) = 0, i termini al bordo si cancellanoper ogni funzione che soddisfi g(1) = 0. Ne segue che (ALf, g) = (f, ARg) per ogni

f ∈ D(AL) e g ∈ D(AR), da cui concludiamo che A∗L = AR 3. Consideriamo ora A1, A22Il suffisso AC indica che la funzione deve essere scelta assolutamente continua (cfr Rudin, Real and

Complex Analysis). Questa richiesta serve a garantire la validità del teorema fondamentale del calcolo

integrale (f(b) − f(a) =∫ baf ′(x)dx) e la possibilità di integrare per parti. È un requisito tecnico che

serve ad eliminare alcune funzioni patologiche che pure sono L2 con derivata L2. Alcuni testi riformulano

le condizioni fAC , f′ ∈ L2 in maniera equivalente richiedendo di lavorare nello spazio di Sobolev H1 (che

è uno spazio di distribuzioni).3Per essere precisi, abbiamo solo dimostrato che A∗L è un‘estensione di AR: il dominio di A

∗L potrebbe

essere più grande di quello di AR. Possiamo dimostrare che A∗L ≡ AR come segue. Sia dato g ∈ D(A∗L),

9

e A3: abbiamo una catena di operatori, con domini che soddisfano D(A1) ⊂ D(A2) ⊂D(A3) e che coincidono a coppie nell’intersezione dei loro domini. Gli operatori A1 e A2sono simmetrici poichè i termini di bordo nell’equazione (20) si annullano per funzioni

f, g ∈ D(Ai), i = 1, 2. A3 non è invece simmetrico. Notiamo tuttavia che A1 non èautoaggiunto. Infatti i termini di bordo nell’equazione (20) si annullano anche nel caso

in cui f si annulla agli estremi e g è arbitraria; per ogni coppia di funzioni f ∈ D(A1)e g ∈ D(A3) vale l’equazione (A1f, g) = (f, A3g). Ne concludiamo che A∗1 = A3. Inmaniera analoga ci si può convincere che A2 = A

∗2. A1 è quindi un operatore simmetrico

ma non autoaggiunto, mentre A2 è autoaggiunto.

2. Operatori unitari. U si dice unitario se UU∗ = U∗U = I, dove I è l’identità. Nel

caso finito-dimensionale, U è unitario se lo è la matrice corrispondente. Gli operatori

unitari preservano norma e prodotto scalare: infatti (Ux, Uy) = (x, U∗Uy) = (x, y). U

è ovviamente invertibile con inverso U∗. Un operatore unitario è quindi un’isomorfismo

di H in sè stesso. Visto che ‖U(x)‖ = ‖x‖, U è necessariamente continuo e di norma1. È anche possibile pensare agli operatori unitari come cambi di base nello spazio di

Hilbert: se {φi} è un s.o.n.c. anche {Uφi} lo è, come si verifica facilmente usando leproprietà che abbiamo appena discusso. Un esempio notevole di operatore unitario in

L(R) è l’operatore Trasformata di Fourier.

3. Proiettori. Per ogni sottospazio chiuso S di H abbiamo la decomposizione ortogonale

H = S + S⊥. Ogni x si scrive in maniera unica come x = y + z con y ∈ S, z ∈ S⊥. Ilproiettore P sul sottospazio S è definito dalla formula Px = y.

Teorema: P è continuo, autoaggiunto e idempotente (cioè P 2 = P ).

Dim: P 2 = P è ovvio. Da ‖x‖2 = ‖y‖2 + ‖z‖2, otteniamo ‖Px‖2 = ‖y‖2 ≤ ‖x‖2.Quindi P è continuo e ‖P‖ ≤ 1. Infine, date le decomposizioni ortogonali di due vettorixi = yi + zi, i = 1, 2 con Pxi = yi, (Px1, x2) = (y1, x2) = (y1, y2 + z2) = (y1, y2) =

(y1 + z1, y2) = (x1, Px2) quindi P è autoaggiunto. 2

1.6 Autovalori e teoria spettrale

La teoria spettrale generalizza agli spazi di Hilbert lo studio di autovalori ed autovettori.

È noto dall’algebra elementare che ogni matrice autoaggiunta ha autovalori reali e una

che quindi soddisfa (ALf, g) = (f,A∗Lg) per ogni f ∈ D(AL). A∗Lg esiste ed è L2. Esiste quindi anche

φ(x) = −i∫ 1xA∗Lgdx che soddisfa φ(1) = 0 e −i∂xφ = A∗Lg. Vogliamo dimostrare che φ ≡ g, da cui

deduciamo che l’azione di A∗L su g è una derivata e che g(1) = 0, cioè A∗L = AR. Da (g,ALf) =

(A∗Lg, f) =∫ 10A∗Lgf̄ = −i

∫ 10∂φf̄ = −iφf̄ |10 +

∫ 10φ(−i∂f) = (φ,ALf) deduciamo (g − φ,ALf) = 0.

Non è difficile convincersi che l’immagine di AL è perlomeno densa in L2: concludiamo che g = φ. Un

ragionamento analogo può essere usato per rendere rigorosi gli altri argomenti riportati nel testo.

10

base ortonormale di autovettori. In questa base la matrice è diagonale. In uno spazio

di Hilbert è necessario estendere il concetto di autovalore introducendo autovalori gen-

eralizzati e lo spettro di un operatore. La teoria spettrale garantisce che un operatore

autoaggiunto ha spettro reale e può essere diagonalizzato.

Ricordiamo che λ ∈ C e x ∈ H non nullo si definiscono autovalore e autovettoredell’operatore A in H se vale

Ax = λx (23)

Il nucleo Ker(A−λI) dell’operatore A−λI è quindi non nullo e si definisce autospazioassociato all’autovalore λ. L’operatore A− λI non è ovviamente invertibile.

È utile generalizzare il concetto di autovalore estendendolo a tutti i numeri λ ∈ C percui A− λI non è invertibile nel senso della seguente definizione:

Def: Si definisce spettro σ(A) dell’operatore A in uno spazio di hilbert H l’insieme dei

λ ∈ C per cui (A− λI)−1 /∈ B(H). Lo spettro si divide naturalmente in tre sottoinsiemidisgiunti:

Spettro discreto: l’insieme dei λ ∈ C per cui A − λI non è iniettivo, e quindi non èinvertibile come mappa lineare

Spettro continuo: l’insieme dei λ ∈ C per cui A−λI è invertibile come mappa lineare,è densamente definito ma (A− λI)−1 : Im(A− λI)→ H non è un operatore continuo

Spettro residuo: l’insieme dei λ ∈ C per cui A− λI è invertibile come mappa linearema non è densamente definito

Lo spettro discreto corrisponde all’insieme degli autovalori di A. Infatti se A−λI nonè iniettivo, Ker(A−λI) 6= 0 ed esiste almeno una soluzione non nulla dell’equazione Ax =λx. Lo spettro continuo è la vera novità per gli operatori in spazi infinito dimensionali.

Poichè A − λI è invertibile, Ker(A − λI) = 0 e λ non è un autovalore. λ appartenenteallo spettro continuo è però un autovalore approssimato:

Teorema 5: Per ogni λ ∈ C appartenente allo spettro continuo, esiste una successionedi vettori xn tali per cui ‖Axn − λxn‖ → 0.Dim: (A − λI)−1 non è continuo, quindi esiste una sucessione yn tale per cui ‖(A −λI)−1yn‖ ≥ n‖yn‖. Definendo wn = (A − λI)−1yn si ha che ‖Awn − λwn‖ ≤ ‖wn‖/n.Infine se xn = wn/‖wn‖ si ha che ‖Axn − λxn‖ ≤ 1/n→ 0. 2

11

L’equazione agli autovalori può quindi essere approssimata a piacere quando λ appartiene

allo spettro continuo. Ovviamente la successione xn non può convergere in H. In caso

contrario, se xn → x ∈ H, il teorema 5 garantisce che Axn → λx, e quindi, sotto lasola condizione che A sia chiuso, Ax = λx e λ sarebbe un autovalore. Tipicamente,

esiste uno spazio topologico H ⊂ Y di funzioni o distribuzioni a cui può essere estesa ladefinizione dell’operatore A in cui la successione xn ∈ H converge a un vettore x ∈ Ye vale l’equazione Ax = λx come equazione per vettori e operatori in Y . Per questa

ragione λ appartenente allo spettro continuo si chiama anche autovalore generalizzato e

la distribuzione x autofunzione generalizzata. Lo spettro residuo è il meno interessante.

Gli operatore interessanti hanno spettro residuo vuoto.

Teorema 6: Se A è autoaggiunto, i suoi autovalori sono reali e gli autovettori cor-

rispondenti ad autovalori diversi sono mutuamente ortogonali. L’intero spettro σ(A) è

un sottoinsieme dell’asse reale e lo spettro residuo è vuoto.

Dim: Dato u 6= 0 con Au = λu: λ(u, u) = (λu, u) = (Au, u) = (u,Au) = (u, λu) =λ(u, u). Da (u, u) 6= 0 segue che λ = λ, cioè gli autovalori sono reali. Analogamente,siano u1, u2 due autovettori corrispondenti a due autovalori distinti: Aui = λiui, i = 1, 2.

λ1(u1, u2) = (λ1u1, u2) = (Au1, u2) = (u1, Au2) = (u1, λ2u2) = λ2(u1, u2). Dalla realtà

degli autovalori segue che (λ1 − λ2)(u1, u2) = 0. Infine dal fatto che λ1 6= λ2, segue che(u1, u2) = 0. Dimostriamo ora che lo spettro continuo è reale e lo spettro residuo vuoto.

Dato λ = λ1 + iλ2 con λi ∈ R calcoliamo

‖(A− λI)x‖2 = ‖(A− λ1I)x− iλ2x‖2 = ‖(A− λ1I)x‖2 + |λ2|2‖x‖2 (24)

(i termini misti si annullano per la simmetria di A: ((A − λ1I)x,−iλ2x) + (−iλ2, (A −λ1I)x) = iλ2(((A − λ1I)x, x) − (x, (A − λ1I)x)) = 0). Dall’equazione precedente segueche ‖(A − λI)x‖2 ≥ |λ2|2‖x‖2. Definendo y = (A − λI)x si ha che ‖(A − λI)−1y‖2 ≤‖y‖2/|λ2|2. Se λ2 6= 0 l’operatore inverso (A − λI)−1 è continuo e quindi ogni λ conparte immaginaria non nulla non appartiene allo spettro continuo. Infine, se λ non è un

autovalore anche λ̄ non lo è, poichè gli autovalori sono reali. Quindi Ker(A− λ̄I) = {0}.Ora, se x ∈ Ker(A − λ̄I) allora 0 = (Ax − λ̄x, y) = (x,Ay) − λ̄(x, y) = (x, (A − λI)y)per ogni y a causa dell’autoaggiuntezza di A; quindi x ∈ (Im(A − λI))⊥. Ne segue(Im(A − λI))⊥ = Ker(A − λ̄I) ≡ {0}. L’immagine dell’operatore A − λI, che è ildominio dell’operatore inverso (A− λI)−1 è quindi denso in H e λ non può appartenereallo spettro residuo che è quindi vuoto. 2

Si dimostra analogamente che

Teorema 7: Se A è unitario, i suoi autovalori sono numeri complessi di modulo unitario

12

e gli autovettori corrispondenti ad autovalori diversi sono mutuamente ortogonali. Lo

spettro è un sottoinsieme del cerchio unitario e lo spettro residuo è vuoto.

Esempio 1: consideriamo il caso finito-dimensionale. È ben noto che ogni matrice

autoaggiunta può essere diagonalizzata. Infatti l’equazione agli autovalori (23) si riduce

ad un‘equazione matriciale Ax = λx in CN . Da (A − λI)x = 0 segue che gli autovalorisoddisfano l’equazione caratteristica

det(A− λI) = 0 (25)

Questa è un’equazione polinomiale di gradoN in λ che quindi ha esattamenteN soluzioni.

Ne concludiamo che esistono esattamente N autovalori λi, i = 1, ..., N . Se sono tutti

distinti, il teorema 6 garantisce l’esistenza di N autovettori mutuamente ortogonali.

Possiamo costruire una base o.n.c. {ui}, i = 1, ..., N usando gli autovettori oppor-tunamente normalizzati. Questo cambiamento di base è quello che nei corsi di alge-

bra lineare si usa per diagonalizzare una matrice simmetrica o autoaggiunta. Nella

base {ui}, infatti, la matrice associata ad A è diagonale, A = diag(λ1, ..., λN), poichèAij = (Auj, ui) = λj(uj, ui) = λiδij. Nel caso ci siano autovalori multipli, ognuno di

questi è associato a un sottospazio di CN di dimensione pari alla molteplicità; in ognunodi questi sottospazi possiamo scegliere autovettori mutuamente ortogonali in modo da

completare un s.o.n.c. in CN .

Esempio 2: consideriamo l’operatore A2 = −i∂x autoaggiunto in D(A2) = {fAC , f ′ ∈L2[0, 1]|f(0) = f(1)}. I suoi autovalori e autovettori si determinano dall’equazione dif-ferenziale −iy′ = λy che ha soluzioni y = Aeiλx. Le condizioni al contorno (periodicitàdi y) impongono λ = 2πn = 0, 1, 2, .... L’insieme degli autovettori, opportunamente

normalizzati, un = e2πnx è un s.o.n.c. in L2[0, 1] (base di Fourier).

Vediamo che l’esempio 2 generalizza in maniera molto semplice il risultato valido in

uno spazio finito-dimensionale: gli autovettori dell’operatore autoaggiunto possono essere

scelti in modo da formare un s.o.n.c. in H. Questa situazione non si generalizza ad ogni

operatore in uno spazio di Hilbert, come dimostra l’esempio seguente:

Esempio 3: consideriamo ancora l’operatoreA = −i∂x definito però inD(A) = {fAC , f ′ ∈L2(R)}. È anch‘esso autoaggiunto. I suoi autovalori e autovettori si determinano ancorauna volta dall’equazione differenziale −iy′ = λy che ha soluzioni y = Aeiλx. Questesoluzioni però non sono L2(R) per nessun valore di λ. L’operatore A non possiede alcunautovalore nè autovettore. Notiamo tuttavia che, sebbene non sia possibile trovare alcun

vettore x ∈ H che soddisfi l’equazione Ax = λx, è possibile trovare vettori xn ∈ H che

13

approssimino questa equazione con un errore arbitrariamente piccolo per ogni λ reale:

‖Axn − λxn‖ ≤ �. Infatti non è difficile definire delle funzioni xn ∈ C1(R), nulle aldi fuori dell’intervallo (−n − 1, n + 1) e coincidenti con eiλx nell’intervallo (−n, n) chesoddisfino alla proprietà limn→∞ ‖Axn − λxn‖ = 0 per λ reale. Si può dimostrare infatti[1] che lo spettro dell’operatore è puramente continuo e coincidente con l’asse reale. Le

funzioni uλ = eiλx con λ ∈ R vengono chiamate autovettori generalizzati. In effetti le

funzioni xn che soddisfano la proprietà dell’autovalore approssimato in questo esempio

convergono a uλ = eiλx quando n tende all’infinito. Le funzioni uλ non appartengono allo

spazio di Hilbert L2(R) ma possono essere interpretate come elementi di uno spazio piùampio di distribuzioni Y . Nello spazio Y l’equazione −i∂xuλ = λuλ è soddisfatta.

Un operatore autoaggiunto generico possiede sia spettro discreto che spettro continuo.

Il teorema spettrale viene formulato come segue. È possibile associare ad ogni auto-

valore generalizzato λ una distribuzione uλ chiamata autovettore generalizzato. uλè definito come limite nello spazio delle distribuzioni dei vettori xn ∈ H che appaiononella definizione di autovalore generalizzato. La successione xn non converge ad alcun

elemento di H, ma converge nel senso delle distribuzioni a uλ che non appartiene ad H.

Teorema Spettrale: ogni operatore autoaggiunto A in uno spazio di Hilbert è caratter-

izzato dai suoi autovalori e autovettori {λn, un} che formano un s.o.n. (spettro discreto) eda una o più famiglie continue di autovalori e autovettori generalizzati (spettro continuo)

{λ, uλ} tali per cui ogni elemento dello spazio di Hilbert si può scrivere come

f =∑n

anun +

∫a(λ)uλdλ (26)

Attraverso il teorema spettrale abbiamo effettivamente diagonalizzato l’operatore e ab-

biamo la possibilità di sviluppare il generico elemento x ∈ H nella base degli autovettori,ordinari e generalizzati. La diagonalizzazione di A segue dalla formula

Af =∑n

λnanun +

∫λa(λ)uλdλ (27)

Per una definizione corretta dell’integrale nella precedente formula rimandiamo a [1].

Esempio 3. Continuazione: ogni funzione in L2(R) si può sviluppare nel set di au-tovettori generalizzati uλ nel senso dell’equazione (26):

f(x) =

∫a(λ)eiλxdλ, (28)

14

Il teorema spettrale, in questo caso, non è altro che l’affermazione che ogni funzione

in L2(R) possiede una trasformata di Fourier. L’operatore, in questo caso, ha spettropuramente continuo, coincidente con l’asse reale.

Esempio 4: l’operatore posizione in L2[a, b], −∞ ≤ a < b ≤ ∞ è autoaggiunto neldominio D(x̂) = {f ∈ L2[a, b]|xf ∈ L2[a, b]} come si verifica facilmente. L’equazionex̂ψ = λψ richiede xψ(x) = λψ(x) che non può essere risolta da nessuna funzione ψ(x).

L’operatore x̂ non ha quindi autovalori. Si può pero’ dimostrare [1] che il suo spettro

è puramente continuo e coincide con l’intervallo [a, b]. L’equazione agli autovalori è

risolta dalle distribuzioni uλ = δ(x − λ) per λ ∈ [a, b]. È facile verificare che esisteuna successione di funzioni in L2[a, b] che converge a uλ e che soddisfa la proprietà

dell’autovalore apprssimato. Il teorema spettrale si riduce in questo caso alla banale

formula

ψ(x) =

∫ ba

δ(x− λ)ψ(λ)dλ (29)

che è valida per ogni ψ ∈ L2[a, b].

Esiste una classe di operatori che ha spettro puramente discreto. Per questi il teorema

spettrale vale nella forma:

Teorema Spettrale per operatori a spettro discreto: l’insieme degli autovettori

di un operatore autoaggiunto A con spettro puramente discreto possono essere scelti in

modo da formare un s.o.n.c.

Gli operatori con spettro puramente discreto generalizzano la teoria spettrale valida per

spazi finito dimensionali in una forma particolarmente semplice. Ogni elemento f dello

spazio di Hilbert si può sviluppare nella base degli autovettori di A, {ui},

f =∑i

aiui (30)

La base degli autovettori, in analogia con quanto succede nel caso finito-dimensionale,

è la base in cui l’operatore è diagonale (Aui = λiui). Questa proprietà si esprime

formalmente con l’equazione

Af =∑i

λiaiui (31)

che risulta essere vera anche se A non è continuo. Usando l’isomorfismo H ∼ l2, f → {ai}determinato dalla scelta della base {ui}, l’operatore A può essere rappresentato come unamatrice (infinito-dimensionale) diagonale, con entrate uguali agli autovalori.

15

Per concludere, è opportuno notare che il teorema 6 e il teorema spettrale valgono

per operatori autoaggiunti e non è detto che valgano per operatori che sono soltanto sim-

metrici. Operatori simmetrici hanno spettro discreto e continuo reale, ma genericamente

lo spettro residuo non è vuoto e complesso ed infine il teorema spettrale non è valido.

1.7 Esempi: equazioni integrali, alle derivate ordinarie e parziali

1.7.1 Equazioni integrali

Gli operatori integrali sono particolarmente semplici. Alcune applicazioni storiche della

teoria degli spazi di Hilbert sono infatti alle equazioni integrali.

Consideriamo un operatore integrale definito in L(Ω) dove Ω è un sottoinsieme di Rn.

K : f ∈ L2(Ω) → Kf(x) =∫

Ω

k(x, y)f(y)dy (32)

Se il nucleo integrale k(x, y) ∈ L2(Ω× Ω) l’operatore K è continuo. Infatti, dalla disug-uaglianza di Holder segue che

‖Kf‖2 =∫

Ω

|∫

Ω

k(x, y)f(y)dy|2dx ≤∫

Ω

(

∫Ω

|k(x, y)|2dy∫

Ω

|f(w)|2dw)dx

≤ ‖f‖2∫

Ω×Ω|k(x, y)|2dxdy (33)

È facile verificare che se k(x, y) = k(y, x), K è autoaggiunto. K in realtà è più che

continuo, è un operatore compatto, cioè manda insiemi limitati in insiemi la cui chiusura è

compatta [1]. Lo spettro degli operatori compatti è puramente discreto e particolarmente

semplice.

Teorema 8: Un operatore autoaggiunto compatto ha autovalori reali λn → 0 ed au-tovettori un che formano un s.o.n.c. Lo spettro è discreto con al più uno spettro continuo

che consiste del solo punto λ = 0 se questo non è un autovalore.

1.7.2 Equazioni Differenziali Ordinarie: Problemi agli autovalori

Un problema classico delle equazioni differenziali ordinarie è il problema agli autovalori

o problema al contorno. Questo tipo di problema è naturale in Meccanica Quantistica e

si incontra spesso anche in fisica classica, in particolare quando si risolvono problemi al

contorno per equazioni differenziali alle derivate parziali.

Esempio 1: sia data l’equazione differenziale lineare del secondo ordine dipendente da

un parametro λ

y′′ + λy = 0 (34)

16

Il teorema di esistenza e unicità garantisce che, date le condizioni iniziali (problema di

Chauchy)

y(x0) = y0

y′(x0) = y1 (35)

la soluzione esiste, è unica e dipende continuamente dai dati iniziali. Chiediamoci ora

se la stessa equazione ha soluzioni nell’intervallo [x0, x1] che soddisfano il problema al

contorno

y(x0) = 0

y(x1) = 0 (36)

Un equazione del II ordine ha sempre due soluzioni linearmente indipendenti yi(x;λ), i =

1, 2 e la generica soluzione si può esprimere come loro combinazione lineare

y(x) = c1y1(x;λ) + c2y2(x;λ). (37)

λ appare in generale come parametro nell’espressione delle soluzioni. Sappiamo che il

problema di Chauchy (35) ha sempre una soluzione. Nel caso del problema al contorno

(36), c‘e’ sempre la soluzione banale c1 = c2 = 0. Esisterà una seconda soluzione se e

solo se il sistema

c1y1(x0;λ) + c2y2(x0;λ) = 0

c1y1(x1;λ) + c2y2(x1;λ) = 0 (38)

ha una soluzione. Solo per alcuni valori particolari di λ, quelli per cui la matrice dei

coefficienti yi(xj;λ) ha determinante nullo, esisterà una soluzione non banale al problema

al contorno. Questi valori sono chiamati autovalori. Possiamo riformulare il problema

in questi termini: risolvere l’equazione agli autovalori Ly = λy per l’operatore L =

−∂2/∂x2 nel dominio D(L) = {fAC , f ′′ ∈ L2[x0, x1]|f(x0) = f(x1) = 0}. L è il quadratodell’operatore A1 = −i∂x; è simmetrico e, coi metodi della sezione 1.4, si può verificare cheè anche autoaggiunto 4. Il problema è cos̀ı ridotto alla ricerca di autovalori e autovettori

di un operatore autoaggiunto in uno spazio di Hilbert.

4Notiamo che −i∂x, con le condizioni f(x0) = f(x1) = 0, non è autoaggiunto mentre il suo quadrato−∂2x lo è. Le condizioni al contorno da imporre agli operatori possono variare col numero di derivate,poichè questo influisce sui termini provenienti dall’integrazione per parti. Intuitivamente, il numero di

condizioni da imporre ad un operatore differenziale con derivate ordinarie è pari all’ordine dell’operatore

stesso: f(x0) = f(x1) = 0 contiene due condizioni su f ed è ragionevole da imporre per un operatore

del secondo ordine ed è invece troppo restrittivo per un operatore del prim’ordine. Per evitare errori, è

bene verificare l’autoaggiuntezza esaminando i termini al bordo caso per caso.

17

Esaminiamo il caso generale di un‘equazione differenziale lineare del II ordine:

L̂y = λ̂y (39)

con

L̂y = a2(x)y′′ + a1(x)y

′ + a0(x), a2(x) > 0. (40)

È facile verificare che (ridefinendo L e λ) si può sempre ricondurre il problema al seguente:

Ly = λωy, L = − ddx

(p(x)

d

dx

)+ q(x). (41)

con

p(x) = e∫

(a1/a2)dx, q(x) = −a0a2e∫

(a1/a2)dx, ω(x) =e∫

(a1/a2)dx

a2(42)

Notiamo che p(x) > 0 e ω(x) > 0.

Si definisce problema di Sturm-Liouville (SL) il problema agli autovalori:

Ly = λωy , a ≤ x ≤ bα1y(a) + α2y

′(a) = 0

β1y(b) + β2y′(b) = 0 (43)

con αi, βi reali e con almeno uno degli αi e uno dei βi diversi da zero. Nell’equazione (43)

abbiamo scelto condizioni al contorno indipendenti per i due estremi. È possibile scegliere

altre condizioni al contorno, ad esempio si possono scegliere condizioni di periodicità:

f(a) = f(b) , f ′(a) = f ′(b) (44)

oppure due condizioni più complicate che coinvolgano ciascuna f(a), f(b), f ′(a), f ′(b).

Come discusso a breve, ogni set di condizioni con la proprietà di rendere autoaggiunto

l’operatore L definisce un buon problema di SL.

Vogliamo formalizzare il problema in un opportuno spazio di Hilbert. Dalla teoria gen-

erale delle equazioni differenziali, sappiamo che le soluzioni del problema (43) definito in

un intervallo limitato [a, b] e con funzioni p, q, ω sufficientemente regolari sono anch’esse

funzioni regolari, in particolare sono L2[a, b].

Osservazione: della presenza della funzione ω in (43) si può facilmente tener conto con-

siderando la misura ω(x)dx in [a, b]. Consideriamo cioè L2ω[a, b] = {f |∫ ba|f(x)|2ω(x)dx <

∞} con prodotto scalare (f, g)ω =∫ baf(x)g(x)ω(x)dx. Il problema (43) per l’operatore

Lω = L/ω diventa un problema agli autovalori Lωy = λy in L2ω. Notiamo che nel

prodotto scalare (Lωf, g)ω =∫ ba(Lf)g tutti i fattori di ω si cancellano. Senza perdita di

18

generalità si può anche porre ω = 1: la teoria generale si ottiene sostituendo ovunque

L→ Lω, (f, g)→ (f, g)ω.

Consideriamo quindi il problema agli autovalori:

Ly = λy

D(L) = {fAC , f ′′ ∈ L2[a, b]ω|α1y(a) + α2y′(a) = β1y(b) + β2y′(b) = 0} (45)

L è un operatore autoaggiunto. Infatti,

(Lf, g) =∫ ba((−pf ′)′ + qf)gdx = −pf ′g|ba +

∫ bapf ′g′dx+

∫ baqfgdx =

−p(f ′g − fg′)|ba +∫ baf((−pg′)′ + qg) = (f, Lg) (46)

I termini di bordo che vengono dall’integrazione per parti si annullano a causa delle

condizioni al contorno scelte (43) o (44). Ad esempio, per (43) e β2 6= 0, all’estremob otteniamo: p(f ′g − fg′)(b) = p(b)(−β1/β2)(fg − fg)(b) = 0. Lo stesso risultato valeper β2 = 0 e per l’estremo a. L’operatore L e’ quindi simmetrico; coi metodi della

sezione 1.4 si può dimostrare che è anche autoaggiunto. Lo stesso vale per le condizioni

(44). Condizioni al contorno più generali dovranno essere scelte in modo che i termini al

bordo dell’integrazione per parti si cancellino e che l’operatore sia autoaggiunto oltre che

simmetrico. Nel caso in cui l’intervallo [a, b] sia illimitato, i termini al bordo valutati nel

punto all’infinito si annullano automaticamente piochè ogni funzione L2[a, b] si annulla

all’infinito. Perciò se a o b o entrambi sono infiniti, in questi punti non occorre imporre

alcuna condizione. Si richiede tuttavia di trovare una soluzione L2[a, b]: la condizione

implicita che deve essere imposta all’infinito alle soluzioni dell’equazione differenziale è

di essere a quadrato sommabile. Questa è la condizione naturale da imporre se si vuole

formulare il problema in uno spazio di Hilbert. È anche la condizione naturale da imporre

in un problema di Meccanica Quantistica.

Usando il teorema 6 otteniamo immediatamente

Teorema 9: Dato un sistema di SL formulabile come un problema agli autovalori per

un operatore in uno spazio di Hilbert:

a) gli autovalori sono reali

b) le soluzioni (autovettori) corrispondenti ad autovalori diversi sono ortogonali nel

prodotto scalare di L2ω.

Gli autovettori di un sistema di SL formano un s.o.n. che non è necessariamente

completo, dato che un generico operatore avrà anche spettro continuo. Il problema di

19

V=x /2E

E1

2

x

E

V=02

determinare lo spettro di un operatore differenziale è complesso. I metodi più usati per

determinare lo spettro sono:

I: studiare il risolvente di L. Ogni equazione differenziale ordinaria si può convertire in

un’equivalente equazione integrale, ottenuta invertendo l’operatore differenziale

Lu(x) = λu(x) , → u(x) = λL−1u(x) ≡∫ ba

k(x, y)u(y)dy (47)

Il nucleo integrale k(x, y) si chiama funzione di Green associata all’operatore differenziale

L. Gli operatori integrali sono più semplici studiare e lo spettro di L si può determinare

studiando lo spettro dell’operatore integrale associato. In particolare, se la funzione di

Green k(x, y) risulta essere a quadrato sommabile, il teorema 8 garantisce che lo spettro

dell’operatore integrale, e quindi lo spettro di L, è puramente discreto. Operatori dif-

ferenziali di questo tipo si chiamano a risolvente compatto. In questo caso gli autovettori

di L formano un s.o.n.c.

II: ridurre, se possibile, l’equazione differenziale ad un’equazione di Schroedinger stazionaria.

Consideriamo l’equazione di Schroedinger stazionaria per una particella sulla retta soggetta

al potenziale V (x)

−d2u

dx2+ V (x)u = Eu (48)

L’equazione è evidentemente della forma SL con p = 1, q = V (x) e ω = 1; per uniformarci

alle notazioni della MQ, abbiamo chiamato E l’autovalore λ. La funzione d’onda u

rappresenta una densità di probabilità, ed è normalizzata∫R |u|

2dx = 1. La condizione

da imporre all’infinito è quindi l’integrabilità L2. Equivalentemente, dobbiamo risolvere

il problema agli autovalori Hu = Eu in L2(R) per l’operatore autoaggiunto H = − d2dx2

+

V (x). Alla funzione V (x) si richiede di essere sufficientemente regolare. Consideriamo

il potenziale indicato a sinistra nella figura. Classicamente la particella di energia E è

obbligata a muoversi nell’intervallo definito dalla disuguaglianza E − V (x) = p2/2 ≥ 0.Nell’intervallo di energia [E1, E2] la particella è costretta ad oscillare in una regione finita

di spazio, nell’intervallo [E2,∞] la particella può muoversi fino all’infinito. Come discusso

20

in ogni buon testo di MQ, quantisticamente esisteranno dei livelli energetici discreti Enda cercarsi dove il moto classico é limitato in una regione finita, σd(H) = {En} ⊂[E1, E2] e uno spettro continuo di energie corrispondente ai valori classici dell’energia

per cui il moto è illimitato, σc(H) = [E2,∞]. Notiamo che gli autovalori dell’operatoreH corrispondono solo ai livelli energetici discreti. L’intero insieme dei possibili valori

dell’osservabile energia è associato all’intero spettro dell’operatore H. Gli autovalori

generalizzati uE per E ∈ σc(H) sono tipicamente delle funzioni non in L2(R) che hanno laforma di onde piane per grande x positivo. Nella figura sono indicati due casi limite. Per

V (x) = 0 lo spettro è puramente continuo σc(H) = [0,∞] con autofunzioni generalizzateche sono onde piane uE = e

ipx, E = p2/2. Il caso V (x) = x2/2, corrispondente ad un

oscillatore armonico, ha spettro puramente discreto En = (n+ 1/2) con autofunzioni che

sono i polinomi di Hermite un = Hn(x)e−x2/2.

Un risultato generale è il seguente. Il problema di SL con a e b finiti, p, p′, ω e q

funzioni continue reali in [a, b] e p, ω > 0 il problema si dice regolare. Per sistemi di SL

regolari vale il teorema [1]:

Teorema 10: Gli autovettori di un sistema di SL regolare formano un insieme numerabile

{yn} che, opportunamente normalizzato, è un s.o.n.c. in L2ω[a, b].

I problemi di SL regolari sono in assoluto i più semplici ma hanno poche applicazioni.

Esempio 1. continuazione: consideriamo il problema di SL

y′′ + λy = 0, 0 ≤ x ≤ πy(0) = y(π) = 0 (49)

Il problema è regolare con p = 1, q = 0 e ω = 1. La soluzione generale è y = A sin√λx+

B cos√λx. Le condizioni al contorno impongono B = 0 e sin

√λπ = 0 da cui λ =

n2, n = 1, 2, .... Otteniamo l’insieme di autovalori e autovettori: {λn = n2, yn = sinnx}.Osserviamo che gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli

autovettori, opportunamente normalizzati, formano un s.o.n.c.: i seni sono la base di

Fourier (dispari) per il semi-periodo [0, π].

Esempio 1a: consideriamo il problema di SL

y′′ + λy = 0, 0 ≤ x ≤ πy(0) = y(π)

y′(0) = y′(π) (50)

21

Il problema è anch‘esso regolare. Le condizioni al contorno questa volta selezionano il

sistema di autovettori {e2inx} con autovalori λ = 4n2, n ∈ Z. Anche in questo esem-pio gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli autovettori,

opportunamente normalizzati, formano un s.o.n.c.: la base di Fourier sul periodo [0, π].

Notiamo che, in questo esempio, ogni autovalore ha molteplicità due (e±2inx sono en-

trambi associati all’autovalore 4n2). Autovettori corrispondenti ad autovalori diversi

sono ortogonali. All’interno di ogni autospazio (di dimensione due) sono stati scelti due

autovettori ortogonali in modo che l’insieme di tutti gli autovettori formi un s.o.n.c..

I problemi di SL più interessanti sono però singolari. Un problema può essere sin-

golare, ad esempio, se p o ω si annullano (o divergono) in a o in b, oppure, ancora più

semplicemente, se l’intervallo [a, b] non è limitato. Le soluzioni delle equazioni differen-

ziali potrebbero essere discontinue e illimitate agli estremi dell’intervallo. Usualmente,

all’estremo singolare si impongono condizioni quali la limitatezza oppure l’integrabilità

L2 (quest’ultima è la condizione che si impone ad esempio nei problemi provenienti dalla

Meccanica Quantistica).

Esempio 2: polinomi di Legendre. Consideriamo

d

dx

((1− x2)dy

dx

)+ λy = 0, −1 ≤ x ≤ 1 (51)

e richiediamo alle soluzioni di essere limitate in x = ±1. Abbiamo p = 1−x2, q = 0, ω = 1.Il problema è singolare perchè p(±1) = 0. Gli autovalori sono λl = l(l+1) con autovettorii polinomi di Legendre Pl(x) che formano, dopo normalizzazione, un s.o.n.c. in L

2[−1, 1].

Esempio 3: polinomi di Hermite. Consideriamo

d

dx

(e−x

2 dy

dx

)+ e−x

2

λy = 0, −∞ < x

Esempio 4: polinomi di Laguerre. Consideriamo

d

dx

(e−x

dy

dx

)+ e−xλy = 0, 0 < x

Per la prima equazione abbiamo p = 1 − x2, q = m2/(1 − x2), ω = 1. Il problema èsingolare perchè p(±1) = 0 e q(±1) = ∞. Gli autovalori sono λl = l(l + 1), |m| ≤ l, l =0, 1, 2... con autovettori Pml (x), polinomi di Legendre generalizzati. Le armoniche sferiche

Ylm(θ, φ) = Pml (cos θ)e

imφ formano, dopo normalizzazione, un s.o.n.c. in L2[S2, dΩ(2)],

dove dΩ(2) = sin θdθdφ è la misura sulla sfera unitaria S2.

Gli operatori ellittici hanno inoltre importanti proprietà di regolarità

Teorema 12 - lemma di Weyl: ogni funzione o distribuzione u(x) che risolva l’equazione

ellittica Lu = f è C∞ nei punti in cui i coefficienti aij(x), bi(x), c(x) e il termine noto

f(x) sono C∞.

Questo teorema si applica ad esempio all’equazione di Laplace e di Schroedinger

stazionaria. Le soluzioni dell’equazione di Laplace sono automaticamente C∞, le soluzioni

dell’equazione di Poisson o dell’equazione di Schoedinger stazionaria sono C∞ nei punti

in cui la densità di carica o il potenziale sono C∞.

Infine, per operatori ellittici, i problemi al contorno formulati su insiemi compatti

soddisfano teoreni di esistenza, unicità e dipendenza continua dai dati iniziali.

2 Appendice: Il complemento ortogonale

Una proprietà importante degli spazi di Hilbert riguarda la possibilità di proiettare un

vettore su un sottospazio.

Teorema A: Dato un sottospazio chiuso V dello spazio di Hilbert H, per ogni vettore

f ∈ H esiste unico un vettore f ∗ ∈ V con la proprietà

‖f − f ∗‖ = minv∈V ‖f − v‖ (56)

Dim: sia d = inf{‖f − v‖, v ∈ V }. Occorre dimostrare che l’estremo inferiore è inrealtà un minimo. Se d = 0, f ∈ V e f ∗ = f . Possiamo quindi supporre che d > 0.Consideriamo gli insiemi Cn = {v ∈ V |‖v−f‖ ≤ d+1/n}. Dall’identità 2(‖x‖2 +‖y‖2) =‖x+ y‖2 + ‖x− y‖2 segue che, se v1, v2 ∈ V ,

2(‖v1 − f‖2 + ‖v2 − f‖2) = ‖v1 + v2 − 2f‖2 + ‖v1 − v2‖2

‖v1 − v2‖2 = 2‖v1 − f‖2 + 2‖v2 − f‖2 − ‖v1 + v2 − 2f‖2 ≤2(d+ 1

n

)+ 2

(d+ 1

n

)− 4d2 ≤ 8 d

n+ 4

n2(57)

Nel penultimo passaggio si è usato il fatto che, poiché (v1 +v2)/2 ∈ V , ‖f−(v1 +v2)/2‖ ≥d. Scegliendo una successione di vettori {vn} ∈ Cn avremo che

‖vn − vn+p‖2 ≤ 8d

n+

4

n2(58)

24

tende a zero per n → ∞ per qualunque p, poiché vn, vn+p ∈ Cn. Questo implica che{vn} ∈ Cn è di Chauchy e quindi converge. Il limite f ∗ sarà contenuto in V poiché V èchiuso. Da ‖vn− f‖ ≤ d+ 1/n segue che ‖f − f ∗‖ ≤ d. Poiché d è l’estremo inferiore deipossibili valori ‖f − v‖, ne segue che ‖f − f ∗‖ = d. f ∗ è unico: supponiamo infatti cheesistano due vettori che soddisfino d = ‖f − f1‖ = ‖f − f2‖. Usando una minorazioneanaloga a quella della formula (57) otteniamo

‖f1 − f2‖2 = 2‖f1 − f‖2 + 2‖f2 − f‖2 − ‖f1 + f2 − 2f‖2 = 4d2 − ‖f1 + f2 − 2f‖2 ≤4d2 − 4d2 = 0

che è possibile solo per f1 = f2. 2

Osservazione: il teorema è valido nell’ipotesi meno restrittiva che V sia un insieme

convesso chiuso. La chiusura è un’ipotesi necessaria.

Il vettore f ∗ è noto come la miglior approssimazione di f in V . È anche caratterizz-

abile come la proiezione ortogonale di f su V . Vale infatti:

Teorema B: f ∗ è univocamente determinato dalla proprietà (f − f ∗, v) = 0 per tutti ivettori v ∈ V .Dim: Se (f − f ∗, v) = 0 per tutti i vettori v ∈ V , vale anche (f − f ∗, f ∗ − v) = 0. Dalteorema di Pitagora segue che ‖f−v‖2 = ‖f−f ∗‖2+‖f ∗−v‖2 e quindi ‖f−f ∗‖2 ≤ ‖f−v‖2per ogni v ∈ V . Ne segue che f ∗ è la miglior approssimazione di f in V . Viceversa, siaf ∗ la miglior approssimazione. Prendiamo v = f ∗ + αw con w ∈ V, α ∈ C. Abbiamo che

‖f − f ∗‖2 ≤ ‖f − v‖2 = ‖f − f ∗ − αw‖2 =‖f − f ∗‖2 + ‖α|2‖w‖2 − α(w, f − f ∗)− α∗(w, f − f ∗)∗

da cui α(w, f − f ∗) + α∗(w, f − f ∗)∗ ≤ |α|2‖w‖2. Prendendo α = |α|eiθ con |α| → 0 siottiene eiθ(w, f − f ∗) + e−iθ(w, f − f ∗)∗ ≤ 0. Prendendo θ = 0, π/2, π, 3π/2 si ottieneRe, Im(w, f − f ∗) ≥ 0 e contemporaneamente Re, Im(w, f − f ∗) ≤ 0, da cui si conclude(f − f ∗, w) = 0. 2

Dato un insieme S definiamo il suo complemento ortogonale come l’insieme

S⊥ = {f ∈ H|(f, s) = 0, s ∈ S} (59)

S⊥ è sempre un sottospazio chiuso di H. Infatti da x, y ∈ S⊥ segue che (αx+ βy, s) = 0per ogni s ∈ S per la linearità del prodotto scalare, e da xn ∈ S → x segue che (x, s) =lim(xn, s) = 0 per la continuità del prodotto scalare.

25

Teorema C: Dato un sottospazio chiuso V di H, ogni f ∈ H si scrive in maniera unicacome f = x+ y con x ∈ V, y ∈ V ⊥. In simboli

H = V ⊕ V ⊥ (60)

Dim: x è definito come la proiezione f ∗ di f su V e y come f − f ∗. y ∈ V ⊥ per ilTeorema B. L’unicità della decomposizione segue dal fatto che, se f = x + y = x′ + y′,

x− x′ = y − y′ uguaglia vettori in V e V ⊥ che hanno in comune il solo vettore zero. Nesegue x = x′ e y = y′. 2

Osservazione: Se V è un sottospazio non chiuso il Teorema C si può riformulare come

H = V̄ ⊕ V ⊥. Vale anche S⊥⊥ = S̄. Quest’ultimo risultato segue dalla doppia appli-cazione del risultato precedente, una volta a V = S̄ e l’altra a V = S⊥: H = S̄ ⊕ S⊥ =S⊥ ⊕ S⊥⊥. Eliminando il fattore comune S⊥ si ottiene il risultato voluto.

References

[1] Dispense per Metodi Matematici della Fisica, http://castore.mib.infn.it/̃.zaffaron/

[2] Reed e Simon, Methods of Modern Mathematical Physics, Academic Press, Quattro

Volumi.

[3] Mikusinski, Introduction to Hilbert Spaces, Academic Press.

[4] W. Rudin, Functional Analysis, MacGraw-Hill.

26

1 Operatori negli spazi di Hilbertzaffaron/operatori.pdflo spazio vettoriale degli operatori lineari continui in uno spazio di Hilbert, e uno spazio di Banach. 1.2 Isomor smo tra spazi

Documents