-
1 Operatori negli spazi di Hilbert
1.1 Operatori lineari in spazi normati
Definizione 1 Una mappa lineare (operatore) tra spazi normati f
: X → Y è unamappa che preserva la struttura lineare
f(αx+ βy) = αf(x) + βf(y), x, y ∈ X, α, β ∈ C (1)
Un operatore che abbia come immagine C (X → C) viene anche
chiamato funzionalelineare.
Definizione 2 Una mappa lineare tra spazi normati f : X → Y si
dice limitata seesiste una costante K tale per cui
‖f(x)‖ ≤ K‖x‖ ∀x ∈ X. (2)
Una mappa limitata manda insiemi limitati in insiemi limitati.
Infatti, un insieme è
limitato se è contenuto in una sfera di raggio r (‖x‖ ≤ r);
l’immagine della sfera di raggior è però contenuta nella sfera di
raggio Kr a causa della definizione 2 (‖f(x)‖ ≤ Kr).
Negli spazi normati il concetto di limitatezza è equivalente a
quello di continuità.
Vale infatti il seguente teorema,
Teorema 1 Sia f : X → Y una mappa lineare tra spazi normati. Le
seguenti affermazionisono tra loro equivalenti:
a) f è limitata
b) f è continua
c) f è continua in un punto
Dim: a) → b): da ‖f(y) − f(x)‖ = ‖f(y − x)‖ ≤ K‖x − y‖, segue
che x → y implicaf(x) → f(y). b) → c): ovvio. c) → a): f sia
continua in x0. Per ogni � esiste un δ taleper cui
‖f(x+ x0)− f(x0)‖ = ‖f(x) + f(x0)− f(x0)‖ = ‖f(x)‖ < �
(3)
per ogni ‖x‖ < δ. Fissato � e un generico y ∈ X, x = δy(2‖y‖)
soddisfa ‖x‖ =
δ2< δ. Quindi
‖f( δy2‖y‖)‖ < � e, di conseguenza, ‖f(y)‖ <
2�δ‖y‖. f è quindi limitata. 2
Definizione 3 Si definisce norma della mappa lineare f il più
piccolo dei numeri K per
cui l’identità (2) è valida. La norma di f viene indicata con
‖f‖. Vale quindi
‖f(x)‖ ≤ ‖f‖‖x‖ (4)
1
-
per ogni x ∈ X. Poichè f è lineare, questa identità si può
riscrivere come ‖f( x‖x‖)‖ ≤ ‖f‖.La formula (4) è quindi
equivalente a
‖f(x)‖ ≤ ‖f‖, ‖x‖ = 1 (5)
e ‖f‖ può anche essere definito come
‖f‖ = sup‖x‖=1‖f(x)‖. (6)
L’insieme degli operatori continui tra due spazi normati X e
Y
B(X, Y ) = {f : X → Y |f lineare limitato} (7)
munito della mappa f → ‖f‖ è uno spazio vettoriale normato.
Teorema 2 B(X, Y ) è uno spazio vettoriale normato. È completo
se Y è completo.Dim: È immediato verificare che ‖f‖ definisce una
norma. Sia An una successione diCauchy in B(X, Y ). Vale quindi ‖An
− Am‖ < � per n,m > n0. Da
‖An(x)− Am(x)‖ = ‖(An − Am)(x)‖ ≤ ‖An − Am‖‖x‖ < �‖x‖ (8)
concludiamo che ‖An(x)‖ è una successione di Cauchy in Y per
ogni x fissato. Poichè Yè completo, An(x) convergerà a un
vettore in Y che chiamiamo A(x). A è ovviamente
un operatore lineare ed è anche continuo; infatti passando al
limite nell’equazione (8)
otteniamo ‖A(x)−An(x)‖ ≤ �‖x‖ e ‖A(x)‖ = ‖(A(x)−An(x))+An(x)‖ ≤
(�+‖An‖)‖x‖.Quindi A ∈ B(X, Y ). Infine dalle stesse equazioni
segue che ‖An − A‖ ≤ � e che lasuccessione An converge ad A nella
norma di B(X, Y ). 2
Ricordiamo che uno spazio vettoriale normato completo si chiama
spazio di Banach.
Se Y è uno spazio di Banach anche B(X, Y ) lo è. In
particolare, B(H) ≡ B(H,H), cioèlo spazio vettoriale degli
operatori lineari continui in uno spazio di Hilbert, è uno
spazio
di Banach.
1.2 Isomorfismo tra spazi di Hilbert
Definizione 3: Un isomorfismo tra spazi normati (o spazi di
Hilbert) è una mappa
lineare biunivoca che preserva la norma: ‖f(x)‖ = ‖x‖.
Osservazioni: una mappa che preserva la norma si chiama anche
isometria. In gen-
erale, un isomorfismo tra spazi è una mappa biunivoca che
preserva le proprietà (alge-
briche, topologiche, etc...) che sono definite su questi spazi.
Nel caso particolare in cui lo
spazio normato sia anche uno spazio di Hilbert sembrerebbe più
naturale definire un iso-
morfismo come una mappa lineare che preserva il prodotto
scalare: (f(x), f(y)) = (x, y).
2
-
Le due definizioni sono in realtà equivalenti: qualora in uno
spazio siano definiti sia un
prodotto scalare che l’associata norma, una mappa lineare che
preserva l’uno preserva
anche l’altra, e viceversa. Infatti, norma e prodotto scalare si
possono ricostruire una
dall’altro attraverso le identità
‖x‖2 = (x, x)4(x, y) = ‖x+ y‖2 − ‖x− y‖2 + i(‖x+ iy‖2 − ‖x−
iy‖2) (9)
Esempio 1: Ogni spazio di Hilbert H separabile è isomorfo a l2.
Ricordiamo che uno
spazio di Hilbert si dice separabile quando possiede un sistema
ortonormale completo
(s.o.n.c.) numerabile. In uno spazio di Hilbert separabile,
scelto un s.o.n.c. {xi}, ognix ∈ H si scrive in maniera unica come
x =
∑aixi. Questa identificazione induce una
mappa H → l2 : x → {ai} che è un isomorfismo di spazi di
Hilbert. Innanzitutto, lamappa è ben definita ed è un’isometria
perchè
∑|ai|2 = ‖x‖2. La mappa è iniettiva
per l’unicità dei coefficienti di Fourier, ed è suriettiva
perchè, per ogni successione in l2
vale∑|ai|2 < ∞ e di conseguenza la formula x =
∑aixi definisce un elemento di H.
L’isomorfismo in questione non è naturale perchè richiede la
scelta di una base.
Esempio 2: La trasformata di Fourier può essere pensata come
una mappa lineare da
L2(R) in L2(R). Preserva la norma ‖f̂‖ = ‖f‖ (teorema di
Parseval) ed è biunivoca. Èpertanto un isomorfismo.
1.3 Il teorema di Riesz
Il teorema di Riesz caratterizza i funzionali lineari continui
in uno spazio di Hilbert.
Ricordiamo dall’algebra lineare che l’insieme dei funzionali
lineari in uno spazio vettoriale
V è anch‘esso uno spazio vettoriale che prende il nome di
spazio duale V ∗. Nel caso di
spazi normati è utile modificare la definizione richiedendo che
V ∗ sia lo spazio vettoriale
dei funzionali lineari continui. Dal teorema 2, segue che V ∗ è
uno spazio vettoriale
normato completo. Nel caso finito-dimensionale, V e V ∗ hanno la
stessa dimensione e
sono quindi banalmente isomorfi. La struttura di spazio di
Hilbert consente di definire
un isomorfismo naturale tra H e il suo duale H∗ per ogni spazio
di Hilbert. Per ogni
x0 ∈ H possiamo definire un particolare funzionale lineare
continuo H → C : x→ (x, x0).Il teorema di Riesz garantisce che ogni
funzionale continuo ha questa forma e stabilisce
un’isomorfismo tra H e H∗.
Teorema 3 (Riesz): Ogni funzionale lineare continuo L su uno
spazio di Hilbert H si
può scrivere in maniera univoca come L(x) = (x, x0). Vale
inoltre ‖L‖ = ‖x0‖.
3
-
Dimostrazione: Nel caso particolare L = 0, x0 = 0 e il teorema
è ovvio. Possiamo
quindi supporre L 6= 0. Definiamo M = {x ∈ H|Lx = 0}. Poichè L
è lineare e continuo,M è un sottospazio chiuso di H ed ammette
quindi un complemento ortogonale M⊥.
Scegliamo un particolare z ∈ M⊥ con ‖z‖ = 1. Definito u = L(x)z
− L(z)x, abbiamoche L(u) = L(x)L(z) − L(z)L(x) = 0; quindi u ∈ M .
Visto che u ∈ M e z ∈ M⊥,0 = (u, z) = L(x)(z, z) − L(z)(x, z). Ne
segue che L(x) = L(z)(x, z) = (x, L(z)z).Quindi il teorema vale con
x0 = L(z)z. Da |L(x)| = |(x, x0)| ≤ ‖x‖‖x0‖ segue che‖L‖ ≤ ‖x0‖.
Visto che |L(x0)| = ‖x0‖2, la disuguaglianza precedente è
certamentesaturata e ‖L‖ = ‖x0‖. L’unicità segue dal fatto che, se
L(z) = (x, x0) = (x, x′0), allora(x, x0−x′0) = 0; x0−x′0 è quindi
nullo perchè ortogonale a qualunque vettore nello spaziodi
Hilbert. 2
1.4 Esempi di operatori negli spazi di Hilbert
Consideremo operatori lineari A : H → H. Per semplicità le
parentesi tonde in A(x)saranno a volte omesse: Ax sta per A(x). Se
non altrimenti specificato, useremo lettere
maiuscole dell’alfabeto latino per indicare operatori negli
spazi di Hilbert, lettere minus-
cole (della parte finale) dell’alfabeto latino per indicare
vettori in H e lettere greche per
indicare scalari.
Esempio 1: caso finito dimensionale. A : H → H, dimH = N .
Scegliamo unabase ei, i = 1, ..., N . Consideriamo lo sviluppo di x
e di Ax: x =
∑Ni=1 xiei e Ax =∑N
i=1(Ax)iei. Si ha che
(Ax)i = (Ax, ei) = (A(N∑j=1
xjej), ei) =N∑j=1
xj(Aej, ei) (10)
Vediamo che A, in termini delle coordinate rispetto alla base
scelta, è rappresentato da
una matrice
(Ax)i =N∑j=1
Aijxj, Aij = (Aej, ei) (11)
Gli operatori negli spazi infinito dimensionali generalizzano il
concetto di matrice.
Come dimostrano i seguenti esempi, molte proprietà valide negli
spazi di dimensione
finita sono false negli spazi di dimensione infinita.
Esempio 2: operatore di shift in H = l2. A({a1, a2, ....}) = {0,
a1, a2, ....} definisce unoperatore lineare continuo con norma 1.
È infatti un’isometria: ‖Ax‖ = ‖x‖. È iniettivoma non suriettivo:
l’elemento z = {1, 0, 0, ....} non è infatti nell’immagine di A. A
mappa
4
-
H biunivocamente in un suo sottoinsieme proprio A(H) = ({z})⊥.
Questo è possibilesolo perchè H è infinito-dimensionale. A si
può rappresentare come una matrice infinita
Aij, i, j = 1, 2.... le cui sole entrate non nulle sono Ai+1,i =
1, i = 1, 2....
Esempio 3: gli operatori posizione e momento della Meccanica
Quantistica. Definiamo
in L2[a, b] −∞ ≤ a < b ≤ ∞ gli operatori
x̂ : x̂f(x) = xf(x)
p̂ : p̂f(x) = −i dfdx
(x) (12)
I due operatori soddisfano le regole di commutazione di
Heisenberg [x̂, p̂] = i come segue
dal semplice calcolo
x̂p̂f(x)− p̂x̂f(x) = −ix ddxf(x) + i
d
dx(xf(x)) = if(x) (13)
Esistono operatori A e B che soddisfano l’algebra astratta di
Heisenberg [A,B] = i
soltanto in spazi infinito dimensionali. Infatti, in uno spazio
di dimensione finita N ,
A e B sarebbero rappresentabili da matrici N per N e l’equazione
[A,B] = i sarebbe
inconsistente, come si vede prendendo la traccia:
0 = Tr[A,B] = Tr(AB)− Tr(BA) = Tr(AB)− Tr(AB) ≡ N (14)
dove si è usata la properietà di ciclicità della traccia.
Esempio 4: operatori differenziali in H = L2(X), X sottoinsieme
di Rn. Per semplicità
consideriamo X = (a, b),−∞ ≤ a < b ≤ ∞ e il più semplice
degli operatori differen-ziali: A = −i∂x. L’operatore A ha due seri
problemi: 1) Non è continuo. Consideriamoad esempio yn(x) = e
−nx in L2[0, π]. Ayn = inyn e di conseguenza ‖Ayn‖/‖yn‖ = nnon
può essere limitato. 2) Non è nemmeno definito ovunque. Infatti
non tutte le fun-
zioni a quadrato sommabile sono derivabili con derivata ancora
appartenente allo stesso
spazio. A è definito solo su un sottoinsieme D(A) di H che
prende il nome di dominiodell’operatore. D(A) contiene almeno tutte
le funzioni C1[a, b] ed è un sottoinsieme densodi L2[a, b]. I
problemi 1)+2) sono comuni a tutti gli operatori differenziali.
Osservazione sul dominio: l’esempio 4 descrive una
caratteristica generale della teoria
degli operatori negli spazi di Hilbert: gli operatori di maggior
interesse non sono continui
e non sono nemmeno definiti sull’intero H. Gli operatori
continui possono sempre estesi
all’intero H. Se un operatore continuo A è definito in un
dominio D(A) può sempreessere esteso a D(A) per continuità. Vale
infatti
5
-
Teorema 4: Un operatore lineare A in uno spazio normato completo
X che sia definito
e continuo in un sottoinsieme denso U può essere esteso ad un
operatore continuo definito
sull’intero X.
Dim: Vale ‖Ax‖ ≤ ‖A‖‖x‖ in U . Poichè U è denso in X, ogni x ∈
X sarà limite di unasuccessione di elementi xn in U . Poichè xn
converge, sarà di Cauchy, quindi ‖xn−xm‖ < �per n,m
sufficientemente grandi. Da ‖Axn −Axm‖ = ‖A(xn − xm)‖ ≤ ‖A‖‖xn −
xm‖ <�‖A‖ segue che la successioneAxn è di Cauchy, e quindi,
per la completezza diX, convergead un elemento che chiamiamo Ax.
Prendendo il limite dell’equazione ‖Axn‖ ≤ ‖A‖‖xn‖otteniamo ‖Ax‖ ≤
‖A‖‖x‖. La mappa x → Ax definisce quindi un’estensione di
Aall’intero spazio X. L’estensione è ancora un operatore continuo
con la stessa norma di
A definito in U .2
A si può poi estendere ad H in molti modi possibili. Il più
semplice è richiedere, ad
esempio, che si annulli in D(A)⊥
. In questo modo si ottiene un’estensione continua di A
all’intero H. Nel seguito supporremo pertanto che ogni operatore
continuo sia definito
sull’intero H.
Come abbiamo visto, gli operatori non continui sono invece
definiti solo su un sottoin-
sieme di H e, in generale, non sono estendibili all’intero H. In
questo caso è importante
specificare il dominio di definizione. Poichè le proprietà
degli operatori possono variare
a seconda dell’insieme di definizione, nel seguito, la parola
operatore implicitamente in-
dicherà la coppia (A,D(A)). È ragionevole richiedere almeno
che il dominio D(A) siaun sottoinsieme denso di H. La mancanza di
continuità viene solitamente rimpiazzata
da una condizione più debole ma sufficiente per molte
applicazioni, la chiusura. Un
operatore si dice chiuso se le due condizioni xn → x e Axn → y
implicano y = Ax1. Richiederemo sempre agli operatori non continui
di essere densamente definiti (cioè
D(A) = H) e chiusi.
1.5 Operatori autoaggiunti e unitari
Dato un operatore (A,D(A)) densamente definito inH (cioèD(A) =
H) esiste l’operatoreaggiunto (A∗,D(A∗)) che soddisfa
(Ax, y) = (x,A∗y), x ∈ D(A), y ∈ D(A∗) (15)
ed è definito in
D(A∗) = {y ∈ H|Ly : H → C, x→ (Ax, y) funzionale lineare
continuo} (16)1Nel caso di operatori continui la sola condizione xn
→ x implica Axn → Ax. Nel caso di operatori
non continui Axn potrebbe anche non convergere. Per operatori
chiusi, se xn converge a x e Axnconverge, quest’ultimo deve
convergere a Ax. La definizione di chiusura si può riformulare in
maniera
più semplice cos̀ı: un operatore A si dice chiuso se il suo
grafico, cioè l’insieme delle coppie {(x,Ax)},è un sottoinsieme
chiuso di H ×H.
6
-
Nel caso di operatori continui l’equazione (15) vale per tutti
gli x, y ∈ H. Nel caso dioperatori non continui, l’aggiunto è
definito nel dominio indicato, che potrebbe essere
diverso da quello di A.
L’esistenza dell’aggiunto è garantita dal teorema di Riesz. Per
y ∈ D(A∗) fissato, lamappa Ly : D(A) → C : x → (Ax, y) è un
funzionale lineare continuo definito inD(A). Poichè D(A) è denso
in H, il teorema 4 garantisce che Ly si può estendere adun
funzionale continuo su H. Per il teorema di Riesz, esiste allora z
∈ H tale per cuiLy(x) = (Ax, y) = (x, z) per ogni x. z dipenderà
da y: chiamiamolo z = A
∗y. La mappa
A∗ che associa ad ogni y uno z è un operatore lineare che
soddisfa l’equazione (15).
Esempio 1 Ogni operatore A in CN è associato ad una matrice
Aij. Calcoliamo lamatrice associata a A∗. Usando l’equazione (11):
(A∗)ij = (A
∗ej, ei) = (ej, Aei) =
(Aei, ej) = Aji. La matrice dell’aggiunto di A è quindi la
matrice aggiunta (o coniugata
hermitiana), cioè la matrice trasposta coniugata: A∗ij =
Aji.
Non è difficile dimostrare che
Teorema 3: Se A è continuo anche A∗ è un operatore continuo e
‖A∗‖ = ‖A‖. InoltreA∗∗ = A.
Dim: Se A è continuo, è anche limitato: ‖A‖ < ∞. Usando
l’identità di Schwarz,otteniamo:
|(A∗x, y)| = |(x,Ay)| ≤ ‖x‖‖Ay‖ ≤ ‖x‖‖A‖‖y‖ (17)
Scegliendo y = A∗x otteniamo: ‖A∗x‖2 ≤ ‖x‖‖A‖‖A∗x‖ cioè ‖A∗x‖ ≤
‖x‖‖A‖; ne segueche A∗ è limitato, quindi continuo, con
‖A∗‖ ≤ ‖A‖. (18)
In particolare, visto che A∗ è continuo, anche A∗∗ esiste ed è
continuo; l’equazione (15)
ci dice che (A∗∗x, y) = (x,A∗y) = (Ax, y) per ogni x, y e quindi
A∗∗ = A. La disug-
uaglianza (18) applicata a A∗∗ ci dice che ‖A‖ = ‖A∗∗‖ ≤ ‖A∗‖,
da cui ‖A∗‖ = ‖A‖.2
Si può dimostrare [1] che il teorema precedente vale per
operatori illimitati nella seguente
forma: se A è chiuso e densamente definito, A∗ è anch‘esso
chiuso e densamente definito
e soddisfa A∗∗ = A.
Considereremo tre classi importanti di operatori:
1. Operatori autoaggiunti. A si dice autoaggiunto se A = A∗.
7
-
Osservazione importante: nella definizione di autoaggiuntezza,
l’affermazione A = A∗
va intesa come: (A,D(A)) = (A∗,D(A∗)). può succedere che, dato
A definito su D(A), A∗
esista e coincida con A in D(A) ma sia definito in un dominio
più ampio D(A∗) ⊃ D(A).In questo caso l’operatore è solo
formalmente autoaggiunto. Possiamo quindi definire
due forme di autoaggiuntezza:
A è simmetrico se vale
(Ax, y) = (x,Ay), x, y ∈ D(A) (19)
Questa condizione garantisce semplicemente che A∗ esiste e
coincide con A in D(A). Ingenerale A∗ sarà un’estensione di A:
D(A∗) ⊃ D(A).
A è autoaggiunto se vale A ≡ A∗, cioè se A e A∗ coincidono
come operatori (dominioincluso!): D(A) = D(A∗).
Come vedremo, gli operatori autoaggiunti hanno proprietà che
gli operatori simmetrici
non possiedono. Per operatori continui, che non hanno problemi
di dominio, autoaggiun-
tezza e simmetria coincidono.
Esempio 1: nel caso finito-dimensionale, A è autoaggiunto se lo
è la matrice corrispon-
dente: Aij = Aji. Una matrice con questa proprietà si chiama
anche simmetrica (nel
caso reale) o hermitiana (nel caso complesso).
Esempio 2: un altro esempio importante di operatore autoaggiunto
è l’operatore A =
−i∂x in L2[a, b], −∞ ≤ a < b ≤ ∞. L’operatore non è
continuo. Consideriamo la formula(15) per funzioni f, g molto
regolari, in modo che tutte le formule e le manipolazioni
formali abbiano senso (notare che la i nella definizione di A è
importante):
(−i∂xf, g) =∫ ba
(−if ′(t)g(t))dt = −ifg|ba +∫ ba
f(t)(−ig′(t))dt = −ifg|ba + (f,−i∂xg)
(20)
Condizione necessaria perchè l’operatore sia autoaggiunto è
che il termine di bordo si
annulli. È quindi necessario specificare un dominio D(A),
ovvero dire quali sono le
condizioni al contorno delle funzioni considerate. In
particolare, l’annullarsi dei termini
di bordo per tutte le funzioni f, g ∈ D(A) garantisce
l’equazione
(Af, g) = (f, Ag), f, g ∈ D(A) (21)
garantisce cioè che l’operatore è simmetrico. A∗ è quindi
un’estensione di A. Tipicamente
D(A) viene inizialmente scelto sulla base del problema in
considerazione, in modo da
8
-
annullare i termini al bordo. Se una considerazione più attenta
mostra che in realtà A∗ è
definito su un dominio più ampio, si può tentare di estendere
il dominio di A sperando che
quello di A∗ si restringa. Per approssimazioni successive si
può arrivare ad un operatore
autoaggiunto: D(A) ⊂ D(A1) ⊂ ... ⊂ D(Aaut) ⊂ ... ⊂ D(A∗1) ⊂
D(A∗), dove Aaut ≡A∗aut, dominio incluso. Esistono molti domini
diversi in cui A risulta simmetrico, mentre
ne esiste uno solo in cui A è autoaggiunto.
Consideriamo, ad esempio, l’operatore −i∂x in L2(R). Ogni
funzione in L2(R) si annullaall’infinito e i termini al bordo
nell’equazione (20) si annullano automaticamente. Occorre
però scegliere ancora il dominio dell’operatore imponendo
opportuni requisiti di regolarità
alle funzioni. La scelta più semplice di un dominio denso in
L2(R) composto da funzionimolto regolari è S(R). L’operatore −i∂x
non è però autoaggiunto S(R). Esistono infattifunzioni g /∈ S(R)
che soddisfano la condizione (−i∂f, g) = (f,−i∂g) per ogni f ∈
S(R).Si può dimostrare che −i∂x in L2(R) è simmetrico nel dominio
S(R) e autoaggiunto neldominio {fAC , f ′′ ∈ L2(R)} 2.Consideriamo
ora l’operatore−i∂x definito sull’intervallo limitato [0, 1].
Definiamo cinqueoperatori diversi, che differiscono solo per la
scelta del dominio :
AL = −i∂x D(AL) = {hAC , h′ ∈ L2[0, 1]|h(0) = 0}AR = −i∂x D(AR)
= {hAC , h′ ∈ L2[0, 1]|h(1) = 0}A1 = −i∂x D(A1) = {hAC , h′ ∈ L2[0,
1]|h(0) = h(1) = 0}A2 = −i∂x D(A2) = {hAC , h′ ∈ L2[0, 1]|h(0) =
h(1)}A3 = −i∂x D(A3) = {hAC , h′ ∈ L2[0, 1]} (22)
Non è difficile verificare che A1 è simmetrico, A2 è
autoaggiunto, A∗1 = A3 e A
∗L = AR.
Cominciamo con l’osservare che i termini di bordo nell’equazione
(20) non si annullano
per funzioni f, g che appartengono ai domini di AL, AR; questi
operatori non sono quindi
simmetrici. Calcoliamo l’aggiunto di AL: questo dovrà
soddisfare l’equazione (ALf, g) =
(f, A∗Lg) per ogni f ∈ D(AL) e g ∈ D(A∗L). Consideriamo la
formula (20): AL e ARagiscono entrambi come −i∂x e, se scegliamo
f(0) = 0, i termini al bordo si cancellanoper ogni funzione che
soddisfi g(1) = 0. Ne segue che (ALf, g) = (f, ARg) per ogni
f ∈ D(AL) e g ∈ D(AR), da cui concludiamo che A∗L = AR 3.
Consideriamo ora A1, A22Il suffisso AC indica che la funzione deve
essere scelta assolutamente continua (cfr Rudin, Real and
Complex Analysis). Questa richiesta serve a garantire la
validità del teorema fondamentale del calcolo
integrale (f(b) − f(a) =∫ baf ′(x)dx) e la possibilità di
integrare per parti. È un requisito tecnico che
serve ad eliminare alcune funzioni patologiche che pure sono L2
con derivata L2. Alcuni testi riformulano
le condizioni fAC , f′ ∈ L2 in maniera equivalente richiedendo
di lavorare nello spazio di Sobolev H1 (che
è uno spazio di distribuzioni).3Per essere precisi, abbiamo
solo dimostrato che A∗L è un‘estensione di AR: il dominio di A
∗L potrebbe
essere più grande di quello di AR. Possiamo dimostrare che A∗L
≡ AR come segue. Sia dato g ∈ D(A∗L),
9
-
e A3: abbiamo una catena di operatori, con domini che soddisfano
D(A1) ⊂ D(A2) ⊂D(A3) e che coincidono a coppie nell’intersezione
dei loro domini. Gli operatori A1 e A2sono simmetrici poichè i
termini di bordo nell’equazione (20) si annullano per funzioni
f, g ∈ D(Ai), i = 1, 2. A3 non è invece simmetrico. Notiamo
tuttavia che A1 non èautoaggiunto. Infatti i termini di bordo
nell’equazione (20) si annullano anche nel caso
in cui f si annulla agli estremi e g è arbitraria; per ogni
coppia di funzioni f ∈ D(A1)e g ∈ D(A3) vale l’equazione (A1f, g) =
(f, A3g). Ne concludiamo che A∗1 = A3. Inmaniera analoga ci si può
convincere che A2 = A
∗2. A1 è quindi un operatore simmetrico
ma non autoaggiunto, mentre A2 è autoaggiunto.
2. Operatori unitari. U si dice unitario se UU∗ = U∗U = I, dove
I è l’identità. Nel
caso finito-dimensionale, U è unitario se lo è la matrice
corrispondente. Gli operatori
unitari preservano norma e prodotto scalare: infatti (Ux, Uy) =
(x, U∗Uy) = (x, y). U
è ovviamente invertibile con inverso U∗. Un operatore unitario
è quindi un’isomorfismo
di H in sè stesso. Visto che ‖U(x)‖ = ‖x‖, U è necessariamente
continuo e di norma1. È anche possibile pensare agli operatori
unitari come cambi di base nello spazio di
Hilbert: se {φi} è un s.o.n.c. anche {Uφi} lo è, come si
verifica facilmente usando leproprietà che abbiamo appena
discusso. Un esempio notevole di operatore unitario in
L(R) è l’operatore Trasformata di Fourier.
3. Proiettori. Per ogni sottospazio chiuso S di H abbiamo la
decomposizione ortogonale
H = S + S⊥. Ogni x si scrive in maniera unica come x = y + z con
y ∈ S, z ∈ S⊥. Ilproiettore P sul sottospazio S è definito dalla
formula Px = y.
Teorema: P è continuo, autoaggiunto e idempotente (cioè P 2 =
P ).
Dim: P 2 = P è ovvio. Da ‖x‖2 = ‖y‖2 + ‖z‖2, otteniamo ‖Px‖2 =
‖y‖2 ≤ ‖x‖2.Quindi P è continuo e ‖P‖ ≤ 1. Infine, date le
decomposizioni ortogonali di due vettorixi = yi + zi, i = 1, 2 con
Pxi = yi, (Px1, x2) = (y1, x2) = (y1, y2 + z2) = (y1, y2) =
(y1 + z1, y2) = (x1, Px2) quindi P è autoaggiunto. 2
1.6 Autovalori e teoria spettrale
La teoria spettrale generalizza agli spazi di Hilbert lo studio
di autovalori ed autovettori.
È noto dall’algebra elementare che ogni matrice autoaggiunta ha
autovalori reali e una
che quindi soddisfa (ALf, g) = (f,A∗Lg) per ogni f ∈ D(AL). A∗Lg
esiste ed è L2. Esiste quindi anche
φ(x) = −i∫ 1xA∗Lgdx che soddisfa φ(1) = 0 e −i∂xφ = A∗Lg.
Vogliamo dimostrare che φ ≡ g, da cui
deduciamo che l’azione di A∗L su g è una derivata e che g(1) =
0, cioè A∗L = AR. Da (g,ALf) =
(A∗Lg, f) =∫ 10A∗Lgf̄ = −i
∫ 10∂φf̄ = −iφf̄ |10 +
∫ 10φ(−i∂f) = (φ,ALf) deduciamo (g − φ,ALf) = 0.
Non è difficile convincersi che l’immagine di AL è perlomeno
densa in L2: concludiamo che g = φ. Un
ragionamento analogo può essere usato per rendere rigorosi gli
altri argomenti riportati nel testo.
10
-
base ortonormale di autovettori. In questa base la matrice è
diagonale. In uno spazio
di Hilbert è necessario estendere il concetto di autovalore
introducendo autovalori gen-
eralizzati e lo spettro di un operatore. La teoria spettrale
garantisce che un operatore
autoaggiunto ha spettro reale e può essere diagonalizzato.
Ricordiamo che λ ∈ C e x ∈ H non nullo si definiscono autovalore
e autovettoredell’operatore A in H se vale
Ax = λx (23)
Il nucleo Ker(A−λI) dell’operatore A−λI è quindi non nullo e si
definisce autospazioassociato all’autovalore λ. L’operatore A− λI
non è ovviamente invertibile.
È utile generalizzare il concetto di autovalore estendendolo a
tutti i numeri λ ∈ C percui A− λI non è invertibile nel senso
della seguente definizione:
Def: Si definisce spettro σ(A) dell’operatore A in uno spazio di
hilbert H l’insieme dei
λ ∈ C per cui (A− λI)−1 /∈ B(H). Lo spettro si divide
naturalmente in tre sottoinsiemidisgiunti:
Spettro discreto: l’insieme dei λ ∈ C per cui A − λI non è
iniettivo, e quindi non èinvertibile come mappa lineare
Spettro continuo: l’insieme dei λ ∈ C per cui A−λI è
invertibile come mappa lineare,è densamente definito ma (A− λI)−1
: Im(A− λI)→ H non è un operatore continuo
Spettro residuo: l’insieme dei λ ∈ C per cui A− λI è
invertibile come mappa linearema non è densamente definito
Lo spettro discreto corrisponde all’insieme degli autovalori di
A. Infatti se A−λI nonè iniettivo, Ker(A−λI) 6= 0 ed esiste almeno
una soluzione non nulla dell’equazione Ax =λx. Lo spettro continuo
è la vera novità per gli operatori in spazi infinito
dimensionali.
Poichè A − λI è invertibile, Ker(A − λI) = 0 e λ non è un
autovalore. λ appartenenteallo spettro continuo è però un
autovalore approssimato:
Teorema 5: Per ogni λ ∈ C appartenente allo spettro continuo,
esiste una successionedi vettori xn tali per cui ‖Axn − λxn‖ →
0.Dim: (A − λI)−1 non è continuo, quindi esiste una sucessione yn
tale per cui ‖(A −λI)−1yn‖ ≥ n‖yn‖. Definendo wn = (A − λI)−1yn si
ha che ‖Awn − λwn‖ ≤ ‖wn‖/n.Infine se xn = wn/‖wn‖ si ha che ‖Axn −
λxn‖ ≤ 1/n→ 0. 2
11
-
L’equazione agli autovalori può quindi essere approssimata a
piacere quando λ appartiene
allo spettro continuo. Ovviamente la successione xn non può
convergere in H. In caso
contrario, se xn → x ∈ H, il teorema 5 garantisce che Axn → λx,
e quindi, sotto lasola condizione che A sia chiuso, Ax = λx e λ
sarebbe un autovalore. Tipicamente,
esiste uno spazio topologico H ⊂ Y di funzioni o distribuzioni a
cui può essere estesa ladefinizione dell’operatore A in cui la
successione xn ∈ H converge a un vettore x ∈ Ye vale l’equazione Ax
= λx come equazione per vettori e operatori in Y . Per questa
ragione λ appartenente allo spettro continuo si chiama anche
autovalore generalizzato e
la distribuzione x autofunzione generalizzata. Lo spettro
residuo è il meno interessante.
Gli operatore interessanti hanno spettro residuo vuoto.
Teorema 6: Se A è autoaggiunto, i suoi autovalori sono reali e
gli autovettori cor-
rispondenti ad autovalori diversi sono mutuamente ortogonali.
L’intero spettro σ(A) è
un sottoinsieme dell’asse reale e lo spettro residuo è
vuoto.
Dim: Dato u 6= 0 con Au = λu: λ(u, u) = (λu, u) = (Au, u) =
(u,Au) = (u, λu) =λ(u, u). Da (u, u) 6= 0 segue che λ = λ, cioè
gli autovalori sono reali. Analogamente,siano u1, u2 due
autovettori corrispondenti a due autovalori distinti: Aui = λiui, i
= 1, 2.
λ1(u1, u2) = (λ1u1, u2) = (Au1, u2) = (u1, Au2) = (u1, λ2u2) =
λ2(u1, u2). Dalla realtà
degli autovalori segue che (λ1 − λ2)(u1, u2) = 0. Infine dal
fatto che λ1 6= λ2, segue che(u1, u2) = 0. Dimostriamo ora che lo
spettro continuo è reale e lo spettro residuo vuoto.
Dato λ = λ1 + iλ2 con λi ∈ R calcoliamo
‖(A− λI)x‖2 = ‖(A− λ1I)x− iλ2x‖2 = ‖(A− λ1I)x‖2 + |λ2|2‖x‖2
(24)
(i termini misti si annullano per la simmetria di A: ((A −
λ1I)x,−iλ2x) + (−iλ2, (A −λ1I)x) = iλ2(((A − λ1I)x, x) − (x, (A −
λ1I)x)) = 0). Dall’equazione precedente segueche ‖(A − λI)x‖2 ≥
|λ2|2‖x‖2. Definendo y = (A − λI)x si ha che ‖(A − λI)−1y‖2
≤‖y‖2/|λ2|2. Se λ2 6= 0 l’operatore inverso (A − λI)−1 è continuo
e quindi ogni λ conparte immaginaria non nulla non appartiene allo
spettro continuo. Infine, se λ non è un
autovalore anche λ̄ non lo è, poichè gli autovalori sono
reali. Quindi Ker(A− λ̄I) = {0}.Ora, se x ∈ Ker(A − λ̄I) allora 0 =
(Ax − λ̄x, y) = (x,Ay) − λ̄(x, y) = (x, (A − λI)y)per ogni y a
causa dell’autoaggiuntezza di A; quindi x ∈ (Im(A − λI))⊥. Ne
segue(Im(A − λI))⊥ = Ker(A − λ̄I) ≡ {0}. L’immagine dell’operatore
A − λI, che è ildominio dell’operatore inverso (A− λI)−1 è quindi
denso in H e λ non può appartenereallo spettro residuo che è
quindi vuoto. 2
Si dimostra analogamente che
Teorema 7: Se A è unitario, i suoi autovalori sono numeri
complessi di modulo unitario
12
-
e gli autovettori corrispondenti ad autovalori diversi sono
mutuamente ortogonali. Lo
spettro è un sottoinsieme del cerchio unitario e lo spettro
residuo è vuoto.
Esempio 1: consideriamo il caso finito-dimensionale. È ben noto
che ogni matrice
autoaggiunta può essere diagonalizzata. Infatti l’equazione
agli autovalori (23) si riduce
ad un‘equazione matriciale Ax = λx in CN . Da (A − λI)x = 0
segue che gli autovalorisoddisfano l’equazione caratteristica
det(A− λI) = 0 (25)
Questa è un’equazione polinomiale di gradoN in λ che quindi ha
esattamenteN soluzioni.
Ne concludiamo che esistono esattamente N autovalori λi, i = 1,
..., N . Se sono tutti
distinti, il teorema 6 garantisce l’esistenza di N autovettori
mutuamente ortogonali.
Possiamo costruire una base o.n.c. {ui}, i = 1, ..., N usando
gli autovettori oppor-tunamente normalizzati. Questo cambiamento di
base è quello che nei corsi di alge-
bra lineare si usa per diagonalizzare una matrice simmetrica o
autoaggiunta. Nella
base {ui}, infatti, la matrice associata ad A è diagonale, A =
diag(λ1, ..., λN), poichèAij = (Auj, ui) = λj(uj, ui) = λiδij. Nel
caso ci siano autovalori multipli, ognuno di
questi è associato a un sottospazio di CN di dimensione pari
alla molteplicità; in ognunodi questi sottospazi possiamo
scegliere autovettori mutuamente ortogonali in modo da
completare un s.o.n.c. in CN .
Esempio 2: consideriamo l’operatore A2 = −i∂x autoaggiunto in
D(A2) = {fAC , f ′ ∈L2[0, 1]|f(0) = f(1)}. I suoi autovalori e
autovettori si determinano dall’equazione dif-ferenziale −iy′ = λy
che ha soluzioni y = Aeiλx. Le condizioni al contorno
(periodicitàdi y) impongono λ = 2πn = 0, 1, 2, .... L’insieme
degli autovettori, opportunamente
normalizzati, un = e2πnx è un s.o.n.c. in L2[0, 1] (base di
Fourier).
Vediamo che l’esempio 2 generalizza in maniera molto semplice il
risultato valido in
uno spazio finito-dimensionale: gli autovettori dell’operatore
autoaggiunto possono essere
scelti in modo da formare un s.o.n.c. in H. Questa situazione
non si generalizza ad ogni
operatore in uno spazio di Hilbert, come dimostra l’esempio
seguente:
Esempio 3: consideriamo ancora l’operatoreA = −i∂x definito
però inD(A) = {fAC , f ′ ∈L2(R)}. È anch‘esso autoaggiunto. I
suoi autovalori e autovettori si determinano ancorauna volta
dall’equazione differenziale −iy′ = λy che ha soluzioni y = Aeiλx.
Questesoluzioni però non sono L2(R) per nessun valore di λ.
L’operatore A non possiede alcunautovalore nè autovettore. Notiamo
tuttavia che, sebbene non sia possibile trovare alcun
vettore x ∈ H che soddisfi l’equazione Ax = λx, è possibile
trovare vettori xn ∈ H che
13
-
approssimino questa equazione con un errore arbitrariamente
piccolo per ogni λ reale:
‖Axn − λxn‖ ≤ �. Infatti non è difficile definire delle
funzioni xn ∈ C1(R), nulle aldi fuori dell’intervallo (−n − 1, n +
1) e coincidenti con eiλx nell’intervallo (−n, n) chesoddisfino
alla proprietà limn→∞ ‖Axn − λxn‖ = 0 per λ reale. Si può
dimostrare infatti[1] che lo spettro dell’operatore è puramente
continuo e coincidente con l’asse reale. Le
funzioni uλ = eiλx con λ ∈ R vengono chiamate autovettori
generalizzati. In effetti le
funzioni xn che soddisfano la proprietà dell’autovalore
approssimato in questo esempio
convergono a uλ = eiλx quando n tende all’infinito. Le funzioni
uλ non appartengono allo
spazio di Hilbert L2(R) ma possono essere interpretate come
elementi di uno spazio piùampio di distribuzioni Y . Nello spazio
Y l’equazione −i∂xuλ = λuλ è soddisfatta.
Un operatore autoaggiunto generico possiede sia spettro discreto
che spettro continuo.
Il teorema spettrale viene formulato come segue. È possibile
associare ad ogni auto-
valore generalizzato λ una distribuzione uλ chiamata autovettore
generalizzato. uλè definito come limite nello spazio delle
distribuzioni dei vettori xn ∈ H che appaiononella definizione di
autovalore generalizzato. La successione xn non converge ad
alcun
elemento di H, ma converge nel senso delle distribuzioni a uλ
che non appartiene ad H.
Teorema Spettrale: ogni operatore autoaggiunto A in uno spazio
di Hilbert è caratter-
izzato dai suoi autovalori e autovettori {λn, un} che formano un
s.o.n. (spettro discreto) eda una o più famiglie continue di
autovalori e autovettori generalizzati (spettro continuo)
{λ, uλ} tali per cui ogni elemento dello spazio di Hilbert si
può scrivere come
f =∑n
anun +
∫a(λ)uλdλ (26)
Attraverso il teorema spettrale abbiamo effettivamente
diagonalizzato l’operatore e ab-
biamo la possibilità di sviluppare il generico elemento x ∈ H
nella base degli autovettori,ordinari e generalizzati. La
diagonalizzazione di A segue dalla formula
Af =∑n
λnanun +
∫λa(λ)uλdλ (27)
Per una definizione corretta dell’integrale nella precedente
formula rimandiamo a [1].
Esempio 3. Continuazione: ogni funzione in L2(R) si può
sviluppare nel set di au-tovettori generalizzati uλ nel senso
dell’equazione (26):
f(x) =
∫a(λ)eiλxdλ, (28)
14
-
Il teorema spettrale, in questo caso, non è altro che
l’affermazione che ogni funzione
in L2(R) possiede una trasformata di Fourier. L’operatore, in
questo caso, ha spettropuramente continuo, coincidente con l’asse
reale.
Esempio 4: l’operatore posizione in L2[a, b], −∞ ≤ a < b ≤ ∞
è autoaggiunto neldominio D(x̂) = {f ∈ L2[a, b]|xf ∈ L2[a, b]}
come si verifica facilmente. L’equazionex̂ψ = λψ richiede xψ(x) =
λψ(x) che non può essere risolta da nessuna funzione ψ(x).
L’operatore x̂ non ha quindi autovalori. Si può pero’
dimostrare [1] che il suo spettro
è puramente continuo e coincide con l’intervallo [a, b].
L’equazione agli autovalori è
risolta dalle distribuzioni uλ = δ(x − λ) per λ ∈ [a, b]. È
facile verificare che esisteuna successione di funzioni in L2[a, b]
che converge a uλ e che soddisfa la proprietà
dell’autovalore apprssimato. Il teorema spettrale si riduce in
questo caso alla banale
formula
ψ(x) =
∫ ba
δ(x− λ)ψ(λ)dλ (29)
che è valida per ogni ψ ∈ L2[a, b].
Esiste una classe di operatori che ha spettro puramente
discreto. Per questi il teorema
spettrale vale nella forma:
Teorema Spettrale per operatori a spettro discreto: l’insieme
degli autovettori
di un operatore autoaggiunto A con spettro puramente discreto
possono essere scelti in
modo da formare un s.o.n.c.
Gli operatori con spettro puramente discreto generalizzano la
teoria spettrale valida per
spazi finito dimensionali in una forma particolarmente semplice.
Ogni elemento f dello
spazio di Hilbert si può sviluppare nella base degli
autovettori di A, {ui},
f =∑i
aiui (30)
La base degli autovettori, in analogia con quanto succede nel
caso finito-dimensionale,
è la base in cui l’operatore è diagonale (Aui = λiui). Questa
proprietà si esprime
formalmente con l’equazione
Af =∑i
λiaiui (31)
che risulta essere vera anche se A non è continuo. Usando
l’isomorfismo H ∼ l2, f → {ai}determinato dalla scelta della base
{ui}, l’operatore A può essere rappresentato come unamatrice
(infinito-dimensionale) diagonale, con entrate uguali agli
autovalori.
15
-
Per concludere, è opportuno notare che il teorema 6 e il
teorema spettrale valgono
per operatori autoaggiunti e non è detto che valgano per
operatori che sono soltanto sim-
metrici. Operatori simmetrici hanno spettro discreto e continuo
reale, ma genericamente
lo spettro residuo non è vuoto e complesso ed infine il teorema
spettrale non è valido.
1.7 Esempi: equazioni integrali, alle derivate ordinarie e
parziali
1.7.1 Equazioni integrali
Gli operatori integrali sono particolarmente semplici. Alcune
applicazioni storiche della
teoria degli spazi di Hilbert sono infatti alle equazioni
integrali.
Consideriamo un operatore integrale definito in L(Ω) dove Ω è
un sottoinsieme di Rn.
K : f ∈ L2(Ω) → Kf(x) =∫
Ω
k(x, y)f(y)dy (32)
Se il nucleo integrale k(x, y) ∈ L2(Ω× Ω) l’operatore K è
continuo. Infatti, dalla disug-uaglianza di Holder segue che
‖Kf‖2 =∫
Ω
|∫
Ω
k(x, y)f(y)dy|2dx ≤∫
Ω
(
∫Ω
|k(x, y)|2dy∫
Ω
|f(w)|2dw)dx
≤ ‖f‖2∫
Ω×Ω|k(x, y)|2dxdy (33)
È facile verificare che se k(x, y) = k(y, x), K è
autoaggiunto. K in realtà è più che
continuo, è un operatore compatto, cioè manda insiemi limitati
in insiemi la cui chiusura è
compatta [1]. Lo spettro degli operatori compatti è puramente
discreto e particolarmente
semplice.
Teorema 8: Un operatore autoaggiunto compatto ha autovalori
reali λn → 0 ed au-tovettori un che formano un s.o.n.c. Lo spettro
è discreto con al più uno spettro continuo
che consiste del solo punto λ = 0 se questo non è un
autovalore.
1.7.2 Equazioni Differenziali Ordinarie: Problemi agli
autovalori
Un problema classico delle equazioni differenziali ordinarie è
il problema agli autovalori
o problema al contorno. Questo tipo di problema è naturale in
Meccanica Quantistica e
si incontra spesso anche in fisica classica, in particolare
quando si risolvono problemi al
contorno per equazioni differenziali alle derivate parziali.
Esempio 1: sia data l’equazione differenziale lineare del
secondo ordine dipendente da
un parametro λ
y′′ + λy = 0 (34)
16
-
Il teorema di esistenza e unicità garantisce che, date le
condizioni iniziali (problema di
Chauchy)
y(x0) = y0
y′(x0) = y1 (35)
la soluzione esiste, è unica e dipende continuamente dai dati
iniziali. Chiediamoci ora
se la stessa equazione ha soluzioni nell’intervallo [x0, x1] che
soddisfano il problema al
contorno
y(x0) = 0
y(x1) = 0 (36)
Un equazione del II ordine ha sempre due soluzioni linearmente
indipendenti yi(x;λ), i =
1, 2 e la generica soluzione si può esprimere come loro
combinazione lineare
y(x) = c1y1(x;λ) + c2y2(x;λ). (37)
λ appare in generale come parametro nell’espressione delle
soluzioni. Sappiamo che il
problema di Chauchy (35) ha sempre una soluzione. Nel caso del
problema al contorno
(36), c‘e’ sempre la soluzione banale c1 = c2 = 0. Esisterà una
seconda soluzione se e
solo se il sistema
c1y1(x0;λ) + c2y2(x0;λ) = 0
c1y1(x1;λ) + c2y2(x1;λ) = 0 (38)
ha una soluzione. Solo per alcuni valori particolari di λ,
quelli per cui la matrice dei
coefficienti yi(xj;λ) ha determinante nullo, esisterà una
soluzione non banale al problema
al contorno. Questi valori sono chiamati autovalori. Possiamo
riformulare il problema
in questi termini: risolvere l’equazione agli autovalori Ly = λy
per l’operatore L =
−∂2/∂x2 nel dominio D(L) = {fAC , f ′′ ∈ L2[x0, x1]|f(x0) =
f(x1) = 0}. L è il quadratodell’operatore A1 = −i∂x; è simmetrico
e, coi metodi della sezione 1.4, si può verificare cheè anche
autoaggiunto 4. Il problema è cos̀ı ridotto alla ricerca di
autovalori e autovettori
di un operatore autoaggiunto in uno spazio di Hilbert.
4Notiamo che −i∂x, con le condizioni f(x0) = f(x1) = 0, non è
autoaggiunto mentre il suo quadrato−∂2x lo è. Le condizioni al
contorno da imporre agli operatori possono variare col numero di
derivate,poichè questo influisce sui termini provenienti
dall’integrazione per parti. Intuitivamente, il numero di
condizioni da imporre ad un operatore differenziale con derivate
ordinarie è pari all’ordine dell’operatore
stesso: f(x0) = f(x1) = 0 contiene due condizioni su f ed è
ragionevole da imporre per un operatore
del secondo ordine ed è invece troppo restrittivo per un
operatore del prim’ordine. Per evitare errori, è
bene verificare l’autoaggiuntezza esaminando i termini al bordo
caso per caso.
17
-
Esaminiamo il caso generale di un‘equazione differenziale
lineare del II ordine:
L̂y = λ̂y (39)
con
L̂y = a2(x)y′′ + a1(x)y
′ + a0(x), a2(x) > 0. (40)
È facile verificare che (ridefinendo L e λ) si può sempre
ricondurre il problema al seguente:
Ly = λωy, L = − ddx
(p(x)
d
dx
)+ q(x). (41)
con
p(x) = e∫
(a1/a2)dx, q(x) = −a0a2e∫
(a1/a2)dx, ω(x) =e∫
(a1/a2)dx
a2(42)
Notiamo che p(x) > 0 e ω(x) > 0.
Si definisce problema di Sturm-Liouville (SL) il problema agli
autovalori:
Ly = λωy , a ≤ x ≤ bα1y(a) + α2y
′(a) = 0
β1y(b) + β2y′(b) = 0 (43)
con αi, βi reali e con almeno uno degli αi e uno dei βi diversi
da zero. Nell’equazione (43)
abbiamo scelto condizioni al contorno indipendenti per i due
estremi. È possibile scegliere
altre condizioni al contorno, ad esempio si possono scegliere
condizioni di periodicità:
f(a) = f(b) , f ′(a) = f ′(b) (44)
oppure due condizioni più complicate che coinvolgano ciascuna
f(a), f(b), f ′(a), f ′(b).
Come discusso a breve, ogni set di condizioni con la proprietà
di rendere autoaggiunto
l’operatore L definisce un buon problema di SL.
Vogliamo formalizzare il problema in un opportuno spazio di
Hilbert. Dalla teoria gen-
erale delle equazioni differenziali, sappiamo che le soluzioni
del problema (43) definito in
un intervallo limitato [a, b] e con funzioni p, q, ω
sufficientemente regolari sono anch’esse
funzioni regolari, in particolare sono L2[a, b].
Osservazione: della presenza della funzione ω in (43) si può
facilmente tener conto con-
siderando la misura ω(x)dx in [a, b]. Consideriamo cioè L2ω[a,
b] = {f |∫ ba|f(x)|2ω(x)dx <
∞} con prodotto scalare (f, g)ω =∫ baf(x)g(x)ω(x)dx. Il problema
(43) per l’operatore
Lω = L/ω diventa un problema agli autovalori Lωy = λy in L2ω.
Notiamo che nel
prodotto scalare (Lωf, g)ω =∫ ba(Lf)g tutti i fattori di ω si
cancellano. Senza perdita di
18
-
generalità si può anche porre ω = 1: la teoria generale si
ottiene sostituendo ovunque
L→ Lω, (f, g)→ (f, g)ω.
Consideriamo quindi il problema agli autovalori:
Ly = λy
D(L) = {fAC , f ′′ ∈ L2[a, b]ω|α1y(a) + α2y′(a) = β1y(b) +
β2y′(b) = 0} (45)
L è un operatore autoaggiunto. Infatti,
(Lf, g) =∫ ba((−pf ′)′ + qf)gdx = −pf ′g|ba +
∫ bapf ′g′dx+
∫ baqfgdx =
−p(f ′g − fg′)|ba +∫ baf((−pg′)′ + qg) = (f, Lg) (46)
I termini di bordo che vengono dall’integrazione per parti si
annullano a causa delle
condizioni al contorno scelte (43) o (44). Ad esempio, per (43)
e β2 6= 0, all’estremob otteniamo: p(f ′g − fg′)(b) =
p(b)(−β1/β2)(fg − fg)(b) = 0. Lo stesso risultato valeper β2 = 0 e
per l’estremo a. L’operatore L e’ quindi simmetrico; coi metodi
della
sezione 1.4 si può dimostrare che è anche autoaggiunto. Lo
stesso vale per le condizioni
(44). Condizioni al contorno più generali dovranno essere
scelte in modo che i termini al
bordo dell’integrazione per parti si cancellino e che
l’operatore sia autoaggiunto oltre che
simmetrico. Nel caso in cui l’intervallo [a, b] sia illimitato,
i termini al bordo valutati nel
punto all’infinito si annullano automaticamente piochè ogni
funzione L2[a, b] si annulla
all’infinito. Perciò se a o b o entrambi sono infiniti, in
questi punti non occorre imporre
alcuna condizione. Si richiede tuttavia di trovare una soluzione
L2[a, b]: la condizione
implicita che deve essere imposta all’infinito alle soluzioni
dell’equazione differenziale è
di essere a quadrato sommabile. Questa è la condizione naturale
da imporre se si vuole
formulare il problema in uno spazio di Hilbert. È anche la
condizione naturale da imporre
in un problema di Meccanica Quantistica.
Usando il teorema 6 otteniamo immediatamente
Teorema 9: Dato un sistema di SL formulabile come un problema
agli autovalori per
un operatore in uno spazio di Hilbert:
a) gli autovalori sono reali
b) le soluzioni (autovettori) corrispondenti ad autovalori
diversi sono ortogonali nel
prodotto scalare di L2ω.
Gli autovettori di un sistema di SL formano un s.o.n. che non è
necessariamente
completo, dato che un generico operatore avrà anche spettro
continuo. Il problema di
19
-
V=x /2E
E1
2
x
E
V=02
determinare lo spettro di un operatore differenziale è
complesso. I metodi più usati per
determinare lo spettro sono:
I: studiare il risolvente di L. Ogni equazione differenziale
ordinaria si può convertire in
un’equivalente equazione integrale, ottenuta invertendo
l’operatore differenziale
Lu(x) = λu(x) , → u(x) = λL−1u(x) ≡∫ ba
k(x, y)u(y)dy (47)
Il nucleo integrale k(x, y) si chiama funzione di Green
associata all’operatore differenziale
L. Gli operatori integrali sono più semplici studiare e lo
spettro di L si può determinare
studiando lo spettro dell’operatore integrale associato. In
particolare, se la funzione di
Green k(x, y) risulta essere a quadrato sommabile, il teorema 8
garantisce che lo spettro
dell’operatore integrale, e quindi lo spettro di L, è puramente
discreto. Operatori dif-
ferenziali di questo tipo si chiamano a risolvente compatto. In
questo caso gli autovettori
di L formano un s.o.n.c.
II: ridurre, se possibile, l’equazione differenziale ad
un’equazione di Schroedinger stazionaria.
Consideriamo l’equazione di Schroedinger stazionaria per una
particella sulla retta soggetta
al potenziale V (x)
−d2u
dx2+ V (x)u = Eu (48)
L’equazione è evidentemente della forma SL con p = 1, q = V (x)
e ω = 1; per uniformarci
alle notazioni della MQ, abbiamo chiamato E l’autovalore λ. La
funzione d’onda u
rappresenta una densità di probabilità, ed è normalizzata∫R
|u|
2dx = 1. La condizione
da imporre all’infinito è quindi l’integrabilità L2.
Equivalentemente, dobbiamo risolvere
il problema agli autovalori Hu = Eu in L2(R) per l’operatore
autoaggiunto H = − d2dx2
+
V (x). Alla funzione V (x) si richiede di essere
sufficientemente regolare. Consideriamo
il potenziale indicato a sinistra nella figura. Classicamente la
particella di energia E è
obbligata a muoversi nell’intervallo definito dalla
disuguaglianza E − V (x) = p2/2 ≥ 0.Nell’intervallo di energia [E1,
E2] la particella è costretta ad oscillare in una regione
finita
di spazio, nell’intervallo [E2,∞] la particella può muoversi
fino all’infinito. Come discusso
20
-
in ogni buon testo di MQ, quantisticamente esisteranno dei
livelli energetici discreti Enda cercarsi dove il moto classico é
limitato in una regione finita, σd(H) = {En} ⊂[E1, E2] e uno
spettro continuo di energie corrispondente ai valori classici
dell’energia
per cui il moto è illimitato, σc(H) = [E2,∞]. Notiamo che gli
autovalori dell’operatoreH corrispondono solo ai livelli energetici
discreti. L’intero insieme dei possibili valori
dell’osservabile energia è associato all’intero spettro
dell’operatore H. Gli autovalori
generalizzati uE per E ∈ σc(H) sono tipicamente delle funzioni
non in L2(R) che hanno laforma di onde piane per grande x positivo.
Nella figura sono indicati due casi limite. Per
V (x) = 0 lo spettro è puramente continuo σc(H) = [0,∞] con
autofunzioni generalizzateche sono onde piane uE = e
ipx, E = p2/2. Il caso V (x) = x2/2, corrispondente ad un
oscillatore armonico, ha spettro puramente discreto En = (n+
1/2) con autofunzioni che
sono i polinomi di Hermite un = Hn(x)e−x2/2.
Un risultato generale è il seguente. Il problema di SL con a e
b finiti, p, p′, ω e q
funzioni continue reali in [a, b] e p, ω > 0 il problema si
dice regolare. Per sistemi di SL
regolari vale il teorema [1]:
Teorema 10: Gli autovettori di un sistema di SL regolare formano
un insieme numerabile
{yn} che, opportunamente normalizzato, è un s.o.n.c. in L2ω[a,
b].
I problemi di SL regolari sono in assoluto i più semplici ma
hanno poche applicazioni.
Esempio 1. continuazione: consideriamo il problema di SL
y′′ + λy = 0, 0 ≤ x ≤ πy(0) = y(π) = 0 (49)
Il problema è regolare con p = 1, q = 0 e ω = 1. La soluzione
generale è y = A sin√λx+
B cos√λx. Le condizioni al contorno impongono B = 0 e sin
√λπ = 0 da cui λ =
n2, n = 1, 2, .... Otteniamo l’insieme di autovalori e
autovettori: {λn = n2, yn = sinnx}.Osserviamo che gli autovalori
sono reali, gli autovettori mutuamente ortogonali e che gli
autovettori, opportunamente normalizzati, formano un s.o.n.c.: i
seni sono la base di
Fourier (dispari) per il semi-periodo [0, π].
Esempio 1a: consideriamo il problema di SL
y′′ + λy = 0, 0 ≤ x ≤ πy(0) = y(π)
y′(0) = y′(π) (50)
21
-
Il problema è anch‘esso regolare. Le condizioni al contorno
questa volta selezionano il
sistema di autovettori {e2inx} con autovalori λ = 4n2, n ∈ Z.
Anche in questo esem-pio gli autovalori sono reali, gli autovettori
mutuamente ortogonali e che gli autovettori,
opportunamente normalizzati, formano un s.o.n.c.: la base di
Fourier sul periodo [0, π].
Notiamo che, in questo esempio, ogni autovalore ha molteplicità
due (e±2inx sono en-
trambi associati all’autovalore 4n2). Autovettori corrispondenti
ad autovalori diversi
sono ortogonali. All’interno di ogni autospazio (di dimensione
due) sono stati scelti due
autovettori ortogonali in modo che l’insieme di tutti gli
autovettori formi un s.o.n.c..
I problemi di SL più interessanti sono però singolari. Un
problema può essere sin-
golare, ad esempio, se p o ω si annullano (o divergono) in a o
in b, oppure, ancora più
semplicemente, se l’intervallo [a, b] non è limitato. Le
soluzioni delle equazioni differen-
ziali potrebbero essere discontinue e illimitate agli estremi
dell’intervallo. Usualmente,
all’estremo singolare si impongono condizioni quali la
limitatezza oppure l’integrabilità
L2 (quest’ultima è la condizione che si impone ad esempio nei
problemi provenienti dalla
Meccanica Quantistica).
Esempio 2: polinomi di Legendre. Consideriamo
d
dx
((1− x2)dy
dx
)+ λy = 0, −1 ≤ x ≤ 1 (51)
e richiediamo alle soluzioni di essere limitate in x = ±1.
Abbiamo p = 1−x2, q = 0, ω = 1.Il problema è singolare perchè
p(±1) = 0. Gli autovalori sono λl = l(l+1) con autovettorii
polinomi di Legendre Pl(x) che formano, dopo normalizzazione, un
s.o.n.c. in L
2[−1, 1].
Esempio 3: polinomi di Hermite. Consideriamo
d
dx
(e−x
2 dy
dx
)+ e−x
2
λy = 0, −∞ < x
-
Esempio 4: polinomi di Laguerre. Consideriamo
d
dx
(e−x
dy
dx
)+ e−xλy = 0, 0 < x
-
Per la prima equazione abbiamo p = 1 − x2, q = m2/(1 − x2), ω =
1. Il problema èsingolare perchè p(±1) = 0 e q(±1) = ∞. Gli
autovalori sono λl = l(l + 1), |m| ≤ l, l =0, 1, 2... con
autovettori Pml (x), polinomi di Legendre generalizzati. Le
armoniche sferiche
Ylm(θ, φ) = Pml (cos θ)e
imφ formano, dopo normalizzazione, un s.o.n.c. in L2[S2,
dΩ(2)],
dove dΩ(2) = sin θdθdφ è la misura sulla sfera unitaria S2.
Gli operatori ellittici hanno inoltre importanti proprietà di
regolarità
Teorema 12 - lemma di Weyl: ogni funzione o distribuzione u(x)
che risolva l’equazione
ellittica Lu = f è C∞ nei punti in cui i coefficienti aij(x),
bi(x), c(x) e il termine noto
f(x) sono C∞.
Questo teorema si applica ad esempio all’equazione di Laplace e
di Schroedinger
stazionaria. Le soluzioni dell’equazione di Laplace sono
automaticamente C∞, le soluzioni
dell’equazione di Poisson o dell’equazione di Schoedinger
stazionaria sono C∞ nei punti
in cui la densità di carica o il potenziale sono C∞.
Infine, per operatori ellittici, i problemi al contorno
formulati su insiemi compatti
soddisfano teoreni di esistenza, unicità e dipendenza continua
dai dati iniziali.
2 Appendice: Il complemento ortogonale
Una proprietà importante degli spazi di Hilbert riguarda la
possibilità di proiettare un
vettore su un sottospazio.
Teorema A: Dato un sottospazio chiuso V dello spazio di Hilbert
H, per ogni vettore
f ∈ H esiste unico un vettore f ∗ ∈ V con la proprietà
‖f − f ∗‖ = minv∈V ‖f − v‖ (56)
Dim: sia d = inf{‖f − v‖, v ∈ V }. Occorre dimostrare che
l’estremo inferiore è inrealtà un minimo. Se d = 0, f ∈ V e f ∗ =
f . Possiamo quindi supporre che d > 0.Consideriamo gli insiemi
Cn = {v ∈ V |‖v−f‖ ≤ d+1/n}. Dall’identità 2(‖x‖2 +‖y‖2) =‖x+ y‖2
+ ‖x− y‖2 segue che, se v1, v2 ∈ V ,
2(‖v1 − f‖2 + ‖v2 − f‖2) = ‖v1 + v2 − 2f‖2 + ‖v1 − v2‖2
‖v1 − v2‖2 = 2‖v1 − f‖2 + 2‖v2 − f‖2 − ‖v1 + v2 − 2f‖2 ≤2(d+
1
n
)+ 2
(d+ 1
n
)− 4d2 ≤ 8 d
n+ 4
n2(57)
Nel penultimo passaggio si è usato il fatto che, poiché (v1
+v2)/2 ∈ V , ‖f−(v1 +v2)/2‖ ≥d. Scegliendo una successione di
vettori {vn} ∈ Cn avremo che
‖vn − vn+p‖2 ≤ 8d
n+
4
n2(58)
24
-
tende a zero per n → ∞ per qualunque p, poiché vn, vn+p ∈ Cn.
Questo implica che{vn} ∈ Cn è di Chauchy e quindi converge. Il
limite f ∗ sarà contenuto in V poiché V èchiuso. Da ‖vn− f‖ ≤ d+
1/n segue che ‖f − f ∗‖ ≤ d. Poiché d è l’estremo inferiore
deipossibili valori ‖f − v‖, ne segue che ‖f − f ∗‖ = d. f ∗ è
unico: supponiamo infatti cheesistano due vettori che soddisfino d
= ‖f − f1‖ = ‖f − f2‖. Usando una minorazioneanaloga a quella della
formula (57) otteniamo
‖f1 − f2‖2 = 2‖f1 − f‖2 + 2‖f2 − f‖2 − ‖f1 + f2 − 2f‖2 = 4d2 −
‖f1 + f2 − 2f‖2 ≤4d2 − 4d2 = 0
che è possibile solo per f1 = f2. 2
Osservazione: il teorema è valido nell’ipotesi meno restrittiva
che V sia un insieme
convesso chiuso. La chiusura è un’ipotesi necessaria.
Il vettore f ∗ è noto come la miglior approssimazione di f in V
. È anche caratterizz-
abile come la proiezione ortogonale di f su V . Vale
infatti:
Teorema B: f ∗ è univocamente determinato dalla proprietà (f −
f ∗, v) = 0 per tutti ivettori v ∈ V .Dim: Se (f − f ∗, v) = 0 per
tutti i vettori v ∈ V , vale anche (f − f ∗, f ∗ − v) = 0.
Dalteorema di Pitagora segue che ‖f−v‖2 = ‖f−f ∗‖2+‖f ∗−v‖2 e
quindi ‖f−f ∗‖2 ≤ ‖f−v‖2per ogni v ∈ V . Ne segue che f ∗ è la
miglior approssimazione di f in V . Viceversa, siaf ∗ la miglior
approssimazione. Prendiamo v = f ∗ + αw con w ∈ V, α ∈ C. Abbiamo
che
‖f − f ∗‖2 ≤ ‖f − v‖2 = ‖f − f ∗ − αw‖2 =‖f − f ∗‖2 + ‖α|2‖w‖2 −
α(w, f − f ∗)− α∗(w, f − f ∗)∗
da cui α(w, f − f ∗) + α∗(w, f − f ∗)∗ ≤ |α|2‖w‖2. Prendendo α =
|α|eiθ con |α| → 0 siottiene eiθ(w, f − f ∗) + e−iθ(w, f − f ∗)∗ ≤
0. Prendendo θ = 0, π/2, π, 3π/2 si ottieneRe, Im(w, f − f ∗) ≥ 0 e
contemporaneamente Re, Im(w, f − f ∗) ≤ 0, da cui si conclude(f − f
∗, w) = 0. 2
Dato un insieme S definiamo il suo complemento ortogonale come
l’insieme
S⊥ = {f ∈ H|(f, s) = 0, s ∈ S} (59)
S⊥ è sempre un sottospazio chiuso di H. Infatti da x, y ∈ S⊥
segue che (αx+ βy, s) = 0per ogni s ∈ S per la linearità del
prodotto scalare, e da xn ∈ S → x segue che (x, s) =lim(xn, s) = 0
per la continuità del prodotto scalare.
25
-
Teorema C: Dato un sottospazio chiuso V di H, ogni f ∈ H si
scrive in maniera unicacome f = x+ y con x ∈ V, y ∈ V ⊥. In
simboli
H = V ⊕ V ⊥ (60)
Dim: x è definito come la proiezione f ∗ di f su V e y come f −
f ∗. y ∈ V ⊥ per ilTeorema B. L’unicità della decomposizione segue
dal fatto che, se f = x + y = x′ + y′,
x− x′ = y − y′ uguaglia vettori in V e V ⊥ che hanno in comune
il solo vettore zero. Nesegue x = x′ e y = y′. 2
Osservazione: Se V è un sottospazio non chiuso il Teorema C si
può riformulare come
H = V̄ ⊕ V ⊥. Vale anche S⊥⊥ = S̄. Quest’ultimo risultato segue
dalla doppia appli-cazione del risultato precedente, una volta a V
= S̄ e l’altra a V = S⊥: H = S̄ ⊕ S⊥ =S⊥ ⊕ S⊥⊥. Eliminando il
fattore comune S⊥ si ottiene il risultato voluto.
References
[1] Dispense per Metodi Matematici della Fisica,
http://castore.mib.infn.it/̃.zaffaron/
[2] Reed e Simon, Methods of Modern Mathematical Physics,
Academic Press, Quattro
Volumi.
[3] Mikusinski, Introduction to Hilbert Spaces, Academic
Press.
[4] W. Rudin, Functional Analysis, MacGraw-Hill.
26