-
1
Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura
Giarrè
2.4.3 Matrici e funzioni di Trasferimento
Consideriamo un sistema lineare tempo-invariante e poniamoci nel
dominio
trasformato; le formule 2.29) e 2.30) forniscono,
rispettivamente, l’uscita per un sistema
tempo-continuo ed un sistema tempo-discreto.
Se supponiamo nulle le condizioni iniziali si ottiene
)(])([)( 1 sUDBAsICsY +−= −
)(])([)( 1 zUDBAzICzY +−= −
che, nel dominio trasformato, forniscono delle rappresentazioni
ingresso/uscita per il
sistema dato.
Se il sistema è MIMO (Multiple Input, Multiple Output) si
definisce Matrice di
Trasferimento la matrice
mp
x
mp
x
pm
zHDBAzIczUzYzH
sHDBAsIcsUsYsH
yu
×−
=
×−
=
××
ℜ∈+−==
ℜ∈+−==
ℜ∈ℜ∈
)()()()()(
)()()()()(
1
0)0(
1
0)0(
11
2.31)
Nel caso in cui p=m=1 il sistema si dice SISO (Single Input,
Single Output) e la matrice
di trasferimento si riduce ad una funzione scalare che prende
appunto il nome di funzione
di trasferimento; la sua antitrasformata fornisce la risposta
impulsiva del sistema; infatti se
supponiamo di applicare in ingresso un impulso si ha
)]([)]([)()()(1)( 11 sHLsYLthsHsYsU −∂−
∂ ==⇒=⇒= 2.32)
Nel caso MIMO, invece, se supponiamo che il sistema presenta m
ingressi e p uscite si
ha
-
2
=
)()()(
)(
)()()(
)(
21
11211
sHsHsH
sH
sHsHsH
sH
pmpp
ij
m
il generico termine Hij(s) rappresenta, nel dominio di s, la
risposta yi(s) ad un impulso
applicato all’ingresso uj(s); la sua antitrasformata darà,
dunque, la risposta hij(t) presente
all’uscita yi del sistema quando all’ingresso uj è applicato un
impulso (nell’ipotesi che tutti
gli altri ingressi siano nulli)
)]([)]([)( 11 sHLsYLth ijiij j−
∂− == 2.33)
La matrice
== −
)()()(
)(
)()()(
)]([)(
21
11211
1
ththth
th
ththth
sHLth
pmpp
ij
m
prende il nome di matrice delle risposte impulsive.
Da quanto detto è facile ricavare il legame che sussiste nel
dominio del tempo tra
risposta di un sistema ad un generico ingresso u(t) e risposta
all’impulso; tale legame è
sancito dal cosiddetto integrale di convoluzione
MIMOcasoiHikuiuikHky
SISOcasoihikuiuikhky
DiscretiTempoSistemi
MIMOcasodHtudutHty
SISOcasodhtuduthty
ContinuiTempoSistemi
k
i
k
i
k
i
k
i
t t
o
t t
o
∑∑
∑∑
∫ ∫
∫ ∫
==
==
−=−=
−=−=
−=−=
−=−=
00
00
0
0
)()()()()(
)()()()()(
)()()()()(
)()()()()(
ττττττ
ττττττ
Se consideriamo la formula dell’inversa di una matrice
)det()(1
AAAggA =−
si ottiene, nel caso di un sistema TC,
-
3
DBAsIAsIAggCsH +
−−=
)det()()(
Nel dominio trasformato i sistemi si possono classificare
in:
1. Sistema strettamente proprio: Un sistema si dice strettamente
proprio quando
D=0. In questo caso il grado del numeratore della funzione di
trasferimento (per sistemi
SISO) o di ciascun termine della matrice di trasferimento (per
sistemi MIMO) può al più
essere uguale a n-1, se n è la dimensione del sistema, mentre
quello del denominatore è n.
2. Sistema non strettamente proprio: Un sistema si dice non
strettamente proprio
quando D≠0. In questo caso il grado del numeratore della
funzione di trasferimento (per
sistemi SISO) o di ciascun termine della matrice di
trasferimento (per sistemi MIMO) può
al più essere uguale a quello del denominatore e cioè n, se n è
la dimensione del sistema.
3. Sistema non proprio: Un sistema si dice non proprio quando
D≠0 ed il grado del
numeratore è maggiore di quello del denominatore.
Noi prenderemo in considerazione prevalentemente sistemi non
strettamente propri e
sistemi strettamente propri.
E’ molto utile, inoltre, dare la definizione di zeri e poli di
un sistema, perché vedremo
giocano un ruolo importante nella discussione delle proprietà
strutturali e di stabilità di un
sistema:
4. Zeri di un sistema: Si definiscono zeri di un sistema le
radici del numeratore
della f.d.t. (nel caso SISO) o dei numeratori dei termini della
matrice di trasferimento
(nel caso MIMO). Un sistema MIMO può possedere più zeri con
molteplicità diversa nello
stesso punto del dominio di Laplace o del piano complesso.
5. Poli di un sistema: Si definiscono poli di un sistema le
radici del denominatore
della f.d.t. (nel caso SISO) o dei denominatori dei termini
della matrice di trasferimento
(nel caso MIMO). Un sistema MIMO può possedere più poli con
molteplicità diversa nello
stesso punto del dominio di Laplace o del piano complesso.
Da notare che, in un sistema SISO, poli e autovalori coincidono
se e solo se
nell’espressione della f.d.t non ci sono cancellazioni tra
termini comuni a numeratore e
denominatore; ciò invece può non essere vero per i sistemi MIMO
dove poli ed autovalori
possono coincidere anche in presenza di cancellazioni in alcuni
termini.
Ciò significa che, in generale, per un sistema nel passaggio da
una rappresentazione
i/s/u ad una rappresentazione i/u può avvenire una perdita di
informazione circa gli
autovalori del sistema a causa della presenza di eventuali
cancellazioni tra binomi comuni
a numeratore e denominatore della f.d.t. (o dei termini della
m.d.t); tale perdita accade
-
4
puntualmente in sistemi SISO nelle condizioni suddette, mentre
può non verificarsi per un
sistema MIMO nel caso in cui gli autovalori che subiscono
cancellazioni in alcuni termini
rimangono in ogni caso presenti in altri termini.
2.5 Interconnessione di sistemi
Si possono distinguere due fondamentali connessioni tra
sistemi:
1. Connessione serie
2. Connessione parallelo
Analizziamole distintamente
Connessione serie
Due sistemi si dicono interconnessi in serie quando uno dei due
sistemi è pilotato
dall’altro
u u1 H1(s) y1=u2 H2(s) y2 y
u = u1
y1 = u2
=
2
1
xx
x
y = y2
++=++=++=
+=•
•
uDDxCDxCYuDBxCBxAuDxCBxAx
uBxAx
1211222
12112221112222
111
)(1
La rappresentazione del sistema complessivo si ottiene ponendo
y1=u2
[ ] uDDxCCDY
uDB
Bx
ACBA
x
12212
12
1
212
1 0
+=
+
=
•
Passando nel dominio trasformato si ha
-
5
)()()()()()()()()()()()()()()(
211212222
11
sHsHsHsUsHsHsYsHsUsHsYsYsUsHsY
=⇒=====
Nel caso di sistemi MIMO bisogna stare attenti all’ordine delle
matrici.
Connessione parallela
Due sistemi si dicono interconnessi in parallelo quando gli
ingressi coincidono e le
uscite si sommano.
H1(s) y1
u y
y2 H2(s)
=
2
1
xx
x
+++=+=
+=•
•
uDxCuDxCYuBxAx
uBxAx
222111
111
111
1
1
La rappresentazione del sistema complessivo è
[ ] uDDxCCY
uBB
xA
Ax
)(0
0
1221
2
1
2
1
++=
+
=
•
Passando nel dominio trasformato si ha
)()()()())()(()()()()()()()()()(
212121
2211
sHsHsHsUsHsHsYsYsYsUsHsYsUsHsY
+=⇒+=+===
-
6
3. Modelli ARMA di un sistema LTI e loro identificabilità
Abbiamo prima visto com’è possibile ottenere una
rappresentazione nello spazio degli
stati di un sistema LTI, partendo da una rappresentazione
ingresso/uscita; il metodo da noi
usato si basa su uno studio nel dominio del tempo attraverso il
quale si cerca di
determinare una rappresentazione i/s/u del sistema dopo
un’opportuna scelta del vettore di
stato.
In molti casi può essere conveniente lavorare nel dominio
trasformato, cercando di
ottenere una rappresentazione nello spazio degli stati a partire
dalla matrice di
trasferimento del sistema, ottenuta mediante trasformazione
della rappresentazione i/u
(ovviamente tale metodo è valido solo per condizioni iniziali
nulle).
In pratica, prendendo per esempio un sistema LTI-TD con
rappresentazione ingresso-
uscita
(modello ARMA)
si opera una trasformazione che, supponendo nulle le condizioni
iniziali, permette di
ottenere la f.d.t. del sistema
)()()()(
)()()(
)()()()()(
212
21
221221
zUzDzNzY
azazbzb
zUzYzH
zzUb
zzUb
zzYa
zzYazY
=⇒++
+==
+=++
A questo punto si sostituisce, in N(z) e D(z), la variabile z
con l’operatore p, il qual è un
operatore che applicato ad una funzione f(k) ne provoca una
traslazione in avanti; in
pratica nel passo successivo si ottiene
)()()()( ku
pDpNky =
Definendo una variabile ausiliaria
)()(
1)( kupD
kx =
si ottiene
)()1()()()()()()()()1()2()()()()()()(
2121
21212
kxbkxbkxbzbkxpNkykukxakxakxkukxazazkukxpD
++=+===++++⇒=++⇒=
Prendendo, allora, come vettore di stato
+=
)1()(
)(kx
kxkz
-
7
si ottiene
[ ] )()(
)(10
)(10
)2()1(
)1(
12
12
kzbbky
kukzaakx
kxkz
=
+
−−=
++
=+
Analogo discorso per i sistemi TC dove l’operatore p
s’identifica con quello di
derivazione e non con quello di traslazione come accade nei
sistemi TD.
E’ ovvio che anche con questo metodo la dimensione del sistema
dipende molto dalla
scelta del vettore di stato; una cosa è certa, qualunque sia la
realizzazione del sistema
questa deve ammettere gli stessi autovalori di ogni altra
(cambiando dimensione
dovrebbero cambiare il numero di autovalori, ma non perché non
ci sono, semplicemente
perché si cancellano durante il calcolo della f.d.t per cui non
sono visibili esternamente)
nonché la stessa f.d.t. o m.d.t. Analogo discorso per i sistemi
TC dove l’operatore p
s’identifica con l’operatore di derivazione.
3.1 Determinazione di una rappresentazione i/u a partire da una
rappresentazione
i/s/u
Abbiamo visto che una f.d.t. di un sistema non è altro che una
sua rappresentazione i/u
nell’ipotesi che lo stesso sistema si evolva a partire dallo
stato zero.
Ciò implica che un modo per ottenere una rappresentazione i/u di
un sistema a partire da
una sua rappresentazione i/s/u è di determinare la f.d.t del
sistema,
)()()()( zU
zDzNzY =
sostituire, in N(z) e D(z), la variabile z con l’operatore p (di
traslazione nel caso TD e di
derivazione nel caso TC)
pinpolinomiPNepD
kupNkypDkupDpNky
)()(
)()()()()()()()( =⇒=
e quindi sviluppare entrambi i membri della relazione ottenuta
tenendo presente che
TCkfkfpTDnkfkfp
nn
n
)()()()(
)(=
+=
-
8
3.2 dentificabilità o taratura dei modelli ARMA di un sistema
LTI
3.2.1 Assenza di errori sull’ingresso e sull’uscita:
-
9
-
10
-
11
3.2.2Presenza di errori sull’ingresso e sull’uscita:
-
12
4. STABILITA’ INTERNA ALLA LYAPUNOV
Le nozioni di stabilità interna che ci proponiamo di introdurre
forniscono indicazioni
circa il comportamento del sistema nell’intorno di un suo punto
d’equilibrio; in pratica
servono a stabilire se una piccola perturbazione, da x0, provoca
una risposta nello stato del
sistema che si estingue nel tempo (lo stato tende, dopo un
piccolo scostamento, di nuovo a
x0), che converge ad un altro stato x o addirittura
divergente.
Nell’introdurre queste nozioni di stabilità, è bene premettere
che, noi considereremo
prevalentemente il caso in cui il punto d’equilibrio x0 sia
isolato (in realtà i sistemi
dinamici possono avere più punti d’equilibrio ed, addirittura,
quelli non lineari possono
avere punti d’equilibrio periodici) e coincidente con l’origine
(ciò non è restrittivo perché
possiamo sempre ricondurci a questo caso tramite una traslazione
di coordinate).
4.1 Asintotica stabilità (locale) e stabilità nel senso di
Lyapunov
Un sistema si dice asintoticamente stabile attorno al suo punto
d’equilibrio se soddisfa
le seguenti condizioni
a. 0101 )()(00 tttxtxsechetale ≥∀∀ εε
(Questa condizione richiede che la traiettoria di stato debba
essere confinata in una
piccola sfera di raggio ε, centrata nel punto d’equilibrio,
nell’ipotesi che il sistema si
evolva da un’arbitraria condizione iniziale che cada in una
piccola sfera di raggio δ1>0
sufficientemente piccolo)
b. ∞→→∂∃∂ tpertxalloratxsechetale 0)()(0 202
Se un sistema soddisfa soltanto la prima condizione si dice
stabile nel senso di
Lyapunov o semplicemente stabile (i.s.l); in questo caso il
punto d’equilibrio si dice
marginalmente stabile.
Se un sistema soddisfa entrambe le condizioni si dice
asintoticamente stabile e con lui il
suo punto d’equilibrio.
Se un sistema non soddisfa la prima condizione si dice instabile
così come il suo punto
d’equilibrio. N.B.: ESISTONO SISTEMI NON LINEARI CHE SODDISFANO
LA SECONDA CONDIZIONE SENZA
SODDISFARE LA PRIMA.
-
13
ESEMPIO: Consideriamo il seguente sistema LTI-TC
��
���
===+=
•
)0,(),(
xgxyuxfbuaxx
determinare
(a) PUNTI D’EQUILIBRIO: −−−−−−
−=+== uabxubxauxf 0),(0
(b) SOLUZIONE:
Operiamo una traslazione di coordinate
0)(sup)()(
)()(
)()()(
0000 ≠=−=
=+==
+=−=
−
−••
−−
txponendozxtxtz
tazubaxxtz
uabtxxtxtz
Integrando si ottiene
��
�
��
�
�
==
∞=>
=<
+−==
−
∞→
∞→
∞→
−−
;)(lim0
;)(lim0
;sin0)(lim0
])([)()( 00
semplicestabilitàxtza
àinstabilittza
stabilitàtoticaatza
xxtxetxzetz
t
t
t
atat
-
14
4.2 Stabilità dei sistemi lineari tempo-invarianti
Vogliamo studiare la stabilità di un sistema LTI non forzato
d’equazioni
Supponiamo che la matrice A sia diagonalizzabile; dalle formule
di Lagrange del
sistema diagonalizzato si ricava
dove W=V-1.
Un sistema è stabile se partendo da un punto la sua evoluzione
nello stato rimane
limitata dentro una sfera; dalle precedenti relazioni si deduce
che
TDWxVkx
TCWxVetxk
t
)0()(
)0()(
Λ=
= Λ
per cui )(tx è limitato se e solo se è limitato
niTDTCe
ki
ti
,.......,2,1=λ
λ
Quindi un sistema è stabile nel senso di Lyapunov se e solo
se
TDniTCni
i
i
,....,11,....,10)Re(
=∀≤=∀≤
λλ
Per l’asintotica stabilità è necessario invece che tale
disuguaglianza sia in senso stretto
TDniTCni
i
i
,....,11,....,10)Re(
=∀<=∀<
λλ
stabileetoticamentasistema sin⇒
-
15
Osservazioni:
• Nel caso in cui un sistema ammetta autovalori immaginari (TC)
o con modulo
unitario (TD) è necessario che tali autovalori abbiano
molteplicità unitaria (siano soluzioni
semplici del polinomio caratteristico della matrice A) affinché
il sistema sia
marginalmente stabile (stabile nel senso di Lyapunov).
• Se il sistema ammette autovalori immaginari (TC) o di modulo
unitario (TD)
con molteplicità maggiore di uno, o ancora autovalori con parte
reale positiva (TC) o con
modulo maggiore di uno (TD), allora tale sistema è
instabile.
• Nel caso in cui la matrice A non sia diagonalizzabile si
ricorre alla matrice di
JORDAN (sempre tramite traslazione di coordinate) e si dimostra
che continuano a valere i
risultati di prima (vedi espressione matrice eJt a pag. 18).
-
16
4.3 Metodo diretto di Lyapunov per sistemi TC-NL-TI
Consideriamo il seguente sistema TC-NL-TI
))(( txfx =•
4.1)
che ha un punto d’equilibrio a x=0.
Consideriamo una funzione continua, scalare V(x) che è nulla
nell’origine e positiva in
un intorno sufficientemente piccolo di essa
• V(0)=0
• V(x)>0 per x≠0 e 0
-
17
Esempio: Consideriamo il sistema
)(1)(
)1()(1
)()1( 2
2
122
2
21 kx
kxkxkx
kxkx+
=++
=+
il quale ha un solo punto d’equilibrio nell’origine; scegliamo
la funzione di Lyapunov
quadratica 22
21)( xxxV +=
quindi
[ ] [ ]
[ ] [ ] 0)1)(11)](([)]([
)(1
)()(
)]([)(1
)(
)(1
)()]([)]1([)]([))](([)(
222
222
22
21
222
21
222
22
≤−+
=−+
+=
=−+
++
=−+=−=•
kxkxVkxV
kx
kxkx
kxVkx
kx
kx
kxkxVkxVkxVkxfVxV
per cui x=0 è stabile nel senso di Lyapunov.
4.5 Funzione quadratica di Lyapunov per sistemi TC-LTI
Consideriamo il sistema lineare tempo continuo
)()( tAxtx =•
4.3)
e la funzione nT xPxxxV ℜ∈=)(
dove P è una matrice simmetrica.
V(x) è una funzione definita positiva se e solo se tutti gli
autovalori di P sono positivi.
Una matrice P che soddisfa
00 ≠∀> xPxxT
si dice definita positiva (s’indica con P>0).
Una matrice P che soddisfa
00 ≠∀≥ xPxxT
è chiamata semidefinita positiva (s’indica con P≥0).
Supponiamo ora che la matrice V(x), candidata come funzione di
Lyapunov per il
sistema, sia così definita
0)( >= PPxxxV T
Allora
-
18
QxxxPAPAxPAxxPxAxxPxPxxxV TTTTTTTT −=+=+=+=•••
)()( dove la matrice Q è data da
PAPAQ T +=−
Ovviamente il punto d’equilibrio nell’origine è i.s.l. se e solo
se Q≥0 (in questo caso
V(x) è una funzione di Lyapunov) mentre è asintoticamente
stabile se e solo se Q>0.
Possiamo riassumere quanto detto affermando che possiamo trovare
una funzione di
Lyapunov quadratica per il sistema 4.3) scegliendo una matrice
simmetrica Q>0 e
provando a risolvere la seguente equazione (equazione di
Lyapunov)
PAPAQ T +=−
rispetto a P. se tal equazione ha una soluzione definita
positiva (P>0) allora il sistema
è asintoticamente stabile. Ciò è provato dal seguente
teorema.
Teorema: Dato il sistema dinamico
)()( tAxtx =•
ed una Q>0, esiste una soluzione P>0 dell’equazione di
Lyapunov
PAPAQ T +=−
se e solo se tutti gli autovalori di A sono nel semipiano
sinistro. In questo caso la
soluzione P è unica.
4.6 Funzione quadratica di Lyapunov per sistemi TD-LTI
Consideriamo il sistema
x(k+1)=Ax(k)=f(x(k)) 4.4)
Se V(x)=xTPx allora
PxxPAxAxkxVkxfVxV TTT −=−=•
)]([))](([)(
Quindi l’equazione di Lyapunov da studiare è
PPAAQ T −=−
Teorema: Dato il sistema 4.4) e una Q>0, esiste una soluzione
P>0 dell’equazione di
Lyapunov
PPAAQ T −=−
se e solo se tutti gli autovalori di A hanno modulo minore di 1.
La soluzione P in questo
caso è unica.
-
19
4.7 Metodo indiretto di Lyapunov: mediante linearizzazione
Supponiamo che il sistema
)(xfx =•
4.5)
ha un punto di equilibrio in x0=0 (eventualmente si ricorre alla
traslazione).
Supponiamo che il sistema linearizzato nell’intorno dell’origine
sia:
Axx =∂•
4.6)
dove
00=
∂∂=
xxfA
Vale il seguente teorema.
Teorema: Se il sistema 4.6) è asintoticamente stabile allora il
punto di equilibrio x0=0
è (localmente) asintoticamente stabile.
Se il sistema 4.6) è instabile (autovalori di A nel semipiano
destro) allora il punto di
equilibrio x0=0 è instabile.
Se la matrice A ha autovalori nulli o con parte reale nulla
allora il sistema linearizzato
non può comunicarmi nessun’informazione circa il comportamento
del sistema di partenza
4.5) in x0=0.
Analoghe considerazioni per i sistemi tempo discreti.
4.8 Teorema di Lyapunov per la stabilità asintotica globale
Se una funzione V(x) è l.p.d. nell’intero spazio degli stati, è
tale che
∞→∞→ xperxV )(
ed inoltre )(xV•
è l.n.d. nell’intero spazio degli stati, allora il punto di
equilibrio x0=0 è
asintoticamente globalmente stabile.
4.9 Stabilità dei sistemi LTV
La soluzione generale di un sistema LTV non forzato è del
tipo
per cui valgono le due seguenti definizioni
• Un sistema LTV non forzato è stabile nel senso di lyapunov
nell’origine se e
solo se
-
20
• Un sistema LTV non forzato è asintoticamente stabile
nell’origine se e solo se
ot∀
5 STABILITA’ INGRESSO-USCITA O ESTERNA
Affronteremo in questo capitolo l’analisi della stabilità
esterna di sistemi LTI tempo-
continui e tempo-discreti. Per stabilità esterna s’intende la
proprietà di un sistema di
mantenere un’uscita limitata quando è forzato con un ingresso
anch’esso limitato.
Per introdurre queste nozioni è necessario, dapprima, presentare
le cosiddette misure sui
segnali, con le quali è possibile ottenere quattro parametri
fondamentali:
1. Ampiezza di picco
2. Energia
3. Potenza
4. Azione
5.1 Misure sui segnali
Tenendo conto del fatto che un segnale è una variabile manifesta
che dipende dal
tempo,
TDZkTCt
n
n
ℜ→
ℜ→ℜ
:)(:)(
ϖϖ
consideriamo una successone infinita o semi-infinita (qualora
t0=0) di valori che un
segnale assume in instanti di tempo successivi
5.1)
La prima misura che possiamo fare su questa successioni di
segnali è quella
dell’ampiezza di picco.
-
21
Ampiezza di picco
L’ampiezza di picco si misura attraverso la norma a uno 1:
• Tempo discreto: Data la successione 5.1) si definisce norma a
uno il massimo
dell’ampiezza che assume il segnale
∞∞== )(sup)(maxsup kk
kiik
ϖϖϖ
• Tempo continuo: Data la successione 5.1) si definisce norma a
uno il massimo
dell’ampiezza che assume il segnale
∞∞== )(sup)(maxsup tt
tiit
ϖϖϖ
Esempio:
>∞<=
=⇒=∞
11111
)(aseasease
ak k ϖϖ
Energia
L’energia si misura attraverso la norma a 2 2; la norma a 2 è la
radice quadrata
dell’energia
• Tempo discreto:
∑∑ ==kk
T kkk 222
)()()( ϖϖϖϖ
• Tempo continuo:
∫∫ ==tt
T ttt 222
)()()( ϖϖϖϖ
Esempio:
∞≥= ∫∞
−−
adtetatet atat
21)(00)(
0
22
ϖϖ
Potenza
La potenza si definisce mediante le seguenti relazioni
• Tempo discreto:
))()(21(lim
1
)1(∑−
−−=∞→=
N
Nk
T
Nkk
NP ϖϖϖ
• Tempo continuo:
-
22
∫−
∞→=
L
L
T
Ltt
LP ))()(
21(lim ϖϖϖ
Come si può notare, la potenza non è una norma perché non
soddisfa necessariamente la
condizione
00 =⇔= xx
Un parametro molto utile, legato alla potenza, è il valore
quadratico medio dell’energia
o energia media:
ϖσρ P=
Azione del segnale
L’azione di un segnale è definita mediante la sua norma a 1
1
• Tempo discreto:
∑ ∑∑ ===k k
n
ii kk 1
11
)()( ϖϖϖ
• Tempo continuo:
∫ ∫∑∞ ∞
===
0 01
11
)()( dttdtkn
ii ϖϖϖ
Esempio di norme:
=
∞==
=
⇒≥=
∫
∫∞
∞∞
01
0
22
0)(
dtV
dtV
V
tVt
ϖ
ϖ
ϖ
ϖ222
1 2
0
2 VpVdtVL
PL
=⇒== ∫ϖ
Relazioni fra le norme
Per un sistema tempo-discreto vale la seguente relazione tra le
norme
∞
-
23
Bisogna stare attenti inoltre al fatto che se un segnale è a
potenza finita non
necessariamente deve estinguersi nel tempo (si pensi al segnale
sinusoidale), a differenza
di quanto accade per un segnale ad energia limitata.
5.2 Sistemi BIBO-stabili e Lp-stabili
Consideriamo un sistema
u H y
nel quale l’uscita y è legata all’ingresso u attraverso un
operatore generico (anche non
lineare); un sistema di questo tipo si dice lp-stabile o
p-stabile (con ∞= ,2,1p ) se esiste
una costante finita ℜ∈C tale che
ppuCy ≤ 5.2)
Se questa condizione è verificata per ∞=p allora il sistema si
dice BIBO-stabile
(Bounded Input Buonded Output ossia Ingresso Limitato Uscita
Limitata).
Vediamo adesso di determinare delle condizioni attraverso le
quali è possibile stabilire
se un sistema LTI è Bibo-stabile (stabile esternamente) o
Lp-stabile.
Teorema: Consideriamo un sistema LTI-TC con m ingressi e p
uscite e matrice delle
risposte impulsive )]([)( 1 sHLtH −= ; tale sistema è BIBO
stabile se e solo se
∞
-
24
che soddisfa la 5.2) e quindi il sistema è BIBO stabile.
Nel caso SISO inoltre vale pure il seguente teorema
stabileLpèsistemailuHyueHseppp
⇒∞
-
25
6. PROPRIETA’ STRUTTURALI
In questo capitolo analizzeremo in dettaglio gli effetti che
l’ingresso di un sistema LTI
può avere sullo stato; in pratica introdurremo le cosiddette
proprietà strutturali
(raggiungibilità, controllabilità e osservabilità) di un sistema
LTI.
Inizieremo la nostra discussione analizzando la proprietà di
raggiungibilità per i sistemi
LTI-TD perché il caso tempo continuo è più difficile da trattare
per cui ci limiteremo ad
estrarre delle considerazioni dall’analisi sui sistemi TD.
6.1 Raggiungibilità per sistemi LTI-TD
Consideriamo un sistema LTI-TD
Ci chiediamo se è possibile scegliere una sequenza di
ingressi
in modo da portare il sistema dallo stato iniziale ( ) 00 =x
allo stato obiettivo ( ) xkx ~= ;
in pratica vogliamo che ad un certo passo k lo stato raggiunga
il valore prefissato x~ .
Se è possibile trovare tale sequenza di ingresso allora lo stato
x~ si dice raggiungibile
in k passi; ovviamente non sempre è possibile trovare tale
sequenza per cui non sempre
uno stato è raggiungibile.
Vediamo di determinare delle condizioni che ci permettano di
stabilire quando uno stato
del sistema è raggiungibile o meno.
Se guardiamo la formula di lagrange per un sistema LTI-TD
ponendo ( ) 00 =x e ( ) xkx ~= si ottiene
kkURx =~ 6.1)
-
26
Otteniamo un sistema lineare di n equazioni in k incognite che
ammette soluzione se e
solo se nk ≤ e la matrice Rk è invertibile; in tal caso la
soluzione è data da
xRU kk ~1−=
e tale soluzione diventa unica se k=n.
Chiamiamo con
rkkk XRRangeRRa ===ℜ )()(
lo spazio generato dai vettori colonna della matrice di
raggiungibilità Rk; tale
sottospazio lineare prende il nome di sottospazio raggiungibile
in k passi perché è formato
da tutti e soli gli stati del sistema che sono raggiungibili in
k passi e quindi ottenuti dalla
6.1) al variare della sequenza di ingresso Uk.
Si dimostra che vale il seguente teorema
Teorema: Per lnk ≤≤
)()()( lnk RRaRRaRRa =⊆ 6.2)
con n=dim(A)=dim(x).
Infatti dal teorema di Caylei-Hamilton si sa che
[ ]BABBABABABARmatricenellaquindi
nlAAAA
nnlll
n
i
ii
ln
i
ii
n
2121
1
1
0
−−−−
=
−
=
=
≥=⇒= ∑∑ γα
le prime l-n colonne sono generate dalle restanti n e quindi
)()( ln RRaRRa =
ossia più in generale la 6.2).
Questo risultato permette di eliminare la dipendenza tra la
raggiungibilità di uno stato
ed il numero di passi necessari per ottenerla visto che ogni
stato raggiungibile in al più K
passi lo è anche in un numero di passi almeno pari a n.
Il sottospazio )( nn RRa=ℜ si dice sottospazio raggiungibile in
al più n passi o, per
quanto detto prima, semplicemente sottospazio raggiungibile.
Nel caso in cui sia soddisfatta la seguente condizione
nRRaXRRa nn =⇒= )](dim[)( 6.3)
-
27
il sottospazio Ra(Rn) coincide con l’intero spazio degli stati,
il che significa che tutti gli
stati del sistema sono raggiungibili; in tal caso è il sistema
stesso che si dice raggiungibile
o completamente raggiungibile.
In un sistema SISO la matrice di raggiungibilità Rn è quadra di
ordine n per cui la 6.3) è
verificata se e solo se
0)det()( ≠⇒= nn RnRrango 6.4)
In un sistema MIMO, invece, la completa raggiungibilità di un
sistema non può essere
testata mediante la non singolarità della matrice Rn in quanto
questa non è quadra, ma
rettangolare e di ordine nmn× ; allora è più corretto dire che,
indipendentemente
dall’ordine della matrice di raggiungibilità, un sistema è
completamente raggiungibile se e
solo se la matrice Rn ha rango massimo, il che si verifica
quando
0)det( ≠nTn RR . 6.5)
Se la matrice di raggiungibilità ha rango minore di n allora non
tutti gli stati sono
raggiungibili ed il sistema si dice non completamente
raggiungibile.
Supponiamo, ora, che il sistema LTI-TD sia completamente
raggiungibile; ci
chiediamo: assegnato uno stato x~ qual’è la sequenza nU che ci
permette di raggiungerlo?
Distinguiamo i seguenti casi:
• xR
nu
uou
URnRrangoRtu nnnnnn
n~
)1(
)1()(
0)det()(1)](dim[ 1−× =
−
=⇒≠⇒=⇒ℜ∈⇒=
•
2min
~)(0)det()(
~~1)](dim[
1
anormalaimizzachesoluzionelaèUxRRRURRnmassimoRrangose
URRxRURxRmtu
n
Tnn
Tnnn
Tnn
nnTn
Tnnn
nmnn
∗
−∗
×
=⇒≠⇒==
=⇒=
ℜ∈⇒>=
Consideriamo ora il caso in cui si voglia raggiungere un
generico stato d non a partire
dallo stato zero, ma a partire da un arbitrario stato iniziale
S; dalla formula di lagrange si
deduce che la sequenza d’ingresso che ci risolve questo problema
è soluzione del seguente
sistema
-
28
kkk URSAd =−
Se d e S sono stati arbitrari, indipendentemente dalle
caratteristiche della matrice A, la
quantità a primo membro la si può considerare come un nuovo
generico stato x~ da
raggiungere a partire dallo stato zero; ciò significa che il
concetto di raggiungibilità dallo
stato zero è più generale del concetto di raggiungibilità a
partire da uno stato S non nullo,
per cui diciamo che se uno stato x~ è raggiungibile dallo stato
zero, allora è anche
raggiungibile da qualsiasi stato S non nullo e viceversa.
Gramiano di raggiungibilità: Si definisce Gramiano di
Raggiungibilità la matrice
∑−
===
1
0)(
k
i
iTTiTkkk ABBARRρ
e si dimostra che
• kρ è simmetrica: Tkk ρρ =
• kρ è semidefinita positiva: 0≥kρ
Teorema: Lo spazio immagine della matrice kρ è uguale allo
spazio immagine della
matrice di raggiungibilità:
kkk R ℜ== )Im()Im(ρ
per cui
nlperRR nnll ≥ℜ=== )Im()Im()Im(ρ
quindi un sistema LTI-TD è raggiungibile se e solo se
0)det()( ≠⇒= nn nrango ρρ
Quest’ultima relazione può essere usata in sostituzione della
6.5) quando si ha a che fare
con sistemi MIMO, per i quali la 6.4) non può essere
applicata.
Teorema: Il sottospazio di raggiungibilità è A-invariante:
rrrr XAXXAxXxse ⊆⇒∈⇒∈
dim:
[ ]BABBABARrangeX nnnr 21Im)( −−== quindi un vettore x di Xr è
combinazione lineare delle colonne di Rn; pre-moltiplicando x
con la matrice A si ottiene un vettore che è combinazione
lineare delle colonne di
[ ]BABBABA nn 1−
-
29
ma per Cailey-Hamilton la prima colonna è combinazione lineare
delle precedenti per
cui
[ ]BABBABAAx nnr 21Im −−∈
6.2 Decomposizione standard per sistemi non completamente
raggiungibili
(Decomposizione di Kalman di raggiungibilità)
Consideriamo un sistema LTI-TD non completamente raggiungibile e
supponiamo di
voler evidenziare e separare la parte irraggiungibile da quella
raggiungibile (se esiste).
Ciò può essere ottenuto mediante una trasformazione per
similitudine ottenuta con un
cambiamento di coordinate che fa uso di un’opportuna matrice di
trasformazione T.
Questa matrice di trasformazione deve essere tale da farci
ottenere una rappresentazione
equivalente del tipo
ℜ∈ℜ∈
= −rn
r
zz
conkzkz
z2
1
2
1
)()(
mrrnrnrnrrr BAAA
kuB
kzkz
AAA
kzkz
×−×−−×× ℜ∈ℜ∈ℜ∈ℜ∈
+
=
++
1)()(
2)(
121
1
2
1
2
121
2
1 )(0)(
)(0)1(
)1(
6.6)
dove le z1 sono le componenti del vettore di stato sulle quali
si ha un’azione diretta
dell’ingresso e pertanto sono le componenti modificabili per
raggiungere o controllare uno
stato; le componenti z2 sono, invece, quelle non modificabili né
tramite l’ingresso né
tramite le altre componenti z1.
Quindi il sistema
)()()()1( 1212111 kuBkzAkzAkz ++=+
rappresenta il sottosistema raggiungibile del sistema dato e gli
autovalori di A1 si dicono
autovalori raggiungibili.
Il sottosistema non raggiungibile è, invece, il seguente
)()1( 222 kzAkz =+
è gli autovalori di A2 si dicono autovalori irraggiungibili.
Vediamo adesso come è composta la matrice T che mi permette di
ottenere una simile
decomposizione; se il sistema non è completamente raggiungibile
significa che
nrXnrRRa rn
-
30
Queste colonne saranno le prime r colonne della matrice T; le
restanti n-r colonne
saranno composte da vettori linearmente indipendenti tra di loro
e con le prime r colonne
di T.
ATTTTAATATATTAxTzTzx
][][ 21211
1
=⇒=⇒==⇒=
−
−
T1 è la base dello spazio di raggiungibilità per cui
AT1appartiene ancora a tale spazio e
quindi, visto che lo spazio Xr ha dimensione r, sarà del
tipo
=
01
1
AAT
Il seguente schema a blocchi è una rappresentazione grafica
della decomposizione di
Kalman di raggiungibilità o controllabilità
u z1(k+1) z1(k)
B1 Delay
A1
A12 z2(k)
Delay
A2
Da notare come le componenti z1 non abbiano influenza alcuna
sulle z2 le quali
risultano, quindi, irraggiungibili.
6.3 Test modali di raggiungibilità
Quando si ha a che fare con sistemi non completamente
raggiungibili di dimensioni
elevate, applicare la decomposizione standard di Kalman può
risultare molto laborioso; in
questi casi si possono distinguere gli autovalori raggiungibili
e non raggiungibili, mediante
i cosiddetti test modali di raggiungibilità.
-
31
Teorema 1: Un sistema LTI-TD è non raggiungibile se e solo se
esiste qualche
autovettore sinistro della matrice A
0)(: '' =− AIλϖϖ che è ortogonale a B:
0' =Bϖ L’autovalore corrispondente a tale autovettore è
irraggiungibile.
Dim:
• Supponiamo che esista un autovettore sinistro di A ortogonale
a B
000)(: '''' ≠==− ϖϖλϖϖ conBeAI Dalle precedenti relazioni si
ottiene
[ ] 0000
'21'
'''''
=⇒=⇒≥=⇒=⇒=
−−n
kk
k
RBABBABAkBABABA
ϖϖϖλϖϖλϖϖ
e cioè che il rango della matrice Rn non è n ma è minore, per
cui il sistema non è
completamente raggiungibile.
• Supponiamo, ora, che il sistema non sia completamente
raggiungibile ossia che
nRrangonRRa nn
-
32
N.B.: Nel caso in cui una matrice M non è quadrata, per vedere
se perde di rango si può
calcolare il determinante di (MTM) e verificare se si annulla;
se il determinante si annulla
allora la matrice M non ha rango massimo.
6.4 Raggiungibilità per sistemi TC
Uno stato x~ di un sistema TC si dice raggiungibile (a partire
dallo stato zero)
all’istante L 0≥ se esiste un ingresso u definito in [0.L] tale
che
xLx f ~)( =
Un sistema TC in cui tutti gli stati sono raggiungibili si dice
sistema completamente
raggiungibile.
Vediamo, dalle formule di Lagrange, come è fatta la risposta
forzata
∫−=
ttA
f dBuetx0
)( )()( τττ
e definiamo il seguente integrale
∫ >===+==< )(),( ττρ
Si dimostra che
• simmetricaèLρ
• 0≥Lρ
-
33
Teorema: Lo spazio di raggiungibilità è dato da
∫==L
TLr dFFRaRaX
0
)()([)( τττρ ]
Teorema: Il range del gramiano di raggiungibilità coincide con
il range della matrice
di raggiungibilità Rn anche per i sistemi TC
][)( 21 BABBABARaRa nnL−−=ρ
per cui un sistema TC è completamente raggiungibile se e solo
se
nRrango n =)(
N.B.: è conveniente usare la matrice Rn per studiare la
raggiungibilità di un sistema
LTI-TC in quanto questa matrice è indipendente dall’istante
considerato.
Inoltre anche per i sistemi TC ogni stato che è raggiungibile
dallo stato zero, lo è anche
da qualsiasi stato diversa da zero.
6.5 Controllabilità per sistemi LTI-TD
Vogliamo, in questo paragrafo, affrontare il problema della
controllabilità allo stato zero
di un generico stato di un sistema LTI-TD; in pratica, dato uno
stato iniziale x~ ci
proponiamo di determinare, se esiste, una successione di k
valori del segnale di ingresso in
grado di annullare lo stato del sistema.
Se questa successione di k valori esiste allora lo stato x~ si
dice controllabile in k passi.
In pratica dalle formule di lagrange si deduce che uno stato x~
è controllabile in k passi
se e solo se esiste una successione di k valori
dell’ingresso
tale da soddisfare la seguente relazione
kkk
kkk URxAURxAkx =−⇒+== ~~0)(
Nel caso di sistemi TD completamente controllabili, l’esistenza
di tale successione
dipende molto dalle caratteristiche del sistema ed in
particolare della matrice A; infatti si
possono distinguere due casi:
1) Se la matrice A è invertibile, la soluzione di
controllabilità coincide con quella di
raggiungibilità; in questo caso infatti ad ogni stato
raggiungibile mi corrisponde uno ed
uno solo stato controllabile mediante la relazione
-
34
rk
kkk
c xAURAx ~~−− −=−=
in pratica cx~ è combinazione lineare delle colonne l.i. di A-k
con coefficienti gli
elementi di rx~
2) Se la matrice A non è invertibile la soluzione di
controllabilità coincide con quella
di raggiungibilità se e solo se è soddisfatta la seguente
condizione
)()( nn RRaARa ⊂
Nei sistemi TD, un sistema raggoungibile e’ sempre anche
controllabile, ma puo’
esistere un sistema non completamente raggiungibile che e’
controllabile.
Nei sistemi TC, invece, controllabilità e raggiungibilità
coincidono sempre.
6.6 Osservabilità per i sistemi LTI-TD
Supponiamo di avere un sistema lineare tempo-discreto del quale
conosciamo una
sequenza di k valori dell’ingresso applicati in istanti
successivi e la corrispondente
sequenza dei valori dell’uscita.
Ci chiediamo: è possibile, note le informazioni sull’ingresso e
sull’uscita, determinare
lo stato iniziale del sistema?
Tale problema è conosciuto come problema dell’osservabilità di
uno stato del sistema.
Definizione: Uno stato q di un sistema dinamico è detto non
osservabile nell’intervallo
[0,T) se, con x(0)=q e ),0[)( Ttx ∈∀ , si ottiene la stessa
uscita y(t) che si otterrebbe a
partire da x(0)=0.
Si parla di sistema completamente non osservabile, o
semplicemente non osservabile, se
tutti gli stati sono non osservabili. In tal caso non è
possibile determinare univocamente la
condizione iniziale x(0) note le informazioni sugli ingressi e
sulle uscite.
Vediamo di determinare una condizione che ci permetta di
stabilire quando un sistema è
osservabile.
Consideriamo un sistema LTI-TD di equazioni
)()()()()()1(
kDukCxkykBukAxkx
+=+=+
dalle formule di Lagrange si ricava
-
35
)()0()()()(
)0()()0()(1
0
1
kDuUCRxCAkDukCxky
URxAlBuAxAkx
kkk
k
lkk
klkk
++=+=
+=+= ∑−
=
−−
Dall’equazione che descrive l’evoluzione dell’uscita del sistema
notiamo che oltre
l’uscita, che è nota, figura l’ingresso u(k), anch’esso noto, e
la nostra incognita
rappresentata dallo stato x(0) (composto da n componenti se la
rappresentazione è di ordine
n); quindi lo stato iniziale potrebbe essere valutato come
soluzione di un sistema lineare di
n equazioni in n incognite ottenuto dall’espressione di y(k)
considerata in n istanti di tempo
successivi, in corrispondenza dei quali si conoscono i valori
dell’ingresso e dell’uscita del
sistema (in pratica supponiamo di osservare l’uscita del sistema
man mano che
applichiamo la successione di n valori in ingresso e per ogni
instante di tempo ci scriviamo
l’equazione dell’evoluzione dell’uscita con al posto di y(k) e
x(k) i valori assunti all’istante
k considerato). Tale sistema è dato da
kkk
k
DUUCRkykydove
nkxCAky
−−=
−==
)()(~
1,...,1,0)0()(~
e può essere scritto in forma compatta nel seguente modo
)0()0(~
1
2 xx
CA
CACAC
Y n
n
k θ=
=
−
6.7).
L’incognita x(k) è univocamente determinata se e solo se la
matrice nθ , che prende il
nome di matrice di osservabilità del sistema, ha rango massimo
ossia
nrango n =)(θ
per cui possiamo concludere che un sistema LTI-TD di ordine n è
completamente
osservabile se e solo se la matrice di osservabilità nθ è tale
che
• SISOcason 0)det( ≠θ
• MIMOcasonTn 0)det( ≠θθ
Si osservi come la 6.7) assomigli a quella che è la risposta
libera nell’uscita del sistema,
per cui l’osservabilità di uno stato iniziale x(0) può essere
verificata anche nell’ipotesi
semplificativa che il sistema non sia forzato (ingresso nullo);
in tal caso
)()(~ kyky =
-
36
Valgono i seguenti teoremi:
Teorema 1: Il sistema è completamente osservabile se e solo se
il nucleo( nθ )={0}.
Dim: Se il nucleo( nθ )=Kerr( nθ )≠{0} allora tutti gli stati
appartenenti a tale nucleo
sarebbero non osservabili, in quanto
0)( =⇔∈ xnucleox nn θθ
Quindi il sottospazio di non osservabilità coincide con lo
spazio nullo della matrice di
osservabilità e si indica con oX .
Teorema 2: Lo spazio nullo di ( nθ ) è uguale allo spazio nullo
di ( 1+nθ ), cioè
)()( 1+= nn NN θθ ; inoltre nkNN nk ≤⊆ )()( θθ .
Dim: Dal teorema di Cailey-Hamilton
∑∑−
=+
−
+
−
=
≥==
=⇒=⇒=1
01
1
2
1
1
0)()()(
n
ilnn
n
n
ni
in
n
i
ii
n nlperNNNallora
CACA
CACAC
seCACAAA θθθθαα
Ciò significa che, qualunque sia l'istante di tempo considerato
purché questo non risulti
inferiore a n, lo spazio degli stati non osservabili e lo
stesso.
N.B.: Non è possibile osservare uno stato a partire da una
sequenza d’ingresso e di
uscita di lunghezza inferiore alla dimensione del sistema in
quanto il numero di equazioni
del sistema 6.7) sarebbe inferiore al numero delle incognite per
cui lo stesso sistema non
ammetterebbe soluzione.
Teorema 3: Un sistema è osservabile in l passi (l≥n) se e solo
se è osservabile in n
passi.
6.7 Decomposizione standard per sistemi non osservabili
(Decomposizione di Kalman di
osservabilità)
Consideriamo un sistema LTI-TD non completamente osservabile e
supponiamo di
voler evidenziare e separare la parte non osservabile da quella
osservabile (se esiste).
Ciò può essere ottenuto mediante una trasformazione per
similitudine ottenuta con un
cambiamento di coordinate che fa uso di una opportuna matrice di
trasformazione T.
Questa matrice di trasformazione deve essere tale da farci
ottenere una rappresentazione
equivalente del tipo
-
37
ℜ∈ℜ∈
= −on
o
zz
conkzkz
z2
1
2
1
)()(
[ ]moonononooo BAAA
kDukzkz
Cky
kBukzkz
AAA
kzkz
×−×−−×× ℜ∈ℜ∈ℜ∈ℜ∈
+
=
+
=
++
1)()(
2)(
121
2
11
2
1
221
1
2
1
)()()(
0)(
)()()(0
)1()1(
6.8)
dove le z1 sono le componenti del vettore di stato che ci
ritroviamo in uscita e pertanto
sono le componenti osservabili attraverso y(k); in pratica sono
le prime “no” componenti
del vettore di stato dove “no” è la dimensione del sottospazio
osservabile; le componenti
z2 sono, invece, quelle non osservabili né attraverso l’uscita
né attraverso le z1.
Quindi il sistema
)()()()()()1(
11
1111
kDukzCkykuBkzAkz
+=+=+
rappresenta il sottosistema osservabile del sistema dato e gli
autovalori di A1 si dicono
autovalori osservabili.
Il sottosistema non osservabile è, invece, il seguente
)()()()1( 2221212 kuBkzAkzAkz ++=+
è gli autovalori di A2 si dicono autovalori non osservabili.
Vediamo adesso come è composta la matrice T che mi permette di
ottenere una simile
decomposizione; se il sistema non è completamente osservabile
significa che
nnXnnrango ooon
-
38
ATTTTAATATATTAxTzTzx
][][ 21211
1
=⇒=⇒==⇒=
−
−
Il seguente schema a blocchi è una rappresentazione grafica
della decomposizione di
Kalman di osservabilità
u(k) z1(k+1) z1(k) y(k)
B1 Delay C1
A1
A21
z2(k+1) z2(k)
B2 Delay
A2
Da notare come le componenti z2 non abbiano legame alcuno con
l’uscita e quindi sono
non osservabili.
In molti casi si può avere a che fare con sistemi che sono
contemporaneamente non
osservabili e non raggiungibili; in questi casi per determinare
la parte osservabile e/o
raggiungibile del sistema, si può procedere in due modi
• Studiare separatamente la raggiungibilità e l’osservabilità
mediante le rispettive
decomposizioni
• Fare un’unica decomposizione mediante un’opportuna matrice
T
In pratica si può procedere prima con una decomposizione in
forma standard di
raggiungibilità sulla quale si effettua, dopo, un’ulteriore
decomposizione standard
d’osservabilità; oppure si opera un’unica opportuna
trasformazione di coordinate che mi
permetta di ottenere una rappresentazione del tipo
-
39
[ ] )(
)()()()(
00)(
)(
00
)()()()(
00000
00
)1()1()1()1(
4
3
2
1
31
2
1
4
3
2
1
4443
33
24232221
1311
4
3
2
1
kDu
kzkzkzkz
CCky
kuBB
kzkzkzkz
AAA
AAAAAA
kzkzkzkz
+
=
+
=
++++
dove le
• z1(k) sono le componenti raggiungibili ed osservabili
• z2(k) sono le componenti raggiungibili e non osservabili
• z3(k) sono le componenti non raggiungibili ed osservabili
• z4(k) sono le componenti non raggiungibili e non
osservabili
Pertanto, gli autovalori di
• A11 sono raggiungibili e osservabili
• A22 sono raggiungibili e non osservabili
• A33 sono non raggiungibili e osservabili
• A44 sono non raggiungibili e non osservabili
Se supponiamo che
{ } { } { } 0dim0)()( 0
≠∩⇒≠∩==
oror
nrn
XXXXnrangoenRrango θ
allora la matrice che ci permette di ottenere tale
rappresentazione è del tipo
[ ]
{ }{ }
{ }{ } esisteseXXersezionespaziodellobaseindiplinvettori
esisteseXXersezionespaziodellobasevv
esisteseXXersezionespaziodellobasevv
esisteseXXersezionespaziodellobasevvdove
vvindiplinvettorivvvvTxTzTzx
or
ori
ornkn
orri
nknrii
∩=
∩=
∩=
∩=
==⇒=
−
+
−+
−
int..
int
int
int
..
1
1
11
1
Il seguente schema a blocchi è una rappresentazione grafica
della decomposizione di
Kalman di raggiungibilità e osservabilità
-
40
u(k) ∑ro y(k)
∑ or
∑ or
∑ or
6.8 Test modali d’osservabilità
Quando si ha a che fare con sistemi non completamente
osservabili di dimensioni
elevate, applicare la decomposizione standard di Kalman può
risultare molto laborioso; in
questi casi si possono distinguere gli autovalori osservabili e
non osservabili, mediante i
cosiddetti test modali d’osservabilità.
Teorema 1: Un sistema LTI-TD è non osservabile se e solo se
esiste qualche
autovettore destro della matrice A
0)(: '' =− ϖλϖ AI che è ortogonale a C:
0' =Cϖ L’autovalore corrispondente a tale autovettore è non
osservabile.
Teorema 2: Un sistema è irraggiungibile se e solo se la
matrice
−C
AzI
perde di rango per qualche autovalore della matrice A; tali
autovalori sono quelli
irraggiungibili.
-
41
6.9 Teorema della dualità di Kalman
Dato un sistema LTI, supponiamo di avere una rappresentazione
nello spazio degli stati
descritta da
{ }∑= DCBA ,,, Si definisce rappresentazione duale la
seguente
{ }
,,,,
,,,TTTT DDBCCBAAdove
DCBA
====
=∗∗∗∗
∗ ∗∗∗∗∑
Kalman ha dimostrato che
• ( ) ∑∑ =∗∗ e cioè il duale del sistema duale è il sistema
stesso • Tnn
Tnn ReR ==
∗∗ θθ , perciò se si vuole studiare la raggiungibilità
(osservabilità) di un sistema basta studiare l’osservabilità
(raggiungibilità) del suo duale.
6.10 Forme canoniche di controllabilità e d’osservabilità
Forma canonica di raggiungibilità e controllabilità
Supponiamo di avere un sistema LTI, completamente raggiungibile,
descritto da
un’equazione differenziale del tipo
Si chiama forma canonica di raggiungibilità una rappresentazione
nello spazio degli
stati del tipo
Tale forma canonica, che prende anche il nome di 1° forma
canonica di raggiungibilità,
si può ottenere da una generica rappresentazione mediante una
trasformazione di
coordinate del tipo
)()()()()()( 111 tTztzRRtxtxRRtz nnnn ==⇒=−−−
-
42
dove Rn è la matrice di raggiungibilità del sistema.
Esiste una 2° forma canonica di raggiungibilità dove la matrice
A è del tipo
Forma canonica di osservabilità
Supponiamo di avere un sistema LTI, completamente osservabile,
descritto da
un’equazione differenziale del tipo
Si chiama forma canonica di osservabilità una rappresentazione
nello spazio degli stati
del tipo
Tale forma canonica si può ottenere da una generica
rappresentazione mediante una
trasformazione di coordinate del tipo
)()()()()()( 111 tTztztxtxtz nnnn ==⇒=−−− θθθθ
dove nθ è la matrice di osservabilità del sistema.
N.B.: Le forma canoniche si ottengono immediatamente dalle
rappresentazioni ingresso
uscita di un sistema LTI; ciò suggerisce un altro metodo per
ottenere una rappresentazione
i/u di un sistema a partire da una sua rappresentazione
i/s/u.
6.11 Minimalità dei sistemi LTI
Definizione: Un rappresentazione di un sistema LTI si dice in
forma minima quando
non è possibile ottenere una nuova rappresentazione che utilizza
un numero minore di
variabili di stato.
-
43
Teorema 1: Condizione necessaria e sufficiente affinché un
sistema sia in forma
minima è che il sistema sia completamente osservabile e
completamente raggiungibile.
Teorema 2: La matrice di trasferimento, e di conseguenza la
matrice delle risposte
impulsive, di un sistema LTI dipendono solo dalla sua parte
completamente osservabile e
completamente raggiungibile.
)()()()()()()()(
111111
111
1111
11111
kDBACkhDBAzICsHtDBeCthDBAsICsH
k
tA
∂+=⇒+−=
∂+=⇒+−=−
−
Teorema 3: Un sistema non è completamente osservabile e/o
completamente
raggiungibile se e solo se nella sua f.d.t. sono presenti
cancellazioni tra binomi comuni a
numeratore e a denominatore.
Da questi teoremi si possono trarre alcune importanti
considerazioni:
• I poli della f.d.t. di un sistema coincidono con gli
autovalori della parte
completamente osservabile e completamente raggiungibile, salvo
cancellazioni.
Ciò significa che gli autovalori non raggiungibili e/o non
osservabili non compaiono,
come poli, nella f.d.t. del sistema per cui non sono visibili
esternamente; gli unici
autovalori a comparire come poli nella f.d.t. del sistema sono
quelli completamente
osservabili e completamente raggiungibili.
• Se un sistema è solo non raggiungibile tutto gli autovalori
che si cancellano sono
non raggiungibili.
• Se un sistema è solo non osservabile tutto gli autovalori che
si cancellano sono
non osservabili.
• Se un sistema non ha almeno un autovalore osservabile e
raggiungibile la sua
f.d.t è nulla.
• Se il sistema è non osservabile e non raggiungibile non
possiamo dire nulla sugli
autovalori che si cancellano
• Un sistema asintoticamente stabile è anche BIBO stabile,
mentre, un sistema
BIBO stabile è anche asintoticamente stabile se e solo esso è in
forma minima.
Infatti, se il sistema non è in forma minima ci sono degli
autovalori di A che non
figurano esternamente; se questi autovalori sono gli unici
autovalori instabili, il sistema
risulta BIBO stabile, ma non asintoticamente stabile perché ci
sono delle comportamenti
interni indesiderati (divergenza delle componenti dello stato
del sistema che non sono
osservabili dall’uscita).
-
44
• La stabilità marginale non è in grado di garantirmi la BIBO
stabilità, tuttavia,
un sistema marginalmente stabile in cui gli autovalori nulli o
con modulo unitario sono
irraggiungibili o non osservabili è BIBO stabile
7 STABILIZZAZIONE TRAMITE RETROAZIONE DELLO STATO
Consideriamo un sistema LTI strettamente proprio (D=0) del quale
conosciamo lo stato
iniziale x(0) e supponiamo che in ingresso e in uscita non
agisca alcun disturbo; la
descrizione nello spazio degli stati del nostro sistema è la
seguente
)()()( tButAxtx +=•
Supponiamo che la matrice A ammetta autovalori instabili, per
cui il nostro sistema
presenta comportamenti interni e/o esterni indesiderati; ci
proponiamo di stabilizzare il
nostro sistema, cioè di ottenere, dal sistema di partenza, un
sistema che abbia un
comportamento ingresso-uscita equivalente ma con autovalori
stabili.
Ciò può essere ottenuto mediante un’opportuna retroazione dello
stato del tipo
evidenziato in figura
v(t) u(t) ∑ x(t) C y(t)
F
In questo caso l’ingresso u(t) del nostro sistema sarà dato da
nmFtvtFxtu ×ℜ∈+= )()()( Legge di controllo
Per cui la rappresentazione del sistema controllato sarà la
seguente
)()()()()()()(
tCxytBvtxAtBvtxBFAtx CL
=+=++=
•
Per stabilizzare il sistema, allora, basta scegliere
opportunamente la matrice F in modo
che gli autovalori della matrice ACL siano quelli
desiderati.
Domanda: E’ sempre possibile stabilizzare un sistema instabile,
ossia è sempre
possibile determinare una matrice di retroazione F che sia in
grado di posizionarmi gli
autovalori di A nel semipiano sinistro del piano complesso (TC)
o all’interno del cerchio
-
45
unitario (TD)? E’ sempre possibile scegliere arbitrariamente una
matrice di retroazione F
in modo che gli autovalori della matrice A+BF siano assegnati ad
arbitrio?
Risposta: No, salvo che non sia verificata una delle due
condizioni
• Il sistema sia completamente raggiungibile
• Eventuali autovalori irraggiungibili siano asintoticamente
stabili.
Per dimostrare quanto detto enunciamo il seguente teorema:
Teorema: Esiste una matrice F tale che
7.1)
per ogni possibile insieme di numeri complessi-coniugati o
reali, se e solo se la coppia
(A,B) è completamente raggiungibile.
Dim. necessaria: Supponiamo che la coppia (A,B) non sia
completamente
raggiungibile; ciò significa che esiste un autovettore sinistro
di A, ωi’, ortogonale a B:
iiiiii
iiii
ABFABFABA
ϖλϖϖϖϖϖϖλϖ
==+=+⇒==
)(0
In pratica ogni autovalore irraggiungibile di A è autovalore
irraggiungibile per (A+BF),
il che significa che gli autovalori irraggiungibili di A non
possono essere posizionati ad
arbitrio; quindi, nell’ipotesi che il sistema sia
irraggiungibile, esso è stabilizzabile se e
solo se gli autovalori irraggiungibili sono asintoticamente
stabili.
Studiare la stabilizabilità di un sistema significa, quindi,
determinare eventuali
autovalori irraggiungibili e vedere se sono stabili o meno.
Dim. sufficiente: Supponiamo che la coppia (A,B) sia
raggiungibile e vediamo se
riusciamo a trovare una matrice F che soddisfa la 7.1).
Se il sistema è completamente raggiungibile allora esiste una
matrice di trasformazione 1~ −= nn RRT
che riporta il sistema in forma canonica di raggiungibilità
-
46
[ ]110
110 10
00
10000
0100010
~−
−
=
=
−−−
= n
n
cccCB
aaa
A
dove i termini 10 ,......, −naa sono i coefficienti del
polinomio caratteristico della matrice
di partenza
011
1 .......)det()( aaaAIPn
nn ++++=−= −− λλλλλ 7.2)
Supponiamo di applicare questa trasformazione di coordinate e
successivamente di
retrazionare lo stato tramite una matrice
[ ]nfffF ~~~~ 21= La matrice ACL del sistema controllato
sarà
+−+−+−
=+=
− nn
CL
fafafa
FBAA
~~~1000
00100010
)~~~(
12110
e, dato che il polinomio caratteristico è invariante rispetto ad
una trasformazione per
similitudine, vogliamo che gli autovalori di tale matrice
coincidano con gli autovalori
desiderati nidi ,.....,2,1=µ .
In pratica dobbiamo determinare la matrice F~ che soddisfa la
condizione
)(.......
)()~()~(.......)~()]~~~(det[
011
1
11021
11
λλλλ
µλλλλλ
dddnd
nn
n
i
di
nnn
n
Paaa
fafafaFBAI
=++++=
=−=−+−++−+=+−
−−
=
−− ∏
dalla quale si ricava
−=
−=−=
−−−
−−
d
dnnn
dnnn
aaf
aafaaf
001
221
11
~
~~
La matrice di retroazione F che soddisfa la 7.1) può allora
essere determinata
riportandoci alle vecchie coordinate come mostrato di seguito:
111 ~)()(~)()(~)()()( −−− =⇒+=+=⇒= TFFtvtxTFtvtzFtutxTtz .
-
47
Riassumendo: Un sistema LTI è stabilizzabile se e solo se
• è completamente raggiungibile
• eventuali autovalori irraggiungibili sono asintoticamente
stabili
La stabilizzazione è ottenuta mediante una retroazione dello
stato che fa uso di una
matrice di retroazione F calcolabile nei tre modi mostrati di
seguito:
• imponendo la condizione
[ ]n
n
i
did
fffFdove
PBFAI
21
1
)()()](det[
=
−==+− ∏=
µλλλ
autovalori desiderati (stabili)
Otteniamo, in questo modo, un sistema di n equazioni in n
incognite che sono gli
elementi della matrice F.
tale metodo è applicabile sia a sistemi completamente
raggiungibili sia non
completamente raggiungibili.
• Mediante la formula di ACKERMAN:
necon
APReF dnT
=
−= −
0
01
)(
1
11
• Se il sistema non è completamente raggiungibile si decompone
nella forma
standard di raggiungibilità di Kalman; quindi una volta
determinato il sottosistema
raggiungibile si determina, per esso, una matrice di retroazione
Fr con uno dei due metodi
sopra mostrati, oppure con il metodo costruttivo della
dimostrazione. Una volta
determinata la matrice Fr la si completa con n-r colonne nulle
in modo da ottenere la
matrice F.
( ) ( )[ ]0mindet
ˆ,ˆ,ˆˆ,ˆ,ˆtan)(
rr
rrr
n
FFFazioneerCBAileraggiungibmasottosisteCBA
ilitàraggiungibdardsionedecomposizrRrango
=⇒⇒⇒
⇒⇒=
-
48
8 CONTROLLORI BASATI SUL MODELLO
Nel precedente paragrafo abbiamo visto come è possibile
stabilizzare un sistema
mediante una retroazione dello stato, nell’ipotesi che esso sia
completamente accessibile e
quindi noto.
Purtroppo, visto che le variabili di stato generalmente sono
delle variabili interne, non
sempre lo stato del sistema è completamente noto; in effetti
nella maggior parte dei casi
risultano accessibili soltanto alcune componenti, per cui è
impossibile operare una
stabilizzazione se prima non si effettua una “misura” dello
stato del sistema.
Tale misura può essere ottenuta direttamente dall’uscita dato
che questa è una
combinazione lineare delle componenti dello stato del sistema
(caso SISO)
)()()( tDutCxty += In pratica si tratta di stimare lo stato, in
quanto si parla di stima proprio quando si riesce
a misurare le variabili di stato non accessibili attraverso
l’uscita del sistema.
Ma come si effettua una stima x̂ dello stato x del sistema?
Attraverso un sistema dinamico che prende il nome di Osservatore
dello stato del
sistema.
Un Osservatore dello stato del sistema è un simulatore, in tempo
reale, del sistema; in
pratica è un sistema dinamico che riceve in ingresso lo stesso
ingresso del sistema u(t) e,
in base ad un fattore di correzione che dipende dall’uscita y(t)
del sistema, fornisce in
uscita una stima x̂ dello stato del sistema. Un osservatore si
dice asintotico quando è
verificata la seguente condizione:
xxt
=∞→
ˆlim
Prima di vedere come si progetta un osservatore vediamo invece
come osservatore e
controllore sono collegati al sistema da stabilizzare
Consideriamo ora il nostro sistema da stabilizzare descritto
dalle seguenti relazioni
-
49
+=+=
•
)()()()()()(
tDutCxtytButAxtx
Sulla base del sistema l’osservatore sarà descritto dalle
seguenti relazioni
+=−−+=
•
)()(ˆ)(ˆ)](ˆ)([)()(ˆ)(ˆ
tDutxCtytytyLtButxAtx 8.1)
Inizialmente i due vettori di stato, quello reale e quello
stimato, saranno diversi per cui
saranno diverse anche le uscite )(ˆ ty e )(ty ; al divergere del
tempo, però, se l’osservatore
è asintotico, tale differenza si annullerà per cui i due stati
tendono a coincidere per t
sufficientemente grande.
Possiamo definire un vettore errore nella stima dello stato
)(ˆ)()(~ txtxtx −=
in base al quale le 8.1) diventano
)()(ˆ)(ˆ)()()(
)](ˆ)([)()(ˆ)()()(~
tDutxCtytDutCxty
tytyLtButxAtButAxtx
+=+=
−+−−+=•
per cui
0)0(ˆ)0()0(~)0(~)(~)(~)()]()(ˆ)()([)(~)(~
)( ≠−==⇒+=+−++=
+
•
xxxconxetxtxLCAtDutxCtDutCxLtxAtx
tLCA 8.2)
Queste relazioni mostrano che il vettore errore, e quindi la
stima, non dipendono
dall’ingresso u(t) del sistema; inoltre mostrano che, affinché
l’errore della stima si estingua
nel tempo (ossia il nostro osservatore sia asintotico) è
necessario determinare una matrice
L tale che la matrice (A+LC) abbia autovalori tutti
asintoticamente stabili.
Domanda: E’ sempre possibile stimare lo stato di un sistema,
ossia è sempre possibile
determinare una matrice di osservazione L che sia in grado di
posizionarmi gli autovalori
di (A+LC) nel semipiano sinistro del piano complesso (TC) o
all’interno del cerchio
unitario (TD)? E’ sempre possibile scegliere arbitrariamente una
matrice di osservazione
L in modo che gli autovalori della matrice A+LC siano assegnati
ad arbitrio?
Risposta: No, salvo che non sia verificata una delle due
condizioni:
• Il sistema sia completamente osservabile
• Eventuali autovalori non osservabili siano asintoticamente
stabili.
Per dimostrare quanto detto enunciamo il seguente teorema:
-
50
Teorema: Esiste una matrice L tale che
8.3)
per ogni possibile insieme di numeri complessi-coniugati o reali
),,.........( 1 nµµ , se e
solo se la coppia (A,C) è completamente osservabile.
La validità di questo teorema si basa sul fatto che ogni
autovalore non osservabile di A è
autovalore non osservabile per (A+LC) per cui gli autovalori di
(A+LC) sono posizionabili
ad arbitrio se e solo se sono osservabili; se vi sono degli
autovalori non osservabili ed
instabili il nostro osservatore non sarà asintotico; quindi,
nell’ipotesi che il sistema sia non
osservabile, esso è misurabile se e solo se gli autovalori non
osservabili sono
asintoticamente stabili.
Studiare la misurabilità di un sistema significa, quindi,
determinare eventuali
autovalori non osservabili e vedere se sono stabili o meno.
Come si fa a determinare la matrice L in modo che (A+LC) abbia
tutti autovalori
desiderati, ossia stabili?
Si può procedere nei tre modi seguenti:
• imponendo la condizione
n
n
i
did
l
ll
Ldove
PLCAI
2
1
1
)()()](det[
=
−==+− ∏=
µλλλ
autovalori desiderati (stabili)
Otteniamo, in questo modo, un sistema di n equazioni in n
incognite che sono gli
elementi della matrice L.
Tale metodo è applicabile sia a sistemi completamente
osservabili sia non
completamente osservabili.
• Mediante la formula di ACKERMAN:
-
51
necon
eAPF
n
nnd
=
−= −
1
00
)( 1θ
• Se il sistema non è completamente osservabile si decompone
nella forma
standard di osservabilità di Kalman; quindi una volta
determinato il sottosistema
osservabile si determina, per esso, una matrice di osservazione
Lr con uno dei due metodi
sopra mostrati, oppure con il metodo costruttivo della
dimostrazione. Una volta
determinata la matrice Lr la si completa con n-r colonne nulle
in modo da ottenere la
matrice L.
( ) ( )[ ]0mindet
ˆ,ˆ,ˆˆ,ˆ,ˆtan)(
rr
rrr
n
LLLazioneerCBAeosservabilmasottosisteCBA
ilitàraggiungibdardsionedecomposizrrango
=⇒⇒⇒
⇒⇒=θ
N.B.: Nel determinare la matrice L (o Lr) con il metodo
costruttivo si può sfruttare il principio di dualità di Kalman
mediante il quale è possibile
posizionare gli autovalori della matrice di osservazione L
mediante posizionamento degli
autovalori della matrice di retroazione F* del sistema duale; in
pratica ∗∗∗ =⇒+=+=+ FLLBALCALCA TTTTTT )()()(
Ovviamente la matrice F* viene trovata assegnandole gli
autovalori desiderati per l’osservatore.
Mettiamo insieme ora Sistema-Osservatore-Controllore:
+=
+=+=
•
•
eosservatortxLCAtx
sistematDutCxtytButAxtx
)(~)()(~
)()()()()()(
Progettiamo la retroazione:
)()(~)]([)()(
)()](~)([)()()(~)()()(ˆ)(
tBrtxBFtFxBtAxtu
trtxtxFtutrtxFtFxtrtxFtu
+−+=
⇒+−=⇒+−=+=•
Definendo lo stato complessivo
-
52
)(~)(txtx
si ottiene
[ ] 0')(0)(
)(0)(~
)(0)(~
)(
==
+
+−+
=
•
•
DcheipotesinelltxCty
trB
txtx
LCABFBFA
tx
tx 8.4)
Gli autovalori del controllore basato sul modello saranno dati
da
)()()](det[)](det[)det( λλλλλ d eosservatord
controlloCL PPLCAIBFAIAI ×=+−×+−=−
Quest’ultimo risultato, noto come teorema di separazione tra
stima e controllo, mostra
come si possa eseguire separatamente il progetto del controllore
e dell’osservatore.
Se calcoliamo la funzione di trasferimento complessiva, a causa
degli zeri del sistema
8.4) si ottiene
BBFAsICBFAsI
BBFAsIACAsIAsI
BAsIBFAsIACsH gg
contoss
ossgg
×+−×=
=+−
×+−×=
−×−×−×+−×
=
−1)]([
)](det[)]([
)det()det()det()]([
)(
Per cui ai fini del comportamento ingresso-uscita figurano solo
gli autovalori del
controllore.