Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura ...laura.giarre/corso1/tds345.pdf1 Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura Giarrè 2.4.3 Matrici

1

Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura Giarrè

2.4.3 Matrici e funzioni di Trasferimento

Consideriamo un sistema lineare tempo-invariante e poniamoci nel dominio

trasformato; le formule 2.29) e 2.30) forniscono, rispettivamente, l’uscita per un sistema

tempo-continuo ed un sistema tempo-discreto.

Se supponiamo nulle le condizioni iniziali si ottiene

)(])([)( 1 sUDBAsICsY +−= −

)(])([)( 1 zUDBAzICzY +−= −

che, nel dominio trasformato, forniscono delle rappresentazioni ingresso/uscita per il

sistema dato.

Se il sistema è MIMO (Multiple Input, Multiple Output) si definisce Matrice di

Trasferimento la matrice

mp

x

mp

x

pm

zHDBAzIczUzYzH

sHDBAsIcsUsYsH

yu

×−

=

×−

=

××

ℜ∈+−==

ℜ∈+−==

ℜ∈ℜ∈

)()()()()(

)()()()()(

1

0)0(

1

0)0(

11

2.31)

Nel caso in cui p=m=1 il sistema si dice SISO (Single Input, Single Output) e la matrice

di trasferimento si riduce ad una funzione scalare che prende appunto il nome di funzione

di trasferimento; la sua antitrasformata fornisce la risposta impulsiva del sistema; infatti se

supponiamo di applicare in ingresso un impulso si ha

)]([)]([)()()(1)( 11 sHLsYLthsHsYsU −∂−

∂ ==⇒=⇒= 2.32)

Nel caso MIMO, invece, se supponiamo che il sistema presenta m ingressi e p uscite si

ha

2

=

)()()(

)(

)()()(

)(

21

11211

sHsHsH

sH

sHsHsH

sH

pmpp

ij

m

il generico termine Hij(s) rappresenta, nel dominio di s, la risposta yi(s) ad un impulso

applicato all’ingresso uj(s); la sua antitrasformata darà, dunque, la risposta hij(t) presente

all’uscita yi del sistema quando all’ingresso uj è applicato un impulso (nell’ipotesi che tutti

gli altri ingressi siano nulli)

)]([)]([)( 11 sHLsYLth ijiij j−

∂− == 2.33)

La matrice

== −

)()()(

)(

)()()(

)]([)(

21

11211

1

ththth

th

ththth

sHLth

pmpp

ij

m

prende il nome di matrice delle risposte impulsive.

Da quanto detto è facile ricavare il legame che sussiste nel dominio del tempo tra

risposta di un sistema ad un generico ingresso u(t) e risposta all’impulso; tale legame è

sancito dal cosiddetto integrale di convoluzione

MIMOcasoiHikuiuikHky

SISOcasoihikuiuikhky

DiscretiTempoSistemi

MIMOcasodHtudutHty

SISOcasodhtuduthty

ContinuiTempoSistemi

k

i

k

i

k

i

k

i

t t

o

t t

o

∑∑

∑∑

∫ ∫

∫ ∫

==

==

−=−=

−=−=

−=−=

−=−=

00

00

0

0

)()()()()(

)()()()()(

)()()()()(

)()()()()(

ττττττ

ττττττ

Se consideriamo la formula dell’inversa di una matrice

)det()(1

AAAggA =−

si ottiene, nel caso di un sistema TC,

3

DBAsIAsIAggCsH +

−−=

)det()()(

Nel dominio trasformato i sistemi si possono classificare in:

1. Sistema strettamente proprio: Un sistema si dice strettamente proprio quando

D=0. In questo caso il grado del numeratore della funzione di trasferimento (per sistemi

SISO) o di ciascun termine della matrice di trasferimento (per sistemi MIMO) può al più

essere uguale a n-1, se n è la dimensione del sistema, mentre quello del denominatore è n.

2. Sistema non strettamente proprio: Un sistema si dice non strettamente proprio

quando D≠0. In questo caso il grado del numeratore della funzione di trasferimento (per

sistemi SISO) o di ciascun termine della matrice di trasferimento (per sistemi MIMO) può

al più essere uguale a quello del denominatore e cioè n, se n è la dimensione del sistema.

3. Sistema non proprio: Un sistema si dice non proprio quando D≠0 ed il grado del

numeratore è maggiore di quello del denominatore.

Noi prenderemo in considerazione prevalentemente sistemi non strettamente propri e

sistemi strettamente propri.

E’ molto utile, inoltre, dare la definizione di zeri e poli di un sistema, perché vedremo

giocano un ruolo importante nella discussione delle proprietà strutturali e di stabilità di un

sistema:

4. Zeri di un sistema: Si definiscono zeri di un sistema le radici del numeratore

della f.d.t. (nel caso SISO) o dei numeratori dei termini della matrice di trasferimento

(nel caso MIMO). Un sistema MIMO può possedere più zeri con molteplicità diversa nello

stesso punto del dominio di Laplace o del piano complesso.

5. Poli di un sistema: Si definiscono poli di un sistema le radici del denominatore

della f.d.t. (nel caso SISO) o dei denominatori dei termini della matrice di trasferimento

(nel caso MIMO). Un sistema MIMO può possedere più poli con molteplicità diversa nello

stesso punto del dominio di Laplace o del piano complesso.

Da notare che, in un sistema SISO, poli e autovalori coincidono se e solo se

nell’espressione della f.d.t non ci sono cancellazioni tra termini comuni a numeratore e

denominatore; ciò invece può non essere vero per i sistemi MIMO dove poli ed autovalori

possono coincidere anche in presenza di cancellazioni in alcuni termini.

Ciò significa che, in generale, per un sistema nel passaggio da una rappresentazione

i/s/u ad una rappresentazione i/u può avvenire una perdita di informazione circa gli

autovalori del sistema a causa della presenza di eventuali cancellazioni tra binomi comuni

a numeratore e denominatore della f.d.t. (o dei termini della m.d.t); tale perdita accade

4

puntualmente in sistemi SISO nelle condizioni suddette, mentre può non verificarsi per un

sistema MIMO nel caso in cui gli autovalori che subiscono cancellazioni in alcuni termini

rimangono in ogni caso presenti in altri termini.

2.5 Interconnessione di sistemi

Si possono distinguere due fondamentali connessioni tra sistemi:

1. Connessione serie

2. Connessione parallelo

Analizziamole distintamente

Connessione serie

Due sistemi si dicono interconnessi in serie quando uno dei due sistemi è pilotato

dall’altro

u u1 H1(s) y1=u2 H2(s) y2 y

u = u1

y1 = u2

=

2

1

xx

x

y = y2

++=++=++=

+=•

•

uDDxCDxCYuDBxCBxAuDxCBxAx

uBxAx

1211222

12112221112222

111

)(1

La rappresentazione del sistema complessivo si ottiene ponendo y1=u2

[ ] uDDxCCDY

uDB

Bx

ACBA

x

12212

12

1

212

1 0

+=

+

=

•

Passando nel dominio trasformato si ha

5

)()()()()()()()()()()()()()()(

211212222

11

sHsHsHsUsHsHsYsHsUsHsYsYsUsHsY

=⇒=====

Nel caso di sistemi MIMO bisogna stare attenti all’ordine delle matrici.

Connessione parallela

Due sistemi si dicono interconnessi in parallelo quando gli ingressi coincidono e le

uscite si sommano.

H1(s) y1

u y

y2 H2(s)

=

2

1

xx

x

+++=+=

+=•

•

uDxCuDxCYuBxAx

uBxAx

222111

111

111

1

1

La rappresentazione del sistema complessivo è

[ ] uDDxCCY

uBB

xA

Ax

)(0

0

1221

2

1

2

1

++=

+

=

•

Passando nel dominio trasformato si ha

)()()()())()(()()()()()()()()()(

212121

2211

sHsHsHsUsHsHsYsYsYsUsHsYsUsHsY

+=⇒+=+===

6

3. Modelli ARMA di un sistema LTI e loro identificabilità

Abbiamo prima visto com’è possibile ottenere una rappresentazione nello spazio degli

stati di un sistema LTI, partendo da una rappresentazione ingresso/uscita; il metodo da noi

usato si basa su uno studio nel dominio del tempo attraverso il quale si cerca di

determinare una rappresentazione i/s/u del sistema dopo un’opportuna scelta del vettore di

stato.

In molti casi può essere conveniente lavorare nel dominio trasformato, cercando di

ottenere una rappresentazione nello spazio degli stati a partire dalla matrice di

trasferimento del sistema, ottenuta mediante trasformazione della rappresentazione i/u

(ovviamente tale metodo è valido solo per condizioni iniziali nulle).

In pratica, prendendo per esempio un sistema LTI-TD con rappresentazione ingresso-

uscita

(modello ARMA)

si opera una trasformazione che, supponendo nulle le condizioni iniziali, permette di

ottenere la f.d.t. del sistema

)()()()(

)()()(

)()()()()(

212

21

221221

zUzDzNzY

azazbzb

zUzYzH

zzUb

zzUb

zzYa

zzYazY

=⇒++

+==

+=++

A questo punto si sostituisce, in N(z) e D(z), la variabile z con l’operatore p, il qual è un

operatore che applicato ad una funzione f(k) ne provoca una traslazione in avanti; in

pratica nel passo successivo si ottiene

)()()()( ku

pDpNky =

Definendo una variabile ausiliaria

)()(

1)( kupD

kx =

si ottiene

)()1()()()()()()()()1()2()()()()()()(

2121

21212

kxbkxbkxbzbkxpNkykukxakxakxkukxazazkukxpD

++=+===++++⇒=++⇒=

Prendendo, allora, come vettore di stato

+=

)1()(

)(kx

kxkz

7

si ottiene

[ ] )()(

)(10

)(10

)2()1(

)1(

12

12

kzbbky

kukzaakx

kxkz

=

+

−−=

++

=+

Analogo discorso per i sistemi TC dove l’operatore p s’identifica con quello di

derivazione e non con quello di traslazione come accade nei sistemi TD.

E’ ovvio che anche con questo metodo la dimensione del sistema dipende molto dalla

scelta del vettore di stato; una cosa è certa, qualunque sia la realizzazione del sistema

questa deve ammettere gli stessi autovalori di ogni altra (cambiando dimensione

dovrebbero cambiare il numero di autovalori, ma non perché non ci sono, semplicemente

perché si cancellano durante il calcolo della f.d.t per cui non sono visibili esternamente)

nonché la stessa f.d.t. o m.d.t. Analogo discorso per i sistemi TC dove l’operatore p

s’identifica con l’operatore di derivazione.

3.1 Determinazione di una rappresentazione i/u a partire da una rappresentazione

i/s/u

Abbiamo visto che una f.d.t. di un sistema non è altro che una sua rappresentazione i/u

nell’ipotesi che lo stesso sistema si evolva a partire dallo stato zero.

Ciò implica che un modo per ottenere una rappresentazione i/u di un sistema a partire da

una sua rappresentazione i/s/u è di determinare la f.d.t del sistema,

)()()()( zU

zDzNzY =

sostituire, in N(z) e D(z), la variabile z con l’operatore p (di traslazione nel caso TD e di

derivazione nel caso TC)

pinpolinomiPNepD

kupNkypDkupDpNky

)()(

)()()()()()()()( =⇒=

e quindi sviluppare entrambi i membri della relazione ottenuta tenendo presente che

TCkfkfpTDnkfkfp

nn

n

)()()()(

)(=

+=

8

3.2 dentificabilità o taratura dei modelli ARMA di un sistema LTI

3.2.1 Assenza di errori sull’ingresso e sull’uscita:

11

3.2.2Presenza di errori sull’ingresso e sull’uscita:

12

4. STABILITA’ INTERNA ALLA LYAPUNOV

Le nozioni di stabilità interna che ci proponiamo di introdurre forniscono indicazioni

circa il comportamento del sistema nell’intorno di un suo punto d’equilibrio; in pratica

servono a stabilire se una piccola perturbazione, da x0, provoca una risposta nello stato del

sistema che si estingue nel tempo (lo stato tende, dopo un piccolo scostamento, di nuovo a

x0), che converge ad un altro stato x o addirittura divergente.

Nell’introdurre queste nozioni di stabilità, è bene premettere che, noi considereremo

prevalentemente il caso in cui il punto d’equilibrio x0 sia isolato (in realtà i sistemi

dinamici possono avere più punti d’equilibrio ed, addirittura, quelli non lineari possono

avere punti d’equilibrio periodici) e coincidente con l’origine (ciò non è restrittivo perché

possiamo sempre ricondurci a questo caso tramite una traslazione di coordinate).

4.1 Asintotica stabilità (locale) e stabilità nel senso di Lyapunov

Un sistema si dice asintoticamente stabile attorno al suo punto d’equilibrio se soddisfa

le seguenti condizioni

a. 0101 )()(00 tttxtxsechetale ≥∀∀ εε

(Questa condizione richiede che la traiettoria di stato debba essere confinata in una

piccola sfera di raggio ε, centrata nel punto d’equilibrio, nell’ipotesi che il sistema si

evolva da un’arbitraria condizione iniziale che cada in una piccola sfera di raggio δ1>0

sufficientemente piccolo)

b. ∞→→∂∃∂ tpertxalloratxsechetale 0)()(0 202

Se un sistema soddisfa soltanto la prima condizione si dice stabile nel senso di

Lyapunov o semplicemente stabile (i.s.l); in questo caso il punto d’equilibrio si dice

marginalmente stabile.

Se un sistema soddisfa entrambe le condizioni si dice asintoticamente stabile e con lui il

suo punto d’equilibrio.

Se un sistema non soddisfa la prima condizione si dice instabile così come il suo punto

d’equilibrio. N.B.: ESISTONO SISTEMI NON LINEARI CHE SODDISFANO LA SECONDA CONDIZIONE SENZA

SODDISFARE LA PRIMA.

13

ESEMPIO: Consideriamo il seguente sistema LTI-TC

��

��

===+=

•

)0,(),(

xgxyuxfbuaxx

determinare

(a) PUNTI D’EQUILIBRIO: −−−−−−

−=+== uabxubxauxf 0),(0

(b) SOLUZIONE:

Operiamo una traslazione di coordinate

0)(sup)()(

)()(

)()()(

0000 ≠=−=

=+==

+=−=

−

−••

−−

txponendozxtxtz

tazubaxxtz

uabtxxtxtz

Integrando si ottiene

��

�

��

�

�

==

∞=>

=<

+−==

−

∞→

∞→

∞→

−−

;)(lim0

;)(lim0

;sin0)(lim0

])([)()( 00

semplicestabilitàxtza

àinstabilittza

stabilitàtoticaatza

xxtxetxzetz

t

t

t

atat

14

4.2 Stabilità dei sistemi lineari tempo-invarianti

Vogliamo studiare la stabilità di un sistema LTI non forzato d’equazioni

Supponiamo che la matrice A sia diagonalizzabile; dalle formule di Lagrange del

sistema diagonalizzato si ricava

dove W=V-1.

Un sistema è stabile se partendo da un punto la sua evoluzione nello stato rimane

limitata dentro una sfera; dalle precedenti relazioni si deduce che

TDWxVkx

TCWxVetxk

t

)0()(

)0()(

Λ=

= Λ

per cui )(tx è limitato se e solo se è limitato

niTDTCe

ki

ti

,.......,2,1=λ

λ

Quindi un sistema è stabile nel senso di Lyapunov se e solo se

TDniTCni

i

i

,....,11,....,10)Re(

=∀≤=∀≤

λλ

Per l’asintotica stabilità è necessario invece che tale disuguaglianza sia in senso stretto

TDniTCni

i

i

,....,11,....,10)Re(

=∀<=∀<

λλ

stabileetoticamentasistema sin⇒

15

Osservazioni:

• Nel caso in cui un sistema ammetta autovalori immaginari (TC) o con modulo

unitario (TD) è necessario che tali autovalori abbiano molteplicità unitaria (siano soluzioni

semplici del polinomio caratteristico della matrice A) affinché il sistema sia

marginalmente stabile (stabile nel senso di Lyapunov).

• Se il sistema ammette autovalori immaginari (TC) o di modulo unitario (TD)

con molteplicità maggiore di uno, o ancora autovalori con parte reale positiva (TC) o con

modulo maggiore di uno (TD), allora tale sistema è instabile.

• Nel caso in cui la matrice A non sia diagonalizzabile si ricorre alla matrice di

JORDAN (sempre tramite traslazione di coordinate) e si dimostra che continuano a valere i

risultati di prima (vedi espressione matrice eJt a pag. 18).

16

4.3 Metodo diretto di Lyapunov per sistemi TC-NL-TI

Consideriamo il seguente sistema TC-NL-TI

))(( txfx =•

4.1)

che ha un punto d’equilibrio a x=0.

Consideriamo una funzione continua, scalare V(x) che è nulla nell’origine e positiva in

un intorno sufficientemente piccolo di essa

• V(0)=0

• V(x)>0 per x≠0 e 0

17

Esempio: Consideriamo il sistema

)(1)(

)1()(1

)()1( 2

2

122

2

21 kx

kxkxkx

kxkx+

=++

=+

il quale ha un solo punto d’equilibrio nell’origine; scegliamo la funzione di Lyapunov

quadratica 22

21)( xxxV +=

quindi

[ ] [ ]

[ ] [ ] 0)1)(11)](([)]([

)(1

)()(

)]([)(1

)(

)(1

)()]([)]1([)]([))](([)(

222

222

22

21

222

21

222

22

≤−+

=−+

+=

=−+

++

=−+=−=•

kxkxVkxV

kx

kxkx

kxVkx

kx

kx

kxkxVkxVkxVkxfVxV

per cui x=0 è stabile nel senso di Lyapunov.

4.5 Funzione quadratica di Lyapunov per sistemi TC-LTI

Consideriamo il sistema lineare tempo continuo

)()( tAxtx =•

4.3)

e la funzione nT xPxxxV ℜ∈=)(

dove P è una matrice simmetrica.

V(x) è una funzione definita positiva se e solo se tutti gli autovalori di P sono positivi.

Una matrice P che soddisfa

00 ≠∀> xPxxT

si dice definita positiva (s’indica con P>0).

Una matrice P che soddisfa

00 ≠∀≥ xPxxT

è chiamata semidefinita positiva (s’indica con P≥0).

Supponiamo ora che la matrice V(x), candidata come funzione di Lyapunov per il

sistema, sia così definita

0)( >= PPxxxV T

Allora

18

QxxxPAPAxPAxxPxAxxPxPxxxV TTTTTTTT −=+=+=+=•••

)()( dove la matrice Q è data da

PAPAQ T +=−

Ovviamente il punto d’equilibrio nell’origine è i.s.l. se e solo se Q≥0 (in questo caso

V(x) è una funzione di Lyapunov) mentre è asintoticamente stabile se e solo se Q>0.

Possiamo riassumere quanto detto affermando che possiamo trovare una funzione di

Lyapunov quadratica per il sistema 4.3) scegliendo una matrice simmetrica Q>0 e

provando a risolvere la seguente equazione (equazione di Lyapunov)

PAPAQ T +=−

rispetto a P. se tal equazione ha una soluzione definita positiva (P>0) allora il sistema

è asintoticamente stabile. Ciò è provato dal seguente teorema.

Teorema: Dato il sistema dinamico

)()( tAxtx =•

ed una Q>0, esiste una soluzione P>0 dell’equazione di Lyapunov

PAPAQ T +=−

se e solo se tutti gli autovalori di A sono nel semipiano sinistro. In questo caso la

soluzione P è unica.

4.6 Funzione quadratica di Lyapunov per sistemi TD-LTI

Consideriamo il sistema

x(k+1)=Ax(k)=f(x(k)) 4.4)

Se V(x)=xTPx allora

PxxPAxAxkxVkxfVxV TTT −=−=•

)]([))](([)(

Quindi l’equazione di Lyapunov da studiare è

PPAAQ T −=−

Teorema: Dato il sistema 4.4) e una Q>0, esiste una soluzione P>0 dell’equazione di

Lyapunov

PPAAQ T −=−

se e solo se tutti gli autovalori di A hanno modulo minore di 1. La soluzione P in questo

caso è unica.

19

4.7 Metodo indiretto di Lyapunov: mediante linearizzazione

Supponiamo che il sistema

)(xfx =•

4.5)

ha un punto di equilibrio in x0=0 (eventualmente si ricorre alla traslazione).

Supponiamo che il sistema linearizzato nell’intorno dell’origine sia:

Axx =∂•

4.6)

dove

00=

∂∂=

xxfA

Vale il seguente teorema.

Teorema: Se il sistema 4.6) è asintoticamente stabile allora il punto di equilibrio x0=0

è (localmente) asintoticamente stabile.

Se il sistema 4.6) è instabile (autovalori di A nel semipiano destro) allora il punto di

equilibrio x0=0 è instabile.

Se la matrice A ha autovalori nulli o con parte reale nulla allora il sistema linearizzato

non può comunicarmi nessun’informazione circa il comportamento del sistema di partenza

4.5) in x0=0.

Analoghe considerazioni per i sistemi tempo discreti.

4.8 Teorema di Lyapunov per la stabilità asintotica globale

Se una funzione V(x) è l.p.d. nell’intero spazio degli stati, è tale che

∞→∞→ xperxV )(

ed inoltre )(xV•

è l.n.d. nell’intero spazio degli stati, allora il punto di equilibrio x0=0 è

asintoticamente globalmente stabile.

4.9 Stabilità dei sistemi LTV

La soluzione generale di un sistema LTV non forzato è del tipo

per cui valgono le due seguenti definizioni

• Un sistema LTV non forzato è stabile nel senso di lyapunov nell’origine se e

solo se

20

• Un sistema LTV non forzato è asintoticamente stabile nell’origine se e solo se

ot∀

5 STABILITA’ INGRESSO-USCITA O ESTERNA

Affronteremo in questo capitolo l’analisi della stabilità esterna di sistemi LTI tempo-

continui e tempo-discreti. Per stabilità esterna s’intende la proprietà di un sistema di

mantenere un’uscita limitata quando è forzato con un ingresso anch’esso limitato.

Per introdurre queste nozioni è necessario, dapprima, presentare le cosiddette misure sui

segnali, con le quali è possibile ottenere quattro parametri fondamentali:

1. Ampiezza di picco

2. Energia

3. Potenza

4. Azione

5.1 Misure sui segnali

Tenendo conto del fatto che un segnale è una variabile manifesta che dipende dal

tempo,

TDZkTCt

n

n

ℜ→

ℜ→ℜ

:)(:)(

ϖϖ

consideriamo una successone infinita o semi-infinita (qualora t0=0) di valori che un

segnale assume in instanti di tempo successivi

5.1)

La prima misura che possiamo fare su questa successioni di segnali è quella

dell’ampiezza di picco.

21

Ampiezza di picco

L’ampiezza di picco si misura attraverso la norma a uno 1:

• Tempo discreto: Data la successione 5.1) si definisce norma a uno il massimo

dell’ampiezza che assume il segnale

∞∞== )(sup)(maxsup kk

kiik

ϖϖϖ

• Tempo continuo: Data la successione 5.1) si definisce norma a uno il massimo

dell’ampiezza che assume il segnale

∞∞== )(sup)(maxsup tt

tiit

ϖϖϖ

Esempio:

>∞<=

=⇒=∞

11111

)(aseasease

ak k ϖϖ

Energia

L’energia si misura attraverso la norma a 2 2; la norma a 2 è la radice quadrata

dell’energia

• Tempo discreto:

∑∑ ==kk

T kkk 222

)()()( ϖϖϖϖ

• Tempo continuo:

∫∫ ==tt

T ttt 222

)()()( ϖϖϖϖ

Esempio:

∞≥= ∫∞

−−

adtetatet atat

21)(00)(

0

22

ϖϖ

Potenza

La potenza si definisce mediante le seguenti relazioni

• Tempo discreto:

))()(21(lim

1

)1(∑−

−−=∞→=

N

Nk

T

Nkk

NP ϖϖϖ

• Tempo continuo:

22

∫−

∞→=

L

L

T

Ltt

LP ))()(

21(lim ϖϖϖ

Come si può notare, la potenza non è una norma perché non soddisfa necessariamente la

condizione

00 =⇔= xx

Un parametro molto utile, legato alla potenza, è il valore quadratico medio dell’energia

o energia media:

ϖσρ P=

Azione del segnale

L’azione di un segnale è definita mediante la sua norma a 1 1

• Tempo discreto:

∑ ∑∑ ===k k

n

ii kk 1

11

)()( ϖϖϖ

• Tempo continuo:

∫ ∫∑∞ ∞

===

0 01

11

)()( dttdtkn

ii ϖϖϖ

Esempio di norme:

=

∞==

=

⇒≥=

∫

∫∞

∞∞

01

0

22

0)(

dtV

dtV

V

tVt

ϖ

ϖ

ϖ

ϖ222

1 2

0

2 VpVdtVL

PL

=⇒== ∫ϖ

Relazioni fra le norme

Per un sistema tempo-discreto vale la seguente relazione tra le norme

∞

23

Bisogna stare attenti inoltre al fatto che se un segnale è a potenza finita non

necessariamente deve estinguersi nel tempo (si pensi al segnale sinusoidale), a differenza

di quanto accade per un segnale ad energia limitata.

5.2 Sistemi BIBO-stabili e Lp-stabili

Consideriamo un sistema

u H y

nel quale l’uscita y è legata all’ingresso u attraverso un operatore generico (anche non

lineare); un sistema di questo tipo si dice lp-stabile o p-stabile (con ∞= ,2,1p ) se esiste

una costante finita ℜ∈C tale che

ppuCy ≤ 5.2)

Se questa condizione è verificata per ∞=p allora il sistema si dice BIBO-stabile

(Bounded Input Buonded Output ossia Ingresso Limitato Uscita Limitata).

Vediamo adesso di determinare delle condizioni attraverso le quali è possibile stabilire

se un sistema LTI è Bibo-stabile (stabile esternamente) o Lp-stabile.

Teorema: Consideriamo un sistema LTI-TC con m ingressi e p uscite e matrice delle

risposte impulsive )]([)( 1 sHLtH −= ; tale sistema è BIBO stabile se e solo se

∞

24

che soddisfa la 5.2) e quindi il sistema è BIBO stabile.

Nel caso SISO inoltre vale pure il seguente teorema

stabileLpèsistemailuHyueHseppp

⇒∞

25

6. PROPRIETA’ STRUTTURALI

In questo capitolo analizzeremo in dettaglio gli effetti che l’ingresso di un sistema LTI

può avere sullo stato; in pratica introdurremo le cosiddette proprietà strutturali

(raggiungibilità, controllabilità e osservabilità) di un sistema LTI.

Inizieremo la nostra discussione analizzando la proprietà di raggiungibilità per i sistemi

LTI-TD perché il caso tempo continuo è più difficile da trattare per cui ci limiteremo ad

estrarre delle considerazioni dall’analisi sui sistemi TD.

6.1 Raggiungibilità per sistemi LTI-TD

Consideriamo un sistema LTI-TD

Ci chiediamo se è possibile scegliere una sequenza di ingressi

in modo da portare il sistema dallo stato iniziale ( ) 00 =x allo stato obiettivo ( ) xkx ~= ;

in pratica vogliamo che ad un certo passo k lo stato raggiunga il valore prefissato x~ .

Se è possibile trovare tale sequenza di ingresso allora lo stato x~ si dice raggiungibile

in k passi; ovviamente non sempre è possibile trovare tale sequenza per cui non sempre

uno stato è raggiungibile.

Vediamo di determinare delle condizioni che ci permettano di stabilire quando uno stato

del sistema è raggiungibile o meno.

Se guardiamo la formula di lagrange per un sistema LTI-TD

ponendo ( ) 00 =x e ( ) xkx ~= si ottiene

kkURx =~ 6.1)

26

Otteniamo un sistema lineare di n equazioni in k incognite che ammette soluzione se e

solo se nk ≤ e la matrice Rk è invertibile; in tal caso la soluzione è data da

xRU kk ~1−=

e tale soluzione diventa unica se k=n.

Chiamiamo con

rkkk XRRangeRRa ===ℜ )()(

lo spazio generato dai vettori colonna della matrice di raggiungibilità Rk; tale

sottospazio lineare prende il nome di sottospazio raggiungibile in k passi perché è formato

da tutti e soli gli stati del sistema che sono raggiungibili in k passi e quindi ottenuti dalla

6.1) al variare della sequenza di ingresso Uk.

Si dimostra che vale il seguente teorema

Teorema: Per lnk ≤≤

)()()( lnk RRaRRaRRa =⊆ 6.2)

con n=dim(A)=dim(x).

Infatti dal teorema di Caylei-Hamilton si sa che

[ ]BABBABABABARmatricenellaquindi

nlAAAA

nnlll

n

i

ii

ln

i

ii

n

2121

1

1

0

−−−−

=

−

=

=

≥=⇒= ∑∑ γα

le prime l-n colonne sono generate dalle restanti n e quindi

)()( ln RRaRRa =

ossia più in generale la 6.2).

Questo risultato permette di eliminare la dipendenza tra la raggiungibilità di uno stato

ed il numero di passi necessari per ottenerla visto che ogni stato raggiungibile in al più K

passi lo è anche in un numero di passi almeno pari a n.

Il sottospazio )( nn RRa=ℜ si dice sottospazio raggiungibile in al più n passi o, per

quanto detto prima, semplicemente sottospazio raggiungibile.

Nel caso in cui sia soddisfatta la seguente condizione

nRRaXRRa nn =⇒= )](dim[)( 6.3)

27

il sottospazio Ra(Rn) coincide con l’intero spazio degli stati, il che significa che tutti gli

stati del sistema sono raggiungibili; in tal caso è il sistema stesso che si dice raggiungibile

o completamente raggiungibile.

In un sistema SISO la matrice di raggiungibilità Rn è quadra di ordine n per cui la 6.3) è

verificata se e solo se

0)det()( ≠⇒= nn RnRrango 6.4)

In un sistema MIMO, invece, la completa raggiungibilità di un sistema non può essere

testata mediante la non singolarità della matrice Rn in quanto questa non è quadra, ma

rettangolare e di ordine nmn× ; allora è più corretto dire che, indipendentemente

dall’ordine della matrice di raggiungibilità, un sistema è completamente raggiungibile se e

solo se la matrice Rn ha rango massimo, il che si verifica quando

0)det( ≠nTn RR . 6.5)

Se la matrice di raggiungibilità ha rango minore di n allora non tutti gli stati sono

raggiungibili ed il sistema si dice non completamente raggiungibile.

Supponiamo, ora, che il sistema LTI-TD sia completamente raggiungibile; ci

chiediamo: assegnato uno stato x~ qual’è la sequenza nU che ci permette di raggiungerlo?

Distinguiamo i seguenti casi:

• xR

nu

uou

URnRrangoRtu nnnnnn

n~

)1(

)1()(

0)det()(1)](dim[ 1−× =

−

=⇒≠⇒=⇒ℜ∈⇒=

•

2min

~)(0)det()(

~~1)](dim[

1

anormalaimizzachesoluzionelaèUxRRRURRnmassimoRrangose

URRxRURxRmtu

n

Tnn

Tnnn

Tnn

nnTn

Tnnn

nmnn

∗

−∗

×

=⇒≠⇒==

=⇒=

ℜ∈⇒>=

Consideriamo ora il caso in cui si voglia raggiungere un generico stato d non a partire

dallo stato zero, ma a partire da un arbitrario stato iniziale S; dalla formula di lagrange si

deduce che la sequenza d’ingresso che ci risolve questo problema è soluzione del seguente

sistema

28

kkk URSAd =−

Se d e S sono stati arbitrari, indipendentemente dalle caratteristiche della matrice A, la

quantità a primo membro la si può considerare come un nuovo generico stato x~ da

raggiungere a partire dallo stato zero; ciò significa che il concetto di raggiungibilità dallo

stato zero è più generale del concetto di raggiungibilità a partire da uno stato S non nullo,

per cui diciamo che se uno stato x~ è raggiungibile dallo stato zero, allora è anche

raggiungibile da qualsiasi stato S non nullo e viceversa.

Gramiano di raggiungibilità: Si definisce Gramiano di Raggiungibilità la matrice

∑−

===

1

0)(

k

i

iTTiTkkk ABBARRρ

e si dimostra che

• kρ è simmetrica: Tkk ρρ =

• kρ è semidefinita positiva: 0≥kρ

Teorema: Lo spazio immagine della matrice kρ è uguale allo spazio immagine della

matrice di raggiungibilità:

kkk R ℜ== )Im()Im(ρ

per cui

nlperRR nnll ≥ℜ=== )Im()Im()Im(ρ

quindi un sistema LTI-TD è raggiungibile se e solo se

0)det()( ≠⇒= nn nrango ρρ

Quest’ultima relazione può essere usata in sostituzione della 6.5) quando si ha a che fare

con sistemi MIMO, per i quali la 6.4) non può essere applicata.

Teorema: Il sottospazio di raggiungibilità è A-invariante:

rrrr XAXXAxXxse ⊆⇒∈⇒∈

dim:

[ ]BABBABARrangeX nnnr 21Im)( −−== quindi un vettore x di Xr è combinazione lineare delle colonne di Rn; pre-moltiplicando x

con la matrice A si ottiene un vettore che è combinazione lineare delle colonne di

[ ]BABBABA nn 1−

29

ma per Cailey-Hamilton la prima colonna è combinazione lineare delle precedenti per

cui

[ ]BABBABAAx nnr 21Im −−∈

6.2 Decomposizione standard per sistemi non completamente raggiungibili

(Decomposizione di Kalman di raggiungibilità)

Consideriamo un sistema LTI-TD non completamente raggiungibile e supponiamo di

voler evidenziare e separare la parte irraggiungibile da quella raggiungibile (se esiste).

Ciò può essere ottenuto mediante una trasformazione per similitudine ottenuta con un

cambiamento di coordinate che fa uso di un’opportuna matrice di trasformazione T.

Questa matrice di trasformazione deve essere tale da farci ottenere una rappresentazione

equivalente del tipo

ℜ∈ℜ∈

= −rn

r

zz

conkzkz

z2

1

2

1

)()(

mrrnrnrnrrr BAAA

kuB

kzkz

AAA

kzkz

×−×−−×× ℜ∈ℜ∈ℜ∈ℜ∈

+

=

++

1)()(

2)(

121

1

2

1

2

121

2

1 )(0)(

)(0)1(

)1(

6.6)

dove le z1 sono le componenti del vettore di stato sulle quali si ha un’azione diretta

dell’ingresso e pertanto sono le componenti modificabili per raggiungere o controllare uno

stato; le componenti z2 sono, invece, quelle non modificabili né tramite l’ingresso né

tramite le altre componenti z1.

Quindi il sistema

)()()()1( 1212111 kuBkzAkzAkz ++=+

rappresenta il sottosistema raggiungibile del sistema dato e gli autovalori di A1 si dicono

autovalori raggiungibili.

Il sottosistema non raggiungibile è, invece, il seguente

)()1( 222 kzAkz =+

è gli autovalori di A2 si dicono autovalori irraggiungibili.

Vediamo adesso come è composta la matrice T che mi permette di ottenere una simile

decomposizione; se il sistema non è completamente raggiungibile significa che

nrXnrRRa rn

30

Queste colonne saranno le prime r colonne della matrice T; le restanti n-r colonne

saranno composte da vettori linearmente indipendenti tra di loro e con le prime r colonne

di T.

ATTTTAATATATTAxTzTzx

][][ 21211

1

=⇒=⇒==⇒=

−

−

T1 è la base dello spazio di raggiungibilità per cui AT1appartiene ancora a tale spazio e

quindi, visto che lo spazio Xr ha dimensione r, sarà del tipo

=

01

1

AAT

Il seguente schema a blocchi è una rappresentazione grafica della decomposizione di

Kalman di raggiungibilità o controllabilità

u z1(k+1) z1(k)

B1 Delay

A1

A12 z2(k)

Delay

A2

Da notare come le componenti z1 non abbiano influenza alcuna sulle z2 le quali

risultano, quindi, irraggiungibili.

6.3 Test modali di raggiungibilità

Quando si ha a che fare con sistemi non completamente raggiungibili di dimensioni

elevate, applicare la decomposizione standard di Kalman può risultare molto laborioso; in

questi casi si possono distinguere gli autovalori raggiungibili e non raggiungibili, mediante

i cosiddetti test modali di raggiungibilità.

31

Teorema 1: Un sistema LTI-TD è non raggiungibile se e solo se esiste qualche

autovettore sinistro della matrice A

0)(: '' =− AIλϖϖ che è ortogonale a B:

0' =Bϖ L’autovalore corrispondente a tale autovettore è irraggiungibile.

Dim:

• Supponiamo che esista un autovettore sinistro di A ortogonale a B

000)(: '''' ≠==− ϖϖλϖϖ conBeAI Dalle precedenti relazioni si ottiene

[ ] 0000

'21'

'''''

=⇒=⇒≥=⇒=⇒=

−−n

kk

k

RBABBABAkBABABA

ϖϖϖλϖϖλϖϖ

e cioè che il rango della matrice Rn non è n ma è minore, per cui il sistema non è

completamente raggiungibile.

• Supponiamo, ora, che il sistema non sia completamente raggiungibile ossia che

nRrangonRRa nn

32

N.B.: Nel caso in cui una matrice M non è quadrata, per vedere se perde di rango si può

calcolare il determinante di (MTM) e verificare se si annulla; se il determinante si annulla

allora la matrice M non ha rango massimo.

6.4 Raggiungibilità per sistemi TC

Uno stato x~ di un sistema TC si dice raggiungibile (a partire dallo stato zero)

all’istante L 0≥ se esiste un ingresso u definito in [0.L] tale che

xLx f ~)( =

Un sistema TC in cui tutti gli stati sono raggiungibili si dice sistema completamente

raggiungibile.

Vediamo, dalle formule di Lagrange, come è fatta la risposta forzata

∫−=

ttA

f dBuetx0

)( )()( τττ

e definiamo il seguente integrale

∫ >===+==< )(),( ττρ

Si dimostra che

• simmetricaèLρ

• 0≥Lρ

33

Teorema: Lo spazio di raggiungibilità è dato da

∫==L

TLr dFFRaRaX

0

)()([)( τττρ ]

Teorema: Il range del gramiano di raggiungibilità coincide con il range della matrice

di raggiungibilità Rn anche per i sistemi TC

][)( 21 BABBABARaRa nnL−−=ρ

per cui un sistema TC è completamente raggiungibile se e solo se

nRrango n =)(

N.B.: è conveniente usare la matrice Rn per studiare la raggiungibilità di un sistema

LTI-TC in quanto questa matrice è indipendente dall’istante considerato.

Inoltre anche per i sistemi TC ogni stato che è raggiungibile dallo stato zero, lo è anche

da qualsiasi stato diversa da zero.

6.5 Controllabilità per sistemi LTI-TD

Vogliamo, in questo paragrafo, affrontare il problema della controllabilità allo stato zero

di un generico stato di un sistema LTI-TD; in pratica, dato uno stato iniziale x~ ci

proponiamo di determinare, se esiste, una successione di k valori del segnale di ingresso in

grado di annullare lo stato del sistema.

Se questa successione di k valori esiste allora lo stato x~ si dice controllabile in k passi.

In pratica dalle formule di lagrange si deduce che uno stato x~ è controllabile in k passi

se e solo se esiste una successione di k valori dell’ingresso

tale da soddisfare la seguente relazione

kkk

kkk URxAURxAkx =−⇒+== ~~0)(

Nel caso di sistemi TD completamente controllabili, l’esistenza di tale successione

dipende molto dalle caratteristiche del sistema ed in particolare della matrice A; infatti si

possono distinguere due casi:

1) Se la matrice A è invertibile, la soluzione di controllabilità coincide con quella di

raggiungibilità; in questo caso infatti ad ogni stato raggiungibile mi corrisponde uno ed

uno solo stato controllabile mediante la relazione

34

rk

kkk

c xAURAx ~~−− −=−=

in pratica cx~ è combinazione lineare delle colonne l.i. di A-k con coefficienti gli

elementi di rx~

2) Se la matrice A non è invertibile la soluzione di controllabilità coincide con quella

di raggiungibilità se e solo se è soddisfatta la seguente condizione

)()( nn RRaARa ⊂

Nei sistemi TD, un sistema raggoungibile e’ sempre anche controllabile, ma puo’

esistere un sistema non completamente raggiungibile che e’ controllabile.

Nei sistemi TC, invece, controllabilità e raggiungibilità coincidono sempre.

6.6 Osservabilità per i sistemi LTI-TD

Supponiamo di avere un sistema lineare tempo-discreto del quale conosciamo una

sequenza di k valori dell’ingresso applicati in istanti successivi e la corrispondente

sequenza dei valori dell’uscita.

Ci chiediamo: è possibile, note le informazioni sull’ingresso e sull’uscita, determinare

lo stato iniziale del sistema?

Tale problema è conosciuto come problema dell’osservabilità di uno stato del sistema.

Definizione: Uno stato q di un sistema dinamico è detto non osservabile nell’intervallo

[0,T) se, con x(0)=q e ),0[)( Ttx ∈∀ , si ottiene la stessa uscita y(t) che si otterrebbe a

partire da x(0)=0.

Si parla di sistema completamente non osservabile, o semplicemente non osservabile, se

tutti gli stati sono non osservabili. In tal caso non è possibile determinare univocamente la

condizione iniziale x(0) note le informazioni sugli ingressi e sulle uscite.

Vediamo di determinare una condizione che ci permetta di stabilire quando un sistema è

osservabile.

Consideriamo un sistema LTI-TD di equazioni

)()()()()()1(

kDukCxkykBukAxkx

+=+=+

dalle formule di Lagrange si ricava

35

)()0()()()(

)0()()0()(1

0

1

kDuUCRxCAkDukCxky

URxAlBuAxAkx

kkk

k

lkk

klkk

++=+=

+=+= ∑−

=

−−

Dall’equazione che descrive l’evoluzione dell’uscita del sistema notiamo che oltre

l’uscita, che è nota, figura l’ingresso u(k), anch’esso noto, e la nostra incognita

rappresentata dallo stato x(0) (composto da n componenti se la rappresentazione è di ordine

n); quindi lo stato iniziale potrebbe essere valutato come soluzione di un sistema lineare di

n equazioni in n incognite ottenuto dall’espressione di y(k) considerata in n istanti di tempo

successivi, in corrispondenza dei quali si conoscono i valori dell’ingresso e dell’uscita del

sistema (in pratica supponiamo di osservare l’uscita del sistema man mano che

applichiamo la successione di n valori in ingresso e per ogni instante di tempo ci scriviamo

l’equazione dell’evoluzione dell’uscita con al posto di y(k) e x(k) i valori assunti all’istante

k considerato). Tale sistema è dato da

kkk

k

DUUCRkykydove

nkxCAky

−−=

−==

)()(~

1,...,1,0)0()(~

e può essere scritto in forma compatta nel seguente modo

)0()0(~

1

2 xx

CA

CACAC

Y n

n

k θ=

=

−

6.7).

L’incognita x(k) è univocamente determinata se e solo se la matrice nθ , che prende il

nome di matrice di osservabilità del sistema, ha rango massimo ossia

nrango n =)(θ

per cui possiamo concludere che un sistema LTI-TD di ordine n è completamente

osservabile se e solo se la matrice di osservabilità nθ è tale che

• SISOcason 0)det( ≠θ

• MIMOcasonTn 0)det( ≠θθ

Si osservi come la 6.7) assomigli a quella che è la risposta libera nell’uscita del sistema,

per cui l’osservabilità di uno stato iniziale x(0) può essere verificata anche nell’ipotesi

semplificativa che il sistema non sia forzato (ingresso nullo); in tal caso

)()(~ kyky =

36

Valgono i seguenti teoremi:

Teorema 1: Il sistema è completamente osservabile se e solo se il nucleo( nθ )={0}.

Dim: Se il nucleo( nθ )=Kerr( nθ )≠{0} allora tutti gli stati appartenenti a tale nucleo

sarebbero non osservabili, in quanto

0)( =⇔∈ xnucleox nn θθ

Quindi il sottospazio di non osservabilità coincide con lo spazio nullo della matrice di

osservabilità e si indica con oX .

Teorema 2: Lo spazio nullo di ( nθ ) è uguale allo spazio nullo di ( 1+nθ ), cioè

)()( 1+= nn NN θθ ; inoltre nkNN nk ≤⊆ )()( θθ .

Dim: Dal teorema di Cailey-Hamilton

∑∑−

=+

−

+

−

=

≥==

=⇒=⇒=1

01

1

2

1

1

0)()()(

n

ilnn

n

n

ni

in

n

i

ii

n nlperNNNallora

CACA

CACAC

seCACAAA θθθθαα

Ciò significa che, qualunque sia l'istante di tempo considerato purché questo non risulti

inferiore a n, lo spazio degli stati non osservabili e lo stesso.

N.B.: Non è possibile osservare uno stato a partire da una sequenza d’ingresso e di

uscita di lunghezza inferiore alla dimensione del sistema in quanto il numero di equazioni

del sistema 6.7) sarebbe inferiore al numero delle incognite per cui lo stesso sistema non

ammetterebbe soluzione.

Teorema 3: Un sistema è osservabile in l passi (l≥n) se e solo se è osservabile in n

passi.

6.7 Decomposizione standard per sistemi non osservabili (Decomposizione di Kalman di

osservabilità)

Consideriamo un sistema LTI-TD non completamente osservabile e supponiamo di

voler evidenziare e separare la parte non osservabile da quella osservabile (se esiste).

Ciò può essere ottenuto mediante una trasformazione per similitudine ottenuta con un

cambiamento di coordinate che fa uso di una opportuna matrice di trasformazione T.

Questa matrice di trasformazione deve essere tale da farci ottenere una rappresentazione

equivalente del tipo

37

ℜ∈ℜ∈

= −on

o

zz

conkzkz

z2

1

2

1

)()(

[ ]moonononooo BAAA

kDukzkz

Cky

kBukzkz

AAA

kzkz

×−×−−×× ℜ∈ℜ∈ℜ∈ℜ∈

+

=

+

=

++

1)()(

2)(

121

2

11

2

1

221

1

2

1

)()()(

0)(

)()()(0

)1()1(

6.8)

dove le z1 sono le componenti del vettore di stato che ci ritroviamo in uscita e pertanto

sono le componenti osservabili attraverso y(k); in pratica sono le prime “no” componenti

del vettore di stato dove “no” è la dimensione del sottospazio osservabile; le componenti

z2 sono, invece, quelle non osservabili né attraverso l’uscita né attraverso le z1.

Quindi il sistema

)()()()()()1(

11

1111

kDukzCkykuBkzAkz

+=+=+

rappresenta il sottosistema osservabile del sistema dato e gli autovalori di A1 si dicono

autovalori osservabili.

Il sottosistema non osservabile è, invece, il seguente

)()()()1( 2221212 kuBkzAkzAkz ++=+

è gli autovalori di A2 si dicono autovalori non osservabili.

Vediamo adesso come è composta la matrice T che mi permette di ottenere una simile

decomposizione; se il sistema non è completamente osservabile significa che

nnXnnrango ooon

38

ATTTTAATATATTAxTzTzx

][][ 21211

1

=⇒=⇒==⇒=

−

−


Kalman di osservabilità

u(k) z1(k+1) z1(k) y(k)

B1 Delay C1

A1

A21

z2(k+1) z2(k)

B2 Delay

A2

Da notare come le componenti z2 non abbiano legame alcuno con l’uscita e quindi sono

non osservabili.

In molti casi si può avere a che fare con sistemi che sono contemporaneamente non

osservabili e non raggiungibili; in questi casi per determinare la parte osservabile e/o

raggiungibile del sistema, si può procedere in due modi

• Studiare separatamente la raggiungibilità e l’osservabilità mediante le rispettive

decomposizioni

• Fare un’unica decomposizione mediante un’opportuna matrice T

In pratica si può procedere prima con una decomposizione in forma standard di

raggiungibilità sulla quale si effettua, dopo, un’ulteriore decomposizione standard

d’osservabilità; oppure si opera un’unica opportuna trasformazione di coordinate che mi

permetta di ottenere una rappresentazione del tipo

39

[ ] )(

)()()()(

00)(

)(

00

)()()()(

00000

00

)1()1()1()1(

4

3

2

1

31

2

1

4

3

2

1

4443

33

24232221

1311

4

3

2

1

kDu

kzkzkzkz

CCky

kuBB

kzkzkzkz

AAA

AAAAAA

kzkzkzkz

+

=

+

=

++++

dove le

• z1(k) sono le componenti raggiungibili ed osservabili

• z2(k) sono le componenti raggiungibili e non osservabili

• z3(k) sono le componenti non raggiungibili ed osservabili

• z4(k) sono le componenti non raggiungibili e non osservabili

Pertanto, gli autovalori di

• A11 sono raggiungibili e osservabili

• A22 sono raggiungibili e non osservabili

• A33 sono non raggiungibili e osservabili

• A44 sono non raggiungibili e non osservabili

Se supponiamo che

{ } { } { } 0dim0)()( 0

≠∩⇒≠∩==

oror

nrn

XXXXnrangoenRrango θ

allora la matrice che ci permette di ottenere tale rappresentazione è del tipo

[ ]

{ }{ }

{ }{ } esisteseXXersezionespaziodellobaseindiplinvettori

esisteseXXersezionespaziodellobasevv

esisteseXXersezionespaziodellobasevv

esisteseXXersezionespaziodellobasevvdove

vvindiplinvettorivvvvTxTzTzx

or

ori

ornkn

orri

nknrii

∩=

∩=

∩=

∩=

==⇒=

−

+

−+

−

int..

int

int

int

..

1

1

11

1


Kalman di raggiungibilità e osservabilità

40

u(k) ∑ro y(k)

∑ or

∑ or

∑ or

6.8 Test modali d’osservabilità

Quando si ha a che fare con sistemi non completamente osservabili di dimensioni

elevate, applicare la decomposizione standard di Kalman può risultare molto laborioso; in

questi casi si possono distinguere gli autovalori osservabili e non osservabili, mediante i

cosiddetti test modali d’osservabilità.

Teorema 1: Un sistema LTI-TD è non osservabile se e solo se esiste qualche

autovettore destro della matrice A

0)(: '' =− ϖλϖ AI che è ortogonale a C:

0' =Cϖ L’autovalore corrispondente a tale autovettore è non osservabile.

Teorema 2: Un sistema è irraggiungibile se e solo se la matrice

−C

AzI

perde di rango per qualche autovalore della matrice A; tali autovalori sono quelli

irraggiungibili.

41

6.9 Teorema della dualità di Kalman

Dato un sistema LTI, supponiamo di avere una rappresentazione nello spazio degli stati

descritta da

{ }∑= DCBA ,,, Si definisce rappresentazione duale la seguente

{ }

,,,,

,,,TTTT DDBCCBAAdove

DCBA

====

=∗∗∗∗

∗ ∗∗∗∗∑

Kalman ha dimostrato che

• ( ) ∑∑ =∗∗ e cioè il duale del sistema duale è il sistema stesso • Tnn

Tnn ReR ==

∗∗ θθ , perciò se si vuole studiare la raggiungibilità

(osservabilità) di un sistema basta studiare l’osservabilità (raggiungibilità) del suo duale.

6.10 Forme canoniche di controllabilità e d’osservabilità

Forma canonica di raggiungibilità e controllabilità

Supponiamo di avere un sistema LTI, completamente raggiungibile, descritto da

un’equazione differenziale del tipo

Si chiama forma canonica di raggiungibilità una rappresentazione nello spazio degli

stati del tipo

Tale forma canonica, che prende anche il nome di 1° forma canonica di raggiungibilità,

si può ottenere da una generica rappresentazione mediante una trasformazione di

coordinate del tipo

)()()()()()( 111 tTztzRRtxtxRRtz nnnn ==⇒=−−−

42

dove Rn è la matrice di raggiungibilità del sistema.

Esiste una 2° forma canonica di raggiungibilità dove la matrice A è del tipo

Forma canonica di osservabilità

Supponiamo di avere un sistema LTI, completamente osservabile, descritto da

un’equazione differenziale del tipo

Si chiama forma canonica di osservabilità una rappresentazione nello spazio degli stati

del tipo

Tale forma canonica si può ottenere da una generica rappresentazione mediante una

trasformazione di coordinate del tipo

)()()()()()( 111 tTztztxtxtz nnnn ==⇒=−−− θθθθ

dove nθ è la matrice di osservabilità del sistema.

N.B.: Le forma canoniche si ottengono immediatamente dalle rappresentazioni ingresso

uscita di un sistema LTI; ciò suggerisce un altro metodo per ottenere una rappresentazione

i/u di un sistema a partire da una sua rappresentazione i/s/u.

6.11 Minimalità dei sistemi LTI

Definizione: Un rappresentazione di un sistema LTI si dice in forma minima quando

non è possibile ottenere una nuova rappresentazione che utilizza un numero minore di

variabili di stato.

43

Teorema 1: Condizione necessaria e sufficiente affinché un sistema sia in forma

minima è che il sistema sia completamente osservabile e completamente raggiungibile.

Teorema 2: La matrice di trasferimento, e di conseguenza la matrice delle risposte

impulsive, di un sistema LTI dipendono solo dalla sua parte completamente osservabile e

completamente raggiungibile.

)()()()()()()()(

111111

111

1111

11111

kDBACkhDBAzICsHtDBeCthDBAsICsH

k

tA

∂+=⇒+−=

∂+=⇒+−=−

−

Teorema 3: Un sistema non è completamente osservabile e/o completamente

raggiungibile se e solo se nella sua f.d.t. sono presenti cancellazioni tra binomi comuni a

numeratore e a denominatore.

Da questi teoremi si possono trarre alcune importanti considerazioni:

• I poli della f.d.t. di un sistema coincidono con gli autovalori della parte

completamente osservabile e completamente raggiungibile, salvo cancellazioni.

Ciò significa che gli autovalori non raggiungibili e/o non osservabili non compaiono,

come poli, nella f.d.t. del sistema per cui non sono visibili esternamente; gli unici

autovalori a comparire come poli nella f.d.t. del sistema sono quelli completamente

osservabili e completamente raggiungibili.

• Se un sistema è solo non raggiungibile tutto gli autovalori che si cancellano sono

non raggiungibili.

• Se un sistema è solo non osservabile tutto gli autovalori che si cancellano sono

non osservabili.

• Se un sistema non ha almeno un autovalore osservabile e raggiungibile la sua

f.d.t è nulla.

• Se il sistema è non osservabile e non raggiungibile non possiamo dire nulla sugli

autovalori che si cancellano

• Un sistema asintoticamente stabile è anche BIBO stabile, mentre, un sistema

BIBO stabile è anche asintoticamente stabile se e solo esso è in forma minima.

Infatti, se il sistema non è in forma minima ci sono degli autovalori di A che non

figurano esternamente; se questi autovalori sono gli unici autovalori instabili, il sistema

risulta BIBO stabile, ma non asintoticamente stabile perché ci sono delle comportamenti

interni indesiderati (divergenza delle componenti dello stato del sistema che non sono

osservabili dall’uscita).

44

• La stabilità marginale non è in grado di garantirmi la BIBO stabilità, tuttavia,

un sistema marginalmente stabile in cui gli autovalori nulli o con modulo unitario sono

irraggiungibili o non osservabili è BIBO stabile

7 STABILIZZAZIONE TRAMITE RETROAZIONE DELLO STATO

Consideriamo un sistema LTI strettamente proprio (D=0) del quale conosciamo lo stato

iniziale x(0) e supponiamo che in ingresso e in uscita non agisca alcun disturbo; la

descrizione nello spazio degli stati del nostro sistema è la seguente

)()()( tButAxtx +=•

Supponiamo che la matrice A ammetta autovalori instabili, per cui il nostro sistema

presenta comportamenti interni e/o esterni indesiderati; ci proponiamo di stabilizzare il

nostro sistema, cioè di ottenere, dal sistema di partenza, un sistema che abbia un

comportamento ingresso-uscita equivalente ma con autovalori stabili.

Ciò può essere ottenuto mediante un’opportuna retroazione dello stato del tipo

evidenziato in figura

v(t) u(t) ∑ x(t) C y(t)

F

In questo caso l’ingresso u(t) del nostro sistema sarà dato da nmFtvtFxtu ×ℜ∈+= )()()( Legge di controllo

Per cui la rappresentazione del sistema controllato sarà la seguente

)()()()()()()(

tCxytBvtxAtBvtxBFAtx CL

=+=++=

•

Per stabilizzare il sistema, allora, basta scegliere opportunamente la matrice F in modo

che gli autovalori della matrice ACL siano quelli desiderati.

Domanda: E’ sempre possibile stabilizzare un sistema instabile, ossia è sempre

possibile determinare una matrice di retroazione F che sia in grado di posizionarmi gli

autovalori di A nel semipiano sinistro del piano complesso (TC) o all’interno del cerchio

45

unitario (TD)? E’ sempre possibile scegliere arbitrariamente una matrice di retroazione F

in modo che gli autovalori della matrice A+BF siano assegnati ad arbitrio?

Risposta: No, salvo che non sia verificata una delle due condizioni

• Il sistema sia completamente raggiungibile

• Eventuali autovalori irraggiungibili siano asintoticamente stabili.

Per dimostrare quanto detto enunciamo il seguente teorema:

Teorema: Esiste una matrice F tale che

7.1)

per ogni possibile insieme di numeri complessi-coniugati o reali, se e solo se la coppia

(A,B) è completamente raggiungibile.

Dim. necessaria: Supponiamo che la coppia (A,B) non sia completamente

raggiungibile; ciò significa che esiste un autovettore sinistro di A, ωi’, ortogonale a B:

iiiiii

iiii

ABFABFABA

ϖλϖϖϖϖϖϖλϖ

==+=+⇒==

)(0

In pratica ogni autovalore irraggiungibile di A è autovalore irraggiungibile per (A+BF),

il che significa che gli autovalori irraggiungibili di A non possono essere posizionati ad

arbitrio; quindi, nell’ipotesi che il sistema sia irraggiungibile, esso è stabilizzabile se e

solo se gli autovalori irraggiungibili sono asintoticamente stabili.

Studiare la stabilizabilità di un sistema significa, quindi, determinare eventuali

autovalori irraggiungibili e vedere se sono stabili o meno.

Dim. sufficiente: Supponiamo che la coppia (A,B) sia raggiungibile e vediamo se

riusciamo a trovare una matrice F che soddisfa la 7.1).

Se il sistema è completamente raggiungibile allora esiste una matrice di trasformazione 1~ −= nn RRT

che riporta il sistema in forma canonica di raggiungibilità

46

[ ]110

110 10

00

10000

0100010

~−

−

=

=

−−−

= n

n

cccCB

aaa

A

dove i termini 10 ,......, −naa sono i coefficienti del polinomio caratteristico della matrice

di partenza

011

1 .......)det()( aaaAIPn

nn ++++=−= −− λλλλλ 7.2)

Supponiamo di applicare questa trasformazione di coordinate e successivamente di

retrazionare lo stato tramite una matrice

[ ]nfffF ~~~~ 21= La matrice ACL del sistema controllato sarà

+−+−+−

=+=

− nn

CL

fafafa

FBAA

~~~1000

00100010

)~~~(

12110

e, dato che il polinomio caratteristico è invariante rispetto ad una trasformazione per

similitudine, vogliamo che gli autovalori di tale matrice coincidano con gli autovalori

desiderati nidi ,.....,2,1=µ .

In pratica dobbiamo determinare la matrice F~ che soddisfa la condizione

)(.......

)()~()~(.......)~()]~~~(det[

011

1

11021

11

λλλλ

µλλλλλ

dddnd

nn

n

i

di

nnn

n

Paaa

fafafaFBAI

=++++=

=−=−+−++−+=+−

−−

=

−− ∏

dalla quale si ricava

−=

−=−=

−−−

−−

d

dnnn

dnnn

aaf

aafaaf

001

221

11

~

~~

La matrice di retroazione F che soddisfa la 7.1) può allora essere determinata

riportandoci alle vecchie coordinate come mostrato di seguito: 111 ~)()(~)()(~)()()( −−− =⇒+=+=⇒= TFFtvtxTFtvtzFtutxTtz .

47

Riassumendo: Un sistema LTI è stabilizzabile se e solo se

• è completamente raggiungibile

• eventuali autovalori irraggiungibili sono asintoticamente stabili

La stabilizzazione è ottenuta mediante una retroazione dello stato che fa uso di una

matrice di retroazione F calcolabile nei tre modi mostrati di seguito:

• imponendo la condizione

[ ]n

n

i

did

fffFdove

PBFAI

21

1

)()()](det[

=

−==+− ∏=

µλλλ

autovalori desiderati (stabili)

Otteniamo, in questo modo, un sistema di n equazioni in n incognite che sono gli

elementi della matrice F.

tale metodo è applicabile sia a sistemi completamente raggiungibili sia non

completamente raggiungibili.

• Mediante la formula di ACKERMAN:

necon

APReF dnT

=

−= −

0

01

)(

1

11

• Se il sistema non è completamente raggiungibile si decompone nella forma

standard di raggiungibilità di Kalman; quindi una volta determinato il sottosistema

raggiungibile si determina, per esso, una matrice di retroazione Fr con uno dei due metodi

sopra mostrati, oppure con il metodo costruttivo della dimostrazione. Una volta

determinata la matrice Fr la si completa con n-r colonne nulle in modo da ottenere la

matrice F.

( ) ( )[ ]0mindet

ˆ,ˆ,ˆˆ,ˆ,ˆtan)(

rr

rrr

n

FFFazioneerCBAileraggiungibmasottosisteCBA

ilitàraggiungibdardsionedecomposizrRrango

=⇒⇒⇒

⇒⇒=

48

8 CONTROLLORI BASATI SUL MODELLO

Nel precedente paragrafo abbiamo visto come è possibile stabilizzare un sistema

mediante una retroazione dello stato, nell’ipotesi che esso sia completamente accessibile e

quindi noto.

Purtroppo, visto che le variabili di stato generalmente sono delle variabili interne, non

sempre lo stato del sistema è completamente noto; in effetti nella maggior parte dei casi

risultano accessibili soltanto alcune componenti, per cui è impossibile operare una

stabilizzazione se prima non si effettua una “misura” dello stato del sistema.

Tale misura può essere ottenuta direttamente dall’uscita dato che questa è una

combinazione lineare delle componenti dello stato del sistema (caso SISO)

)()()( tDutCxty += In pratica si tratta di stimare lo stato, in quanto si parla di stima proprio quando si riesce

a misurare le variabili di stato non accessibili attraverso l’uscita del sistema.

Ma come si effettua una stima x̂ dello stato x del sistema?

Attraverso un sistema dinamico che prende il nome di Osservatore dello stato del

sistema.

Un Osservatore dello stato del sistema è un simulatore, in tempo reale, del sistema; in

pratica è un sistema dinamico che riceve in ingresso lo stesso ingresso del sistema u(t) e,

in base ad un fattore di correzione che dipende dall’uscita y(t) del sistema, fornisce in

uscita una stima x̂ dello stato del sistema. Un osservatore si dice asintotico quando è

verificata la seguente condizione:

xxt

=∞→

ˆlim

Prima di vedere come si progetta un osservatore vediamo invece come osservatore e

controllore sono collegati al sistema da stabilizzare

Consideriamo ora il nostro sistema da stabilizzare descritto dalle seguenti relazioni

49

+=+=

•

)()()()()()(

tDutCxtytButAxtx

Sulla base del sistema l’osservatore sarà descritto dalle seguenti relazioni

+=−−+=

•

)()(ˆ)(ˆ)](ˆ)([)()(ˆ)(ˆ

tDutxCtytytyLtButxAtx 8.1)

Inizialmente i due vettori di stato, quello reale e quello stimato, saranno diversi per cui

saranno diverse anche le uscite )(ˆ ty e )(ty ; al divergere del tempo, però, se l’osservatore

è asintotico, tale differenza si annullerà per cui i due stati tendono a coincidere per t

sufficientemente grande.

Possiamo definire un vettore errore nella stima dello stato

)(ˆ)()(~ txtxtx −=

in base al quale le 8.1) diventano

)()(ˆ)(ˆ)()()(

)](ˆ)([)()(ˆ)()()(~

tDutxCtytDutCxty

tytyLtButxAtButAxtx

+=+=

−+−−+=•

per cui

0)0(ˆ)0()0(~)0(~)(~)(~)()]()(ˆ)()([)(~)(~

)( ≠−==⇒+=+−++=

+

•

xxxconxetxtxLCAtDutxCtDutCxLtxAtx

tLCA 8.2)

Queste relazioni mostrano che il vettore errore, e quindi la stima, non dipendono

dall’ingresso u(t) del sistema; inoltre mostrano che, affinché l’errore della stima si estingua

nel tempo (ossia il nostro osservatore sia asintotico) è necessario determinare una matrice

L tale che la matrice (A+LC) abbia autovalori tutti asintoticamente stabili.

Domanda: E’ sempre possibile stimare lo stato di un sistema, ossia è sempre possibile

determinare una matrice di osservazione L che sia in grado di posizionarmi gli autovalori

di (A+LC) nel semipiano sinistro del piano complesso (TC) o all’interno del cerchio

unitario (TD)? E’ sempre possibile scegliere arbitrariamente una matrice di osservazione

L in modo che gli autovalori della matrice A+LC siano assegnati ad arbitrio?

Risposta: No, salvo che non sia verificata una delle due condizioni:

• Il sistema sia completamente osservabile

• Eventuali autovalori non osservabili siano asintoticamente stabili.

Per dimostrare quanto detto enunciamo il seguente teorema:

50

Teorema: Esiste una matrice L tale che

8.3)

per ogni possibile insieme di numeri complessi-coniugati o reali ),,.........( 1 nµµ , se e

solo se la coppia (A,C) è completamente osservabile.

La validità di questo teorema si basa sul fatto che ogni autovalore non osservabile di A è

autovalore non osservabile per (A+LC) per cui gli autovalori di (A+LC) sono posizionabili

ad arbitrio se e solo se sono osservabili; se vi sono degli autovalori non osservabili ed

instabili il nostro osservatore non sarà asintotico; quindi, nell’ipotesi che il sistema sia non

osservabile, esso è misurabile se e solo se gli autovalori non osservabili sono

asintoticamente stabili.

Studiare la misurabilità di un sistema significa, quindi, determinare eventuali

autovalori non osservabili e vedere se sono stabili o meno.

Come si fa a determinare la matrice L in modo che (A+LC) abbia tutti autovalori

desiderati, ossia stabili?

Si può procedere nei tre modi seguenti:

• imponendo la condizione

n

n

i

did

l

ll

Ldove

PLCAI

2

1

1

)()()](det[

=

−==+− ∏=

µλλλ

autovalori desiderati (stabili)

Otteniamo, in questo modo, un sistema di n equazioni in n incognite che sono gli

elementi della matrice L.

Tale metodo è applicabile sia a sistemi completamente osservabili sia non

completamente osservabili.

• Mediante la formula di ACKERMAN:

51

necon

eAPF

n

nnd

=

−= −

1

00

)( 1θ

• Se il sistema non è completamente osservabile si decompone nella forma

standard di osservabilità di Kalman; quindi una volta determinato il sottosistema

osservabile si determina, per esso, una matrice di osservazione Lr con uno dei due metodi

sopra mostrati, oppure con il metodo costruttivo della dimostrazione. Una volta

determinata la matrice Lr la si completa con n-r colonne nulle in modo da ottenere la

matrice L.

( ) ( )[ ]0mindet

ˆ,ˆ,ˆˆ,ˆ,ˆtan)(

rr

rrr

n

LLLazioneerCBAeosservabilmasottosisteCBA

ilitàraggiungibdardsionedecomposizrrango

=⇒⇒⇒

⇒⇒=θ

N.B.: Nel determinare la matrice L (o Lr) con il metodo

costruttivo si può sfruttare il principio di dualità di Kalman mediante il quale è possibile

posizionare gli autovalori della matrice di osservazione L mediante posizionamento degli

autovalori della matrice di retroazione F* del sistema duale; in pratica ∗∗∗ =⇒+=+=+ FLLBALCALCA TTTTTT )()()(

Ovviamente la matrice F* viene trovata assegnandole gli

autovalori desiderati per l’osservatore.

Mettiamo insieme ora Sistema-Osservatore-Controllore:

+=

+=+=

•

•

eosservatortxLCAtx

sistematDutCxtytButAxtx

)(~)()(~

)()()()()()(

Progettiamo la retroazione:

)()(~)]([)()(

)()](~)([)()()(~)()()(ˆ)(

tBrtxBFtFxBtAxtu

trtxtxFtutrtxFtFxtrtxFtu

+−+=

⇒+−=⇒+−=+=•

Definendo lo stato complessivo

52

)(~)(txtx

si ottiene

[ ] 0')(0)(

)(0)(~

)(0)(~

)(

==

+

+−+

=

•

•

DcheipotesinelltxCty

trB

txtx

LCABFBFA

tx

tx 8.4)

Gli autovalori del controllore basato sul modello saranno dati da

)()()](det[)](det[)det( λλλλλ d eosservatord

controlloCL PPLCAIBFAIAI ×=+−×+−=−

Quest’ultimo risultato, noto come teorema di separazione tra stima e controllo, mostra

come si possa eseguire separatamente il progetto del controllore e dell’osservatore.

Se calcoliamo la funzione di trasferimento complessiva, a causa degli zeri del sistema

8.4) si ottiene

BBFAsICBFAsI

BBFAsIACAsIAsI

BAsIBFAsIACsH gg

contoss

ossgg

×+−×=

=+−

×+−×=

−×−×−×+−×

=

−1)]([

)](det[)]([

)det()det()det()]([

)(

Per cui ai fini del comportamento ingresso-uscita figurano solo gli autovalori del

controllore.

Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura ...laura.giarre/corso1/tds345.pdf1 Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura Giarrè 2.4.3 Matrici

Documents