Teoria Sistemelor Automate
Cristian Oara, Radu Stefan
Facultatea de Automatica si CalculatoareUniversitatea “Politehnica” Bucurestie-mail: {oara,stefan}@riccati.pub.roURL: http://www.riccati.pub.ro/
TEORIA SISTEMELOR AUTOMATE
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
1. Sisteme Dinamice pe Spatiul Starilor
2. Evolutia Starii, Tranzitia Intrare–Iesire
3. Echivalenta Sistemelor Liniare
4. Stabilitatea Sistemelor
5. Regimurile Permanent/Tranzitoriu/Stationar
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 1 SISTEME DINAMICE PE SPATIUL STARILOR
1. Sisteme Dinamice pe Spatiul Starilor
Clasa sistemelor considerate:
• LINIARE
• INVARIANTE IN TIMP
• FINIT DIMENSIONALE
• MULTI-INTRARE/MULTI-IESIRE (MIMO)
Definitia 1. Se numeste sistem dinamic liniar, invariant in timp, cu timpcontinuu un cuadruplu de matrici constante (A,B,C,D), unde A ∈ Rn×n,
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 2 Sisteme Dinamice pe Spatiul Starilor
B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m ce se expliciteaza prin{x(t) = Ax(t) +Bu(t), x(to) = xo
y(t) = Cx(t) +Du(t)(1)
unde x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp;u(t) → intrarea sistemului, u(·) ∈ U , U → spatiul functiilor (semnalelor) de intrare;y(t) → iesirea sistemului, y(·) ∈ Y, Y → spatiul functiilor (semnalelor) de iesire;x(t) → starea sistemului, x(·) ∈ X , X → spatiul starilor.
Observatii:• Sistemul dinamic astfel definit admite o scriere matriciala ce expliciteaza de faptun sistem de n ecuatii diferentiale cu n necunoscute (starile) iar iesirile sunt ocombinatie liniara a starilor si intrarilor (FIG);• Sistemul este automat invariant in timp, liniar, finit dimensional si cauzal !• Datorita invariantei in timp se poate lua intotdeauna to = 0 si deci conditiainitiala se rescrie x(0) = xo;
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 3 Sisteme Dinamice pe Spatiul Starilor
• Sistemul dinamic astfel definit se poate figura ca un sistem intrare–iesire in carestarea joaca rolul de variabila de cuplare (FIG) !• Sistemul este complet precizat de cele patru matrici (A,B,C,D);• Conditii uzuale: u(t) continua cel putin pe portiuni caz in care x(t) si y(t)rezulta functii continue;
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 4 Sisteme Dinamice pe Spatiul Starilor
2. Evolutia Starii, Tranzitia Intrare–Iesire
Prima ecuatie a sistemului
x(t) = Ax(t) +Bu(t), x(0) = xo
este in fapt un sistem de n ecuatii diferentiale ordinare cu n necunoscute avando solutie unica in cazul in care starea initiala xo si comanda u(t), t ≥ 0, suntprecizate (u(·) este continua pe portiuni). Din teoria ecuatiilor diferentiale ordinaresolutia rezulta
x(t) = ϕ(t, xo, u(·)) = eAtxo +∫ t
0eA(t−τ)Bu(τ)dτ
= ϕ(t, xo, 0) + ϕ(t, 0, u(·))= xℓ(t) + xf(t).
Functia ϕ : R × Rn × U → Rn se numeste functia de tranzitie a starii. Descom-punerea aditiva de mai sus pune in evidenta superpozitia efectelor (datorate starii
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 5 Evolutia Starii, Tranzitia Intrare–Iesire
initiale xo – regim liber – si respectiv comenzii u(·) – regim fortat).
Matricea
Φ(t) := eAt
se numeste matricea de tranzitie a starii. Cu aceasta notatie solutia sistemului deecuatii diferentiale se rescrie
x(t) = Φ(t)xo +
∫ t
0
Φ(t− τ)Bu(τ)dτ. (2)
Problema: Ce inseamna si cum se calculeaza eAt ?Avem prin definitie
ex = 1 +1
1!x+
1
2!x2 + . . .+
1
n!xn + . . .
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 6 Evolutia Starii, Tranzitia Intrare–Iesire
care in cazul matricial devine
eAt = In +1
1!(At) +
1
2!(At)2 + . . .+
1
n!(At)n + . . . . (3)
Calculul matricii de tranzitie a starii se bazeaza pe forma Jordan a matricii A si vafi explicitat mai tarziu.
Reversibilitatea timpului: Deoarece Φ(t) = 0, ∀t finit, obtinem din (2)
xo = Φ(−t)x(t)−∫ t
0Φ(−t)Φ(t− τ)Bu(τ)dτ
= Φ(−t)x(t)−∫ t
0Φ(−τ)Bu(τ)dτ
(4)
de unde rezulta ca in cazul sistemelor netede (cu timp continuu) starea initiala sepoate intotdeauna recupera daca se cunoaste “unde s-a ajuns” si comanda care agenerat starea respectiva. (FIG)
Iesirea sistemului se obtine imediat ca o combinatie liniara de intrari si stari sub
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 7 Evolutia Starii, Tranzitia Intrare–Iesire
forma (vezi (1) si (2))
y(t) = f(t, xo, u(·)) = CeAtxo +∫ t
0CeA(t−τ)Bu(τ)dτ
= f(t, xo, 0) + f(t, 0, u(·))= yℓ(t) + yf(t).
Matricile
T (t) := CΦ(t)B, Tc(t) :=
{0, t < 0,T (t), t ≥ 0
se numesc matricea pondere respectiv matricea de raspuns cauzal la impuls. Maimult
Tc(t) = T (t)1(t)
unde 1(t) := diag {1(t)} iar 1(t) este functia treapta (Heaviside). Cu acestenotatii
y(t) = CΦ(t)xo +
∫ t
0
Tc(t− τ)u(τ)dτ.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 8 Evolutia Starii, Tranzitia Intrare–Iesire
In particular daca xo = 0 obtinem
y(t) =
∫ t
0
Tc(t− τ)u(τ)dτ = yf(t)
ceea ce arata ca matricea de raspuns cauzal la impuls permite exprimarea iesiriiatunci cand conditia initiala este nula. Mai precis, in conditii initiale nule sistemuldinamic se poate exprima ca un sistem de convolutie sub forma
y(t) =
∫ ∞
−∞Tc(t− τ)u(τ)dτ = Tc(t) ∗ u(t),
(u = 0 pentru t < 0 si Tc(t− τ) = 0 pentru t− τ < 0). Daca m = p = 1 atunciTc(t) = hc(t) si are semnificatia de raspuns cauzal al sistemului atunci cand laintrare se aplica un impuls Dirac u(t) = δ(t).
Functie (Matrice) de Transfer
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 9 Evolutia Starii, Tranzitia Intrare–Iesire
Restrangem intrarile la clasa functiilor original, i.e., U ⊂ O. Atunci automat x(t)si y(t) vor fi functii original, i.e. X ⊂ O si Y ⊂ O. In aceste conditii aplicandtransformatele Laplace sistemului original (1) obtinem{
sx(s)− xo = Ax(s) +Bu(s),y(s) = Cx(s) +Du(s),
(5)
de unde tinand cont ca (sI −A) este a.p.t. nesingulara
x(s) = (sI −A)−1xo + (sI −A)−1Bu(s) = xℓ(s) + xf(s).
Avem deasemenea
Φ(s) := L(Φ(t)) = L(eAt) = (sI −A)−1
care se numeste matricea rezolventa si deci
Φ(t) = L−1((sI −A)−1).
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 10 Evolutia Starii, Tranzitia Intrare–Iesire
Mai mult,
Φ(s) = s−1I + s−2A+ s−3A3 + . . .
care are loc pentru |s| > R unde R := max{|λ|, λ ∈ Λ(A)}. Deasemenea
Φ(s) = (sI −A)−1 =(sI −A)∗
χ(s)=
G(s)
ν(s)
unde χ(s) := det(sI − A) si ν(s) sunt polinomul caracteristic respectiv minimalale lui A. In operational iesirea devine
y(s) = Cx(s)+Du(s) = C(sI−A)−1xo+C(sI−A)−1Bu(s)+Du(s) = yℓ(s)+yf(s).
Matricea de transfer este prin definitie
T (s) := L(Tc(t)) = C(sI −A)−1B +D =:
[A BC D
]CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 11 Evolutia Starii, Tranzitia Intrare–Iesire
unde ultima expresie explicita se obtine comparand expresiile iesirii in domeniultimp si operational. Mai departe,
T (s) =C(sI −A)∗B
χ(s)+D =
R(s)
χ(s)=
R(s)
ν(s)= {Tij(s)} 1 ≤ i ≤ p
1 ≤ j ≤ m
.
Matricea de transfer a unui sistem dinamic (in acceptiunea definitiei date) este op×m matrice de functii rationale proprii. Ea permite explicitarea in operational aiesirii in functie de intrare atunci cand conditiile intiale sunt nule
y(s) = T (s)u(s) (xo = 0).
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 12 Evolutia Starii, Tranzitia Intrare–Iesire
3. Echivalenta Sistemelor Liniare
Definitia 2. Doua sisteme liniare (A,B,C,D) si (A, B, C, D) avand acelasinumar de intrari si iesiri si aceeasi dimensiune a spatiului starilor (p = p, m =m, n = n) se numesc echivalente (izomorfe) pe stare daca exista o transformarenesingulara T astfel incat
A = TAT−1,
B = TB,
C = CT−1,
D = D.
Transformarea T este de fapt o schimbare de coordonate la nivelul marimii de
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 13 Echivalenta Sistemelor Liniare
stare. Intr–adevar, daca {x(t) = Ax(t) +Bu(t),y(t) = Cx(t) +Du(t),
(6)
si definim pentru un T inversabil fixat
x(t) := Tx(t) ⇔ x(t) = T−1x(t)
atunci obtinem {T−1 ˙x(t) = AT−1x(t) +Bu(t),y(t) = CT−1x(t) +Du(t),
⇒ (7){˙x(t) = TAT−1x(t) + TBu(t),
y(t) = CT−1x(t) +Du(t),⇒{
˙x(t) = Ax(t) + Bu(t),
y(t) = Cx(t) + Du(t),
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 14 Echivalenta Sistemelor Liniare
unde
A = TAT−1, B = TB, C = CT−1, D = D.
Propozitia 3 (Exercitiu). Doua sisteme echivalente pe stare care au conditiileinitiale asemenea prin T si sunt supuse aceleiasi comenzi u(·) au traiectoriilede stare asemenea prin T si evolutii la iesire identice.Definitia 4. Doua sisteme dinamice (A,B,C,D) si (A, B, C, D) se numescechivalente intrare–iesire daca au aceeasi functie de transfer, i.e.,
T (s) = C(sI − A)−1B + D = C(sI −A)−1B +D = T (s).
Observatii: a) Doua sisteme echivalente intrare–iesire trebuie sa aibe acelasi numarde intrari (m = m) si acelasi numar de iesiri (p = p). Este posibil insa cadimensiunea vectorului de stare sa difere, i.e. n = n.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 15 Echivalenta Sistemelor Liniare
b) Pentru doua sisteme echivalente intrare–iesire avem automat
D = T (∞) = T (∞) = D.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 16 Echivalenta Sistemelor Liniare
Relatia intre Echivalenta de Stare si Echivalenta Intrare–Iesire
Propozitia 5.Doua sisteme echivalente pe stare sunt echivalente intrare–iesire.
Demonstratie. Intr-adevar,
T (s) = C(sI − A)−1B + D = CT−1(sI − TAT−1)−1TB +D= CT−1(T (sI −A)T−1)−1TB +D = C(sI −A)−1B +D = T (s).
Observatii: a) Reciproca nu este in general valabila (este posibil ca pentru douasisteme echivalente intrare–iesire) sa avem n = n). (EX)b) Diferenta in definitiile echivalentei consta in aceea ca una este centrata pe starepe cand cealalta este centrata pe functia de transfer (intrare–iesire).c) Pentru orice matrice de transfer exista o infinitate de realizari de stare.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 17 Echivalenta Sistemelor Liniare
d) Problema dimensiunii realizarii de stare este esentiala: exista o dimensiune ceeste minima (realizare minimala), strict legata de anumite proprietati structurale.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 18 Echivalenta Sistemelor Liniare
4. Stabilitatea Sistemelor Dinamice
Stabilitatea este o proprietate calitativa a sistemelor asociata comportarii dinamicea acestora.
Daca stabilitatea se refera la comportarea lui x(t) se numeste stabilitate de tipLyapunov iar daca se refera la y(t) se numeste stabilitate externa.
Stabilitate Interna (Libera sau Lyapunov)
Acest tip de stabilitate se refera la comportarea marimii de stare x(t) atunci candintrarea este identic nula. Ecuatia relevanta este
x(t) = Ax(t), x(0) = xo.
Definitia 6. Un sistem dinamic se numeste intern stabil daca ∀ϵ > 0, ∃δ(ϵ) > 0
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 19 Stabilitatea Sistemelor Dinamice
a.i. ∀xo cu ∥xo∥ < δ(ϵ) avem
∥x(t)∥ ≤ ϵ, ∀t ∈ R+.
Definitia 7. Un sistem dinamic s. n. intern asimptotic stabil daca ∀xo avem
limt→∞
∥x(t)∥ = 0.
Observatii: a) Definitia este generala folosindu-se si in cazul sistemelor neliniare.In cazul liniar exista anumite consecinte simple deoarece avem solutia
x(t) = eAtxo.
b) Sistemul este intern asimptotic stabil daca si numai daca limt→∞Φ(t) = 0.
Evaluarea lui Φ(t) = eAt
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 20 Stabilitatea Sistemelor Dinamice
Consideram succesiv urmatoarele cazuri:a) A este un bloc Jordan elementar cu valoare proprie 0;b) A este un bloc Jordan elementar oarecare;c) A oarecare.
a) In acest caz presupunem A ∈ Rn×n si
A = J0 =
0 1 . . . 0... ... . . . ...0 0 . . . 10 0 . . . 0
.
Evident A este nilpotenta cu indice de nilpotenta egal cu n, i.e. An = 0 si
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 21 Stabilitatea Sistemelor Dinamice
An−1 = 0. Folosind definitia exponentialei matriciale (3) obtinem in acest caz
eAt = In+
0 t
1! . . . 0... ... . . . ...0 0 . . . t
1!0 0 . . . 0
+· · ·+
0 0 . . . tn−1
(n−1)!... ... . . . ...0 0 . . . 00 0 . . . 0
=
1 t
1! . . . tn−1
(n−1)!... ... . . . ...0 0 . . . t
1!0 0 . . . 1
.
b) In acest caz presupunem A ∈ Rn×n si
A = Jo + Λo, unde Λo =
λo 0 . . . 0... ... . . . ...0 0 . . . 00 0 . . . λo
= λoIn.
Avem eAt = e(Jo+Λo)t = eJoteΛ0t (relatie ce are loc pentru ca Λo comuta cu Jo).
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 22 Stabilitatea Sistemelor Dinamice
Tinand cont ca eΛot = eλotIn obtinem in final
eAt = eλot
1 t
1! . . . tn−1
(n−1)!... ... . . . ...0 0 . . . t
1!0 0 . . . 1
.
c) Cazul general se reduce la cazurile precedente prin aducerea matricii A la formacanonica Jordan. Mai precis, ∀A ∈ Rn×n, ∃T ∈ Rn×n nesingulara a.i.
J = TAT−1 =
J1 0. . .
0 Jk
unde J este o matrice Jordan (bloc diagonala avand pe diagonala blocuri elementare
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 23 Stabilitatea Sistemelor Dinamice
Jordan Ji la valorile proprii ale matricii A). Matricea de tranzitie a starii devine
eAt = eT−1JTt = T−1eJtT = T−1
eJ1t 0. . .
0 eJkt
T.
Recapitulare: Polinom caracteristic, minimal, forma canonica Jordan, valori proprii,multiplicitati algebrice si geometrice;Teorema 8. 1. Sistemul dinamic (A,B,C,D) este intern asimptotic stabil dacasi numai daca Λ(A) ⊂ C− (spectrul matricii de stare A este localizat in semi-planul stang deschis).2. Sistemul dinamic (A,B,C,D) este intern stabil daca si numai daca Λ(A) ⊂C− ∪ C0 iar valorile proprii care au partea reala nula sunt radacini simple alepolinomului minimal.
Demonstratie: 1. Suficienta conditiilor rezulta automat din forma Jordan. Pentrunecesitate pp ca sistemul este intern asimptotic stabil. Atunci rezulta ca Φ(t)xo →0 pentru t → ∞, ∀xo ∈ Rn. Pp prin absurd ca nu este indeplinita conditia de
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 24 Stabilitatea Sistemelor Dinamice
spectru. Atunci ∃ λ0 ∈ Λ(A) cu Re λo ≥ 0. Fie xo un vector propriu asociat luiλo. Atunci
eAtxo = eλotxo → 0
ceea ce contrazice ipoteza de stabilitate asimptotica.2. Demonstratia este similara tinand cont ca eJit este marginita (Ji este blocJordan elementar) daca si numai daca v. p. corespunzatoare are partea reala saustrict negativa sau zero cu multiplicitatea cel mult unu.Observatii: a) Testarea stabilitatii interne pentru un sistem dinamic se reducedin punct de vedere procedural la calculul valorilor proprii ale matricii de stare A(aducerea matricii la forma Schur).b) Deoarece stabilitatea interna a unui sistem depinde exclusiv de locatia spectruluimatricii de stare A uneori se foloseste abuziv terminologia de matrice (asimptotic)stabila.
Ecuatia Lyapunov si Stabilitatea Sistemelor Liniare
EcuatiaATP + PA+Q = 0, A ∈ Rn×n, Q ∈ Rn×n (8)
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 25 Stabilitatea Sistemelor Dinamice
in necunoscuta P ∈ Rn×n se numeste ecuatie Lyapunov (matriciala, algebrica, intimp continuu).Teorema 9. Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci ecu-atia Lyapunov are o solutie unica data explicit de expresia
P :=
∫ ∞
0
eAT tQeAtdt. (9)
Demonstratie. Sa observam intai ca deoarece A este asimptotic stabila expresia(9) este bine definita (integrala nedefinita este convergenta). Calculand
ATP + PA =∫∞0
(ATeAT tQeAt + eA
T tQeAtA)dt =∫∞0
ddt(e
AT tQeAt)dt
= eAT tQeAt
∣∣∣∞0
= −Q
concluzionam ca intr-adevar P dat de (9) este o solutie a ecuatiei Lyapunov.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 26 Stabilitatea Sistemelor Dinamice
Ramane sa aratam ca P este unica solutie. Consideram aplicatia liniara
P : Rn2→ Rn2
, P(P ) := ATP + PA.
Aceasta aplicatie este insa surjectiva deoarece tocmai am aratat ca ∀Q ∈ Rn2 ⇒∃P ∈ Rn2
(dat de (9)) a.i. P(P ) = −Q. Deoarece o aplicatie liniara si surjectivaeste automat injectiva (si deci bijectiva) rezulta ca pentru Q fixat P dat de (9)este unica solutie a ecuatiei Lyapunov (8). In particular, P = P−1(−Q).
Observatii: a) Daca Q = QT atunci rezulta automat din (9) ca P = PT .b) Daca Q = QT ≥ 0 atunci P = PT ≥ 0.c) Daca Q = QT > 0 atunci P = PT > 0.
Ecuatia Lyapunov se foloseste in special in teoria sistemelor neliniare pentru testareastabilitatii. In cazul liniar avem urmatorul rezultat (un fel de reciproca).Teorema 10 (Lyapunov). Presupunem ca ∃P = PT > 0 si Q = QT ≥ 0 a. i.
ATP + PA+Q = 0.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 27 Stabilitatea Sistemelor Dinamice
Atunci Λ(A) ⊂ C−0 .
Demonstratie. Fie λ ∈ Λ(A) o valoare proprie a lui A si x un vector propriuasociat, i.e.,
Ax = λx (λ ∈ C, x ∈ Cn, x = 0).
Hermitizand aceasta ecuatie (transpus + conjugat) obtinem
xHAT = λxH,
iar din ecuatia Lyapunov avem succesiv
xHATPx+ xHPAx = −xHQx;
λxHPx+ λxHPx = −xHQx;
2Re(λ)xHPx = −xHQx.
Deoarece xHPx > 0 si −xHQx ≤ 0 rezulta automat Re(λ) ≤ 0.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 28 Stabilitatea Sistemelor Dinamice
Observatii: a) Daca in teorema de mai sus intarim ipotezele a.i. P > 0, Q > 0atunci rezulta ca A este asimptotic stabila (Λ(A) ⊂ C−).b) Indicatii procedurale de testare a (semi)pozitivitatii si rezolvare a ecuatiilorLyapunov.c) Ecuatia Lyapunov se poate folosi pentru a testa stabilitatea unui sistem prinrezolvarea unui sistem de ecuatii liniare (o problema considerabil mai simpla dpdvteoretic decat calculul valorilor proprii ale matricii A).
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 29 Stabilitatea Sistemelor Dinamice
5. Regimurile Permanent/Tranzitoriu/Stationar ale Sistemelor
Fie sistemul {x = Ax+Bu, x(0) = xo,y = Cx+Du
(10)
avand matricea de transfer
T (s) = C(sI −A)−1B +D.
Pentru a pune in evidenta regimurile permanent si tranzitoriu ale unui sistem facemipotezele:a) Sistemul este intern asimptotic stabil, i.e., Λ(A) ⊂ C−;b) Comanda u este produsa de regimul liber al unui sistem antistabil{
xe = Aexe, xe(0) = xeo,u = Cexe
(11)
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 30 Regim Permanent/Tranzitoriu/Stationar
cu Λ(Ae) ⊂ C+ ∪ C0. Comanda are deci expresia
u(t) = CeeAetxeo
si cum Λ(Ae) ⊂ C+ ∪ C0 rezulta ca u este un semnal persistent (in particular,daca Ae = 0 avem u = Cexeo = cst).
Deoarece sistemul (A,B,C,D) este asimptotic stabil putem afirma intuitiv cadupa un timp suficient de lung (asimptotic) starea sistemului va urma semnalul deintrare produs de sistemul instabil (generatorul de semnal u). Prin urmare incercamsa vedem daca se poate pune in evidenta la nivelul starii x o descompunere detipul
x(t) = ξ(t) + V xe(t) (12)
unde limt→∞ ξ(t) = 0 (componenta tranzitorie) si V xe(t) este proportionala cuu(t) = Cexe(t) (componenta permanenta). Inlocuind (12) in (10) obtinem
ξ + V xe = Aξ +AV xe +BCexe
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 31 Regim Permanent/Tranzitoriu/Stationar
sau incaξ = Aξ + (AV − V Ae +BCe)xe. (13)
Deoarece Λ(A) ∩ Λ(Ae) = ∅ rezulta ca ecuatia Sylvester
AV − V Ae +BCe = 0
are o solutie unica V . Punand acest V in (12) si (13) regimul dinamic devine
ξ = Aξ, ξ(0) = ξ0
si cum sistemul original este asimptotic stabil avem ca limt→∞ ξ(t) = 0. Prinurmare, in ipotezele facute exista si este unic V a.i. sa avem descompunerea
x(t) = xp(t) + xt(t)
in regim permanent si respectiv regim tranzitoriu
xp(t) := V xe, xt(t) := ξ(t). (14)
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 32 Regim Permanent/Tranzitoriu/Stationar
Observatii: a) Descompunerea in regim permanent si tranzitoriu se face in raportcu clasa de semnale exogene {u(·)|u(t) = Cee
Aetxeo, xeo ∈ Rne}.b) Descompunerea in regim permanent si tranzitoriu este specifica sistemelor liniare(apare numai in context liniar) pe cand descompunerea in regim liber si fortat areloc si in cazul sistemelor neliniare.c) Daca Ae = 0 atunci avem de-a face cu un regim stationar (intrari constante),xe(t) = xeo,∀t ≥ 0, ecuatia Sylvester are solutia V = −A−1BCe si obtinem
xp(t) = −A−1BCexeo = −A−1BCu0,
yp(t) = −CA−1BCexe0 +Du0 = −CA−1Bu0 +Du0 = T (0)u0,
unde u0 := Cexe0 si T (s) = C(sI − A)−1B + D este matricea de transfer asistemului.d) Daca Ae = jωI, Ce = I, avem u = uoe
jωt iar ecuatia Sylvester devine
AV − jωV +B = 0
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 33 Regim Permanent/Tranzitoriu/Stationar
avand solutia unicaV = (jωI −A)−1B.
Regimul permanent este atunci
yp = C(jωI −A)−1Buoejωt = T (jω)uoe
jωt
unde uo = Cexeo.
Exercitiu: Puneti in evidenta regimurile liber/fortat, permanent/tranzitoriu pentruun circuit RLC cu intrarea generata de un sistem cu matricea de stare Ae avanddoua radacini pur imaginare complex conjugate. Specificati regimul stationarpentru acest circuit.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 34 Regim Permanent/Tranzitoriu/Stationar
CAPITOLUL 3: PROPRIETATI STRUCTURALE
Exista anumite proprietati fundamentale ale sistemelor dinamice pe spatiul starilorcare influenteaza decisiv posibilitate de analiza si sinteza: controlabilitate, ob-servabilitate, minimalitate, stabilizabilitate, detectabilitate. Aceste proprietati sereflecta in anumite proprietati structurale ale matricilor sistemice (A,B,C,D).
1. Controlabilitatea
2. Observabilitatea
3. Descompunere Structurala
4. Realizabilitate
5. Conexiunea Sistemelor
CAPITOLUL 3: PROPRIETATI STRUCTURALE 35 PROPRIETATI STRUCTURALE
1. Controlabilitatea (“Posibilitatea de a Controla”)
Controlabilitatea este o proprietate calitativa ce caracterizeaza abilitatea unuisistem {
x(t) = Ax(t) +Bu(t), x(0) = xo
y(t) = Cx(t) +Du(t),(15)
de a putea tranzita dintr-o stare in alta prin intermediul unei anumite comenzi(control). Pentru controlabilitate este relevanta numai prima ecuatie din (28) sisolutia corespunzatoare
x(t) = eA(t)xo +
∫ t
0
eA(t−τ)Bu(τ)dτ, t ≥ 0. (16)
Stare/Sistem Controlabil(a)Definitia 11. O stare x ∈ Rn se numeste controlabila la momentul t > 0 dacaexista o comanda u(·) ∈ U care transfera xo = 0 (originea) in starea x(t) = x.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 36 Controlabilitatea
Observatii: a) Aparent pentru a stabili controlabilitatea unei stari la momentul ttrebuie rezolvata ecuatia functionala (16) in necunoscuta u(·) : [0, t] → Rn (cuxo = 0).b) Conform definitiei, controlabilitatea unei stari x depinde de perechea de matrici(A,B) si de momentul t > 0. Vom vedea ca de fapt controlabilitatea este oproprietate ce depinde exclusiv de perechea (A,B) (este independenta de t).
Gramian de Controlabilitate
Pentrul studiul controlabilitatii se introduce Gramianul de Controlabilitate la mo-mentul t > 0 definit de
Lc(t) =
∫ t
0
eA(t−τ)BBTeAT (t−τ)dτ. (17)
Observatii:a) Lc(t) = Lc(t)T ;
b) Lc(t) ≥ 0;c) Pentru orice matrice simetrica X = XT ∈ Rn×n avem Ker (X) ⊥ Im (X) si
CAPITOLUL 3: PROPRIETATI STRUCTURALE 37 Controlabilitatea
Rn = Ker (X)⊕ Im (X). Cum se obtine asa ceva ?
Caracterizarea Controlabilitatii prin Gramianul de Controlabilitate
Teorema 12. Starea x este controlabila la momentul t > 0 daca si numai dacax ∈ ImLc(t).
Demonstratie. Necesitatea: Presupunem ca x este controlabila la momentul t > 0adica ∃u(·) a.i.
x =
∫ t
0
eA(t−τ)Bu(τ)dτ.
Avem x = xK + xI unde xK ∈ KerLc(t), xI ∈ ImLc(t). Aratam ca xK = 0.Intr-adevar,
xTKx = ∥xK∥2 =
∫ t
0
xTKeA(t−τ)Bu(τ)dτ (18)
si pentru a arata ca xK = 0 este suficient sa aratam ca xTKeA(t−τ)B = 0,
CAPITOLUL 3: PROPRIETATI STRUCTURALE 38 Controlabilitatea
∀τ ∈ [0, t]. Aceasta identitate rezulta insa automat din sirul de egalitati
0 = xTKLc(t)xK =
∫ t
0
xTKeA(t−τ)BBTeA
T (t−τ)xKdτ =
∫ t
0
∥BTeAT (t−τ)xK∥2dτ
si din analiticitatea functiei BTeAT (t−τ)xK pe [0, t].
Suficienta: Presupunem ca x ∈ ImLc(t) ceea ce este echivalent cu
x = Lc(t)z =
∫ t
0
eA(t−τ)BBTeAT (t−τ)zdτ (19)
pentru un z ∈ Rn potrivit ales. Definim
u(τ) := BTeAT (t−τ)z, τ ∈ [0,∞) (20)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 39 Controlabilitatea
care introdus in (19) arata ca
x =
∫ t
0
eA(t−τ)u(τ)dτ
sau ca starea x este controlabila la momentul t.
Observatii: a) Deoarece z = Lc(t)#x comanda (20) se mai poate scrie ca
u(τ) := BTeAT (t−τ)Lc(t)
#x, (21)
unde Lc(t)# este pseudoinversa (Moore-Penrose) a lui Lc(t).
b) Daca x ∈ ImLc(t) atunci comanda (21) duce starea initiala (originea) in stareax la momentul t iar daca x ∈ ImLc(t) atunci comanda (21) duce originea cat sepoate de aproape de x la momentul t (adica transfera starea pe directia data deimaginea gramianului)!
Caracterizarea Controlabilitatii prin Matricea de Controlabilitate
CAPITOLUL 3: PROPRIETATI STRUCTURALE 40 Controlabilitatea
Din cele discutate pana acum controlabilitatea unei stari depinde de momentul detimp t > 0. In continuare vom vedea ca de fapt proprietatea de controlabilitateeste independenta de t.
Introducem matricea de controlabilitate asociata unui sistem dinamic (sau maiprecis unei perechi matriciale (A,B), A ∈ Rn×n, B ∈ Rn×m):
R :=[B AB A2B . . . An−1B
]. (22)
Matricea de controlabilitate are dimensiune n× (nm).Teorema 13. Fie t > 0 fixat. Atunci x ∈ ImLc(t) ⇔ x ∈ ImR, i.e.,
ImLc(t) = ImR. (23)
Demonstratie. Sa observam mai intai ca Lc(t) fiind simetrica conditia (34) este
CAPITOLUL 3: PROPRIETATI STRUCTURALE 41 Controlabilitatea
echivalenta cu KerLc(t) = KerRT sau inca
Lc(t)x = 0 ⇔ xTR = 0, x ∈ Rn. (24)
Aratam intai implicatia directa. Avem
Lc(t)x = 0 ⇔∫ t
0
xTeA(t−τ)BBTeAT (t−τ)xdτ = 0 ⇔
∫ t
0
∥xTeA(t−τ)B∥2dτ = 0.
Rezulta succesiv ca
xTeA(t−τ)B = 0, ∀0 ≤ τ ≤ t,
xTeAτB = 0, ∀τ ∈ R,
ultima egalitate rezultand din analiticitatea functiei xTeAτB (daca o functieanalitica este nula pe un interval deschis atunci este nula pe toata axa reala, iar
CAPITOLUL 3: PROPRIETATI STRUCTURALE 42 Controlabilitatea
[0, t] contine automat un interval deschis). Mai departe obtinem ca
dk
dtk[BTeA
T τx]τ=0 = 0, k = 0, 1, 2, . . .
de unde
xTB = 0, xTAB = 0, , . . . , xTAkB = 0, . . .
ceea ce este echivalent cu xT[B AB A2B . . . An−1B
]= 0 sau xTR = 0.
Aratam acum implicatia inversa. Fie x = 0 a.i. xTR = 0. AtuncixT
[B AB A2B . . . An−1B
]= 0 sau inca
xTB = 0, xTAB = 0, , . . . , xTAn−1B = 0.
Din teorema Hamilton–Cayley rezulta imediat ca
xTAkB = 0, ∀k ≥ 0.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 43 Controlabilitatea
Definim functia analitica ϕ(τ) := xTeAτB, ϕ : [0, t] ⇒ Rm. Din relatiile demai sus rezulta ca toate derivatele evaluate in zero sunt nule, i.e., ϕ(0) = 0,ϕ(1)(0) = 0, . . . ϕk(0) = 0. Din analiticitate rezulta automat ca
ϕ(τ) = 0, ∀τ ∈ [0, t]
si mai departe ca
xTLc(t)x =
∫ t
0
ϕ(τ)ϕ(τ)Tdτ = 0.
Cum Lc(t) ≥ 0 rezulta in continuare Lc(t)x = 0 q.e.d.
Observatii: a) O stare x ∈ Rn este controlabila independent de momentul t > 0.Proprietatea este intrinseca starii x si perechii (A,B).b) Se poate arata ca daca extindem clasa de semnale de intrare la functiigeneralizate (incluzand distributii) atunci daca x este controlabila exista o comandacare duce originea in acea stare intr-un timp infinit mic (nul) – fenomene de tipBushow.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 44 Controlabilitatea
c) Putem introduce definitia echivalenta: o stare x s.n. controlabila daca existat > 0 si o comanda u(·), u : [0, t], a.i. traiectoria satisface x(t) = x.Corolarul 14.
R := ImR = ImLc(t), ∀t > 0.
Introducem notiunea de sistem controlabil (sau pereche (A,B) controlabila) cusemnificatia ca fiecare stare x ∈ Rn este controlabila. Avem atunci urmatorulrezultat central.Teorema 15. Fie perechea (A,B).1. O stare x este controlabila daca si numai daca x ∈ R.2. Perechea (A,B) (sau sistemul corespunzator) este controlabila (controlabil)daca si numai daca R = Rn (sau, echivalent, rankR = n).
Observatie: Din punct de vedere procedural controlabilitatea unui sistem se poatetesta verificand ca rangul matricii de controlabilitate este n, i.e. rankR = n.Pentru testarea controlabilitatii exista un algoritm dedicat foarte eficient numit“controllability staircase”. Cu toate ca acest algoritm este numeric stabil atragematentia ca problema testarii controlabilitatii este o problema “ill–posed” (prost
CAPITOLUL 3: PROPRIETATI STRUCTURALE 45 Controlabilitatea
conditionata numeric).
Gramian de Controlabilitate in Timp Infinit
Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limita
limt→∞
Lc(t)
este finita, se noteaza cu Lc ∈ Rn×n = LTc ≥ 0 si este numita gramian de
controlabilitate asimptotic. El verifica automat ecuatia Lyapunov
ALc + LcAT +BBT = 0
si are expresia explicita
Lc :=
∫ ∞
0
eAτBBTeAT τdτ.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 46 Controlabilitatea
Observatie: Ecuatia Lypunov verificata de gramianul asimptotic are solutie unica.Aceasta ecuatie are insa solutii (unice) in conditii mult mai generale decat atuncicand A este stabila.Propozitia 16. Daca A este asimptotic stabila si perechea (A,B) este controla-bila atunci Lc > 0.
Demonstratie. Rationam prin reducere la absurd. Stim ca Lc ≥ 0 si pp ca ∃x = 0a.i. Lcx = 0. Atunci din ecuatia gramianului rezulta succesiv ca BTKerLc = 0,KerLc este AT invariant, BTATKerLc = 0, . . . BT (AT )kKerLc = 0, ∀k ≥ 0.De aici rezulta ca pentru orice x = 0, x ∈ KerLc, avem xTR = 0 ceea cecontrazice ipoteza ca rankR = n si deci ipoteza ca (A,B) este controlabila.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 47 Controlabilitatea
Semnificatia Gramianului de Controlabilitate in Timp Infinit
Presupunem A stabila, perechea (A,B) controlabila si deci Lc > 0. Atunci avemΛ(Lc) = {σ1, σ2, . . . , σn}, σi > 0, unde indexarea s-a facut in ordine descrescatoare(i = 1, . . . , n). Fie xi vectori proprii ce formeaza o baza ortonormata (xi ⊥ xj,∥xi∥ = 1). Ne propunem sa calculam energia corespunzatoare comenzii ce duceoriginea in starea xi. Avem
xi =
∫ ∞
0
eA(t−τ)Bui(τ)dτ = Lczi
unde
ui(τ) = BTeAT τzi = BTeA
T τL−1c xi = BTeA
T τxi1
σi.
Energia comenzii este
∥ui(τ)∥22 =1
σ2i
∫ ∞
0
xTi e
AτBBTeAT τxidτ =
1
σ2i
xTi Lcxi =
1
σ2i
xTi σixi =
1
σi.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 48 Controlabilitatea
Din aceasta expresie concluzionam ca gramianul de controlabilitate asimptoticmasoara efortul energetic al sistemului pentru a transfera originea pe sfera unitate(cu cat Gramianul este mai mare – mai pozitiv – avem nevoie de o energie acomenzii mai mica). Valorile proprii ale gramianului pun in evidenta niveleleenergetice ale sistemului si dau o procedura efectiva de reducere dimensionala.
Subspatii controlabile
Se introduc
Rk :=[B AB . . . Ak−1B
], Rk := ImRk, k ≥ 1,
numite matricea de controlabilitate respectiv subspatiul controlabil in k pasi(semnificatia numelui va deveni clara la studiul sistemelor cu timp discret).Rk poseda urmatoarele proprietati:a) Rk+1 = ImB +ARk = Rk +AkImB, unde Ro := {0};b) Ro ⊂ R1 ⊂ . . .Rk ⊂ . . . adica subspatiile formeaza un lant crescator. In limbaj
CAPITOLUL 3: PROPRIETATI STRUCTURALE 49 Controlabilitatea
matricial avem
rankRo ≤ rankR1 ≤ · · · ≤ Rk ≤ · · · .Din finitudinea dimensionala rezulta ca aceste incluziuni nu pot fi stricte decatpentru un numar finit de subspatii (maxim n) si exista un subspatiu Rν, pentru unν suficient de mare, care le va contine pe toate celelalte. Sa observam ca daca νeste cel mai mic indice pentru care Rν+1 = Rν atunci Rν+1 = Rν+2 = . . . = R.Acest indice ν se numeste indice de controlabilitate iar Rν = R := ImR adica Rν
este exact subspatiul controlabil (al perechii (A,B));c) R este A–invariant si contine ImB. Intr–adevar, avem ca R = ImB +AR;d) R este cel mai mic subspatiu A–invariant care contine ImB. Intr–adevar, fieV un spatiu A–invariant care contine ImB. Aratam prin inductie ca Rk ⊂ V deunde concluzia ca R ⊂ V. Deoarece ImB ⊂ V rezulta ca R1 ⊂ V. Presupunemca Rk ⊂ V si aratam ca Rk+1 ⊂ V. Intr–adevar, Rk+1 = ImB + ARk. DarImB ⊂ V si ARk ⊂ V (deoarece V este A–invariant si din ipoteza Rk ⊂ V) deunde concluzia. Cu alte cuvinte, subspatiul controlabil R este solutia infimala insubspatii a ecuatiei
T = ImB +AT
CAPITOLUL 3: PROPRIETATI STRUCTURALE 50 Controlabilitatea
in necunoscuta T . Mai precis,
R = inf{T |T = AT + ImB} = inf{T |AT ⊂ T si ImB ⊂ T }.
Recapitulare: Subspatii invariante, spectru restrans la un subspatiu, operatii cusubspatii, suma directa, completari ortogonale etc.
Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant ? Avem AV ⊂ Viar daca V = ImV , unde V este o n× ρ matrice baza pentru V atunci automat
AV = V J
unde J este o matrice patrata ρ× ρ cu Λ(J) ⊂ Λ(A). Facand o completare panala o matrice nesingulara S =
[V W
]si notand T := S−1 obtinem
A := TAT−1 =
[A1 A3
O A2
].
CAPITOLUL 3: PROPRIETATI STRUCTURALE 51 Controlabilitatea
Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant si contine ImB ?Repetand schimbarea de coordonate si aplicand-o corespunzator si lui B avem
A := TAT−1 =
[A1 A3
O A2
], B = TB =
[B1
O
]deoarece ImB ⊂ V. Cu aceasta schimbare de coordonate, matricea de controla-bilitate corespunzatoare a perechii (A, B) este
R =
[B1 A1B1 A2
1B1 · · · An−11 B1
O O O · · · O
]}ρ
.
Daca spatiul A–invariant (ce contine si ImB) in raport cu care s-a facut descom-punerea este chiar R, atunci perechea (A1, B1) este automat controlabila si avem
ca rankR = rank R = ρ = ν (indicele de controlabilitate).Teorema 17 (Teorema de Descompunere Controlabila). Un sistem dinamic oare-care descris de (A,B,C,D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este
CAPITOLUL 3: PROPRIETATI STRUCTURALE 52 Controlabilitatea
intotdeauna echivalent pe stare cu un sistem (A, B, C,D) avand structura
A = TAT−1 =
[A1 A3
O A2
]}ν}n− ν︸︷︷︸ ︸︷︷︸
ν n− ν
, (25)
B = TB =
[B1
O
]}ν}n− ν
, C = CT−1 =[C1 C2
],︸︷︷︸ ︸︷︷︸
ν n− ν
(26)
in care perechea (A1, B1) este controlabila. Mai mult, sistemele (A,B,C,D),
(A, B, C,D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e.,
T (s) =
[A BC D
]=
[A B
C D
]=
[A1 B1
C1 D
].
CAPITOLUL 3: PROPRIETATI STRUCTURALE 53 Controlabilitatea
Observatii: a) Teorema afirma in particular ca dandu-se un sistem dinamic putemintotdeauna gasi un alt sistem echivalent intrare–iesire care este controlabil (avanddimensiunea spatiului starilor mai mica sau egala cu cea a sistemului initial).b) Obtinerea descompunerii controlabile se bazeaza in mod esential pe matriceaS = T−1 care se poate obtine facand o completare pana la o inversabila a oricareibaze V a subspatiului controlabil R = ImR (consecinte procedurale).c) Proprietatea de controlabilitate este invarianta in raport cu relatia de echivalentape stare. Mai precis, un sistem este controlabil daca si numai daca orice sistemechivalent pe stare este controlabil.
Criteriul lui Popov–Belevitch–Hautus (PBH)
Folosind teorema de descompunere controlabila se poate obtine un criteriu extremde util pentru testarea controlabilitatii unei perechi (A,B).Teorema 18 (Criteriul lui Hautus). Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m, este
CAPITOLUL 3: PROPRIETATI STRUCTURALE 54 Controlabilitatea
controlabila daca si numai daca
rank[sI −A B
]= n, ∀s ∈ C. (27)
Demonstratie. Necesitatea: Pp prin absurd ca (27) nu este satisfacuta. Atunciexista s0 ∈ C si un vector x0 = 0, x0 ∈ Cn a.i.
xT0
[s0I −A B
]= 0.
De aici rezulta imediat ca
xT0R = xT
0
[B AB . . . An−1B
]= 0
si deci perechea (A,B) nu este controlabila intrucat rankR < n.Suficienta: Pp din nou prin reducere la absurd ca (A,B) nu este controlabila
CAPITOLUL 3: PROPRIETATI STRUCTURALE 55 Controlabilitatea
(ν < n). Atunci conform teoremei de descompunere controlabila exista un sistemechivalent pe stare avand perechea (A1, B1) controlabila. Avem succesiv
rank[sI −A B
]= rankT
[sIn −A B
] [ T−1 OO I
]= rank
[sIν −A1 −A3 B
O sIn−ν −A2 O
].
Rangul ultimei matrici este insa mai mic decat n pentru orice s ∈ Λ(A2) ceea cecontrazice (27).
Observatii: a) Pentru a decide controlabilitatea unei perechi (A,B) este suficientsa testam criteriul lui Hautus pentru s ∈ Λ(A). Intr–adevar, pentru s ∈ C−Λ(A)avem automat rank (sI −A) = n si deci criteriul este indeplinit.b) Observatia de mai sus justifica introducerea de valoare proprie (sau mod) con-trolabila/necontrolabila: O valoare proprie a lui A s.n. controlabila (necontrolabila)daca satisface (nu satisface) criteriul lui Hautus. Din teorema de descompunere
CAPITOLUL 3: PROPRIETATI STRUCTURALE 56 Controlabilitatea
controlabila rezulta imediat ca o valoare proprie λ a lui A este controlabila (necon-trolabila) daca si numai daca λ ∈ Λ(A1) (λ ∈ Λ(A2)).c) Din demonstratia de mai sus rezulta ca daca doua sisteme (A,B,C,D) si
(A, B, C, D) sunt echivalente pe stare cu matricea de echivalenta T atunci matri-
cile de controlabilitate corespunzatoare R si R satisfac
R = TR.
“Controlabilitatea este o proprietate generica”Teorema 19. Fie Fn,m := {(A,B)|A ∈ Rn×n, B ∈ Rn×m} familia tuturorperechilor (A,B) cu n si m fixati. Submultimea M ⊂ F a perechilor necon-trolabile formeaza o suprafata algebrica iar submultimea perechilor controlabile
este densa in Rn2+nm. Cu alte cuvinte, controlabilitatea este o proprietategenerica in F (o pereche (A,B) selectata la intamplare din F este controlabilasau, echivalent, probabilitatea de a selecta o pereche necontrolabila este nula).
Nul Controlabilitate
CAPITOLUL 3: PROPRIETATI STRUCTURALE 57 Controlabilitatea
Am vazut ca proprietatea de controlabilitate exprima esentialmente capacitatea dea aduce un sistem din origine intr-o stare arbitrara. Introducem acum conceptulde nul controlabilitate (cu consecinte interesante in special in cazul sistemelor cutimp discret).Definitia 20. O stare x ∈ Rn se numeste nul controlabila la momentul t fixatdaca exista o comanda u(·) care transfera starea x0 = x in starea x(t) = 0 (inorigine).
Exercitii: a) Aratati ca o stare este controlabila daca si numai daca este nulcontrolabila.b) Perechi cu matricea B monica. (Explicitare)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 58 Controlabilitatea
2. Observabilitatea
Observabilitatea este o proprietate calitativa a sistemului{x(t) = Ax(t) +Bu(t), x(0) = xo
y(t) = Cx(t) +Du(t),(28)
de a determina o stare din prelucrarea marimii masurate y. Pentru observabilitateeste relevanta evolutia sistemului in regim liber, i.e., sub comenzi externe nule,
x(t) = Ax, x(0) = xo,y = Cx,
(29)
deci observabilitatea este o proprietate in caracterizarea careia intervine numaiperechea de matrici (C,A) – observati ordinea in pereche – . Din (29) rezulta
y(τ) = CeAτxo, τ ≥ 0. (30)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 59 Observabilitatea
Stare/Sistem Observabil(a)
Pentru studiul observabilitatii este mai simplu sa introducem notiunea de stareneobservabila in loc de cea de stare observabila.Definitia 21. O stare x ∈ Rn se numeste neobservabila la momentul t > 0 dacapentru x(0) = x regimul liber al iesirii y este identic zero pe intervalul [0, t],i.e., y(τ) = 0, 0 ≤ τ ≤ t, cu y(τ) furnizat de (30).
Notiunea de stare observabila se obtine prin negarea definitiei de mai sus.
Gramian de Observabilitate
Pentrul studiul observabilitatii se introduce Gramianul de Observabilitate la mo-mentul t > 0 definit de
Lo(t) =
∫ t
0
eAT τCTCeAτdτ. (31)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 60 Observabilitatea
Observatii: a) Lo(t) = Lo(t)T ;
b) Lo(t) ≥ 0;c) Se poate obtine din nou o descompunere ortogonala a lui Rn in raport cu KerLo
si ImLo.
Caracterizarea Observabilitatii prin Gramianul de Observabilitate
Teorema 22. Fie t > 0 fixat (se poate si t ≥ 0). Starea x este neobservabila lamomentul t > 0 daca si numai daca x ∈ KerLo(t). Mai mult, daca o stare esteneobservabila la un t > 0 atunci este neobservabila la orice alt moment de timpT > 0.
Demonstratie. Necesitatea: Presupunem ca x este neobservabila la momentult > 0 adica y(τ) = CeAτx = 0, 0 ≤ τ ≤ t. De aici rezulta
0 = yT (t)y(t) = ∥y(t)∥2 =∫ t
0
xTeAT τCTCeAτxdτ = xTLo(t)x, (32)
de unde rezulta ca Lo(t)x = 0 sau inca x ∈ KerLo(t), q.e.d.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 61 Observabilitatea
Suficienta: Avem x ∈ KerLo(t) de unde rezulta xTLo(t)x = 0 si folosind lantulde egalitati din (32) obtinem ∥y(τ)∥2 = 0, 0 ≤ τ ≤ t. Sa observam in plus cadeoarece y(τ) este analitica si nula pe un interval inchis nenul rezulta ca y(T ) = 0pentru orice T > 0, q.e.d.
Din cele discutate mai sus am vazut ca (ne)observabilitatea unei stari nu depindede momentul de timp. In continuare vom obtine o caracterizare a subspatiuluistarilor neobservabile pe baza matricii de observabilitate – notiune duala celei dematrice de controlabilitate.
Caracterizarea Observabilitatii prin Matricea de Observabilitate
CAPITOLUL 3: PROPRIETATI STRUCTURALE 62 Observabilitatea
Introducem matricea de observabilitate asociata unui sistem dinamic :
Q :=
CCACA2
...CAn−1
(33)
(sau mai precis unei perechi matriciale (C,A), C ∈ Rp×n, A ∈ Rn×n). Matriceade observabilitate are dimensiune (np)× n.Teorema 23. Fie t > 0 fixat. Atunci x ∈ KerLo(t) ⇔ x ∈ KerQ =: Q, i.e.,
KerLo(t) = Q. (34)
Demonstratie. Exercitiu (demonstratie similara celei date pentru Teorema 13).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 63 Observabilitatea
Observatii: a) Avem deci ca
KerLo(t) = KerQ, ∀t > 0.
b) O stare x ∈ Rn este observabila/neobservabila independent de momentul t > 0– cu anumite precautii se poate lua t ≥ 0. Proprietatea este intrinseca starii x siperechii (C,A).c) Se poate introduce definitia echivalenta: o stare x s.n. neobservabila dacaexista t > 0 pentru care x este neobservabila la acest moment.
Introducem notiunea de sistem observabil (sau pereche (C,A) observabila) cusemnificatia ca fiecare stare x ∈ Rn, x = 0 este observabila. Avem atunciurmatorul rezultat central.Teorema 24. Fie perechea (C,A).1. O stare x este neobservabila daca si numai daca x ∈ Q.2. Perechea (C,A) (sau sistemul corespunzator) este observabila (observabil)daca si numai daca singura stare neobervabila este 0, i.e. Q = {0} (sau, echiva-lent, rankQ = n).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 64 Observabilitatea
Gramian de Observabilitate in Timp Infinit
Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limt→∞Lo(t)este finita, se noteaza cu Lo ∈ Rn×n = LT
o ≥ 0 si este numita Gramian deObservabilitate asimptotic. El verifica automat ecuatia Lyapunov
ATLo + LoAT + CTC = 0
si are expresia
Lo :=
∫ ∞
0
eAT τCTCeAτdτ.
Observatii: a) Similar ca in cazul controlabilitatii, observabilitatea unui sistem sepoate testa dpdv procedural verificand ca rankQ = n (matricea Q este monica –rang intreg pe coloane).b) Daca perechea (C,A) este observabila atunci automat Lo(t) > 0 si Lo > 0.Gramianul de observabilitate asimptotic se poate calcula ca solutia unica a ecuatieiLyapunov respective.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 65 Observabilitatea
c) Daca x ∈ Rn arbitrara, atunci putem descompune unic x = xI + xK, undexI ∈ ImLo(t) si xK ∈ KerLo(t) (deoarece Rn := ImLo(t)⊕KerLo(t)). Atunci
y(t) = CeAtx = CeAtxI + CeAtxK = CeAtxI.
Deci cu exceptia sistemelor din KerLo(t), toate celelalte “se vad” la iesire.
Subspatii neobservabile
Se introduc
Qk :=
CCA...CAk−1
, Nk := KerQk, k ≥ 1,
numite matricea de observabilitate respectiv subspatiul neobservabil in k pasi.Nk poseda urmatoarele proprietati:
CAPITOLUL 3: PROPRIETATI STRUCTURALE 66 Observabilitatea
a) Nk = ∩ki=1KerCAi−1 = ∩k
i=1A−i+1KerC (A−1 semnifica aici preimaginea si
nu inversa !);b) Nk+1 = KerC ∩A−1Nk;c) . . . ⊂ N2 ⊂ N1 ⊂ N0 := Rn adica subspatiile neobservabile Nk formeaza unlant descrescator. De aici rezulta ca exista un intreg µ, n ≥ µ ≥ 0, a.i.
. . .Nµ+2 = Nµ+1 = Nµ = Nµ−1 = . . . = N1 = N0
sau pe scurt
limk→∞
Nk = Nµ = Nn.
Intregul µ se numeste indice de observabilitate iar Nµ = Nn se numeste subspatiulneobservabil a perechii (C,A). Avem ca
N = KerQ.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 67 Observabilitatea
In limbaj matricial obtinem
0 < rankQ1 < rankQ2 < rankQµ = rankQµ+1 = . . . .
d) Din cele de mai sus obtinem ca
N = KerC ∩A−1N
sau incaAN ⊂ N , N ⊂ KerC
adica N este un subspatiu A–invariant continut in KerC. Mai mult, se poatearata (exercitiu) ca N este cel mai mare subspatiu A–invariant continut in KerC.Deasemenea, considerand ecuatia
T = KerC ∩A−1T
in necunoscuta T rezulta ca N este solutia sa supremala.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 68 Observabilitatea
Principiul Dualitatii
Principiul dualitatii este un principiu fundamental in teoria sistemelor dinamice,aratand in ce conditii anumite proprietati structurale sunt echivalente.Teorema 25 (Principiul dualitatii). Subspatiul controlabil in k pasi al perechii(A,B) este complementul ortogonal al subspatiului neobervabil in k pasi alperechii (BT , AT ), i.e.
Rk(A,B) = Nk(BT , AT )⊥.
In particular, perechea (A,B) este controlabila daca si numai daca perechea(BT , AT ) este observabila.
Pe baza principiului dualitatii se pot formula dualele tuturor rezultatelor obtinutein cazul controlabilitatii.Teorema 26 (Criteriul PBH). Perechea (C,A), C ∈ Rp×n, A ∈ Rn×n, este
CAPITOLUL 3: PROPRIETATI STRUCTURALE 69 Observabilitatea
observabila daca si numai daca
rank
[sI −A
C
]= n, ∀s ∈ C. (35)
Prin dualitate se introduc notiunile de valoare proprie (sau mod) observ-abil/neobservabil. Dam in continuare teorema de descompunere observabila indoua forme complet echivalente.Teorema 27 (Teorema de Descompunere Observabila). Un sistem dinamic oare-care descris de (A,B,C,D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este
intotdeauna echivalent pe stare cu un sistem (A, B, C,D) avand structura
A = TAT−1 =
[A1 A3
O A2
]}n− µ}µ︸︷︷︸ ︸︷︷︸
n− µ µ
,
CAPITOLUL 3: PROPRIETATI STRUCTURALE 70 Observabilitatea
B = TB =
[B1
B2
]}n− µ}µ , C = CT−1 =
[O C2
],︸︷︷︸ ︸︷︷︸
n− µ µ
in care perechea (C2, A2) este observabila. Mai mult, sistemele (A,B,C,D),
(A, B, C,D) si (A2, B2, C2, D) sunt echivalente intrare–iesire, i.e.,
T (s) =
[A BC D
]=
[A B
C D
]=
[A2 B2
C2 D
].
Teorema 28 (Teorema de Descompunere Observabila – varianta). Un sistemdinamic oarecare descris de (A,B,C,D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n,
D ∈ Rp×m este intotdeauna echivalent pe stare cu un sistem (A, B, C,D) avandstructura
A = TAT−1 =
[A1 OA3 A2
]}µ}n− µ︸︷︷︸ ︸︷︷︸
µ n− µ
,
CAPITOLUL 3: PROPRIETATI STRUCTURALE 71 Observabilitatea
B = TB =
[B1
B2
]}µ}n− µ
, C = CT−1 =[C1 O
],︸︷︷︸ ︸︷︷︸
µ n− µ
in care perechea (C1, A1) este observabila. Mai mult, sistemele (A,B,C,D),
(A, B, C,D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e.,
T (s) =
[A BC D
]=
[A B
C D
]=
[A1 B1
C1 D
].
CAPITOLUL 3: PROPRIETATI STRUCTURALE 72 Observabilitatea
3. Teorema de Descompunere Structurala
Avem intai nevoie de reamintirea catorva rezultate de algebra matriciala:• Ecuatie Sylvester;• Subspatiu A–invariant si consecinte.
Consideram un sistem definit de (A,B,C,D). Fie R subspatiul controlabil alperechii (A,B) si N subspatiul neobservabil al perechii (C,A).
FieX1 := R∩N (36)
si introducem subspatiile X2 si X3 ca fiind complementii lui X1 in R si respectivN , i.e.,
R = X1 ⊕X2, (37)
N = X1 ⊕X3. (38)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 73 Teorema de descompunere structurala
Fie deasemenea X4 complementul lui R∪N in Rn, i.e.,
Rn = (R∪N )⊕X4 = X1 ⊕X2 ⊕X3 ⊕X4 (39)
Subspatiile X2, X3 si X4 nu sunt unic definite. Deoarece
AR ⊂ R, ImB ⊂ R (40)
AN ⊂ N , N ⊂ KerC (41)
rezulta ca
AX1 ⊂ X1, X1 ⊂ KerC. (42)
Fie Xi matrici baza pentru subspatiile Xi (i=1...4), Xi =< Xi > si
T :=[X1 X2 X3 X4
]−1. (43)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 74 Teorema de descompunere structurala
Atunci sistemul echivalent pe stare fata de transformarea (42) are forma
A = TAT−1 =
A11 A12 A13 A14
O A22 O A24
O O A33 A34
O O O A44
, B = TB =
B1
B2
OO
C = CT−1 =
[O C2 O C4
],
(44)
structura ce rezulta din (36)-(43). Din teorema de descompunere controlabilarezulta ca perechea ([
A11 A12
O A22
],
[B1
B2
])(45)
este controlabila iar din teorema de descompunere observabila rezulta ca perechea
([C2 C4
],
[A22 A24
O A44
])(46)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 75 Teorema de descompunere structurala
este observabila. Aplicand criteriul PBH pentru perechea (45) rezulta
rank
[sI −A11 −A12 B1
O sI −A22 B2
]= dimX1 + dimX2, ∀s ∈ C
de unde rezulta automat ca
rank[sI −A2 B2
]= dimX2, ∀s ∈ C
deci perechea (A22, B2) este controlabila. Aplicand criteriul PBH dual perechii(46) rezulta similar ca perechea (C2, A22) este observabila. In consecinta rezultaca (sub)sistemul (A22, B2, C2, D) este controlabil si observabil (se mai numestepartea controlabila si observabila a sistemului initial) si inca
T (s) =
[A BC D
]=
[A B
C D
]=
[A22 B2
C2 D
].
CAPITOLUL 3: PROPRIETATI STRUCTURALE 76 Teorema de descompunere structurala
Sintetizand cele de mai sus obtinem urmatorul rezultat remarcabil.Teorema 29 (Teorema de descompunere structurala). Orice sistem arbitrar
(A,B,C,D) este echivalent pe stare cu un sistem (A, B, C,D) cu structura (44)(unde unele blocuri pot avea dimensiune nula !) si echivalent intrare–iesire cusistemul controlabil si observabil (A22, B2, C2, D).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 77 Teorema de descompunere structurala
4. Realizabilitate
Am vazut ca orice sistem dinamic descris de ecuatii de tipul{x(t) = Ax(t) +Bu(t), x(to) = xo
y(t) = Cx(t) +Du(t)(47)
este automat invariant in timp, liniar, cauzal, finit dimensional. In particular,sistemul dinamic este un sistem de convolutie avand matrice de transfer data de
T (s) = C(sI −A)−1B +D.
Matricea de transfer descrie comportarea intrare–iesire in conditii initiale nule sieste o matrice avand drept elemente functii rationale proprii.
Problema naturala: Stiind ca matricea de transfer a unui sistem MIMO esterationala si proprie exista o descriere dinamica a sistemului de tipul (47) ? Mai
CAPITOLUL 3: PROPRIETATI STRUCTURALE 78 Realizabilitate
precis, stiind ca T (s) este o matrice rationala proprie de dimensiune p×m existaintotdeauna patru matrici (A,B,C,D), unde A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n,D ∈ Rp×m a.i. sistemul dinamic corespunzator (47) sa aibe matricea de transferT (s), i.e.,
T (s) = C(sI −A)−1B +D?
Atunci cand exista, cele patru matrici (A,B,C,D) se numesc o realizare arationalei T (s) (sau a sistemului avand ca matrice de transfer pe T (s)).
INTREBARI NATURALE:
• Exista intotdeauna o realizare si daca da cum se poate obtine ? DA!• Este realizarea unica ? NU !• Exista o realizare de dimensiune minima (maxima) ? DA (NU) !• Cum se pot caracteriza realizarile minimale ? Controlabile + observabile!• Cum se pot obtine realizarile minimale ? Teorema de Descompunere Structurala!• Sunt realizarile minimale unice ? NU !• Ce relatie exista intre doua realizari minimale ? Sunt echivalente pe stare !
CAPITOLUL 3: PROPRIETATI STRUCTURALE 79 Realizabilitate
Problema existentei
Fie T (s) o p×m matrice rationala proprie data de
T (s) =
[rij(s)
pij(s)
]1 ≤ i ≤ p1 ≤ j ≤ m
, grad(pij) ≥ grad(rij), ∀i, j,
in care rapoartele se considera ireductibile. Deoarece rationala este proprie avemca D := T (∞) ∈ Rp×m (finit). Problema realizabilitatii rationalei proprii T (s) se
reduce atunci la problema realizabilitatii rationalei strict proprii T (s) = T (s)−D,i.e., trebuie sa gasim trei matrici (A,B,C) a.i.
T (s) = C(sI −A)−1B.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 80 Realizabilitate
Deoarece T (s) este strict proprie avem
T (s) =K0 +K1s+ . . .+Kk−1s
k−1
γ0 + γ1s+ . . .+ γk−1sk−1 + sk(48)
unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun
(monic) al numitorilor tuturor elementelor rationalei T (s) iar Ki, i = 0, . . . , k− 1,sunt p×m matrici constante.
O realizare a lui T (s) este data de
A =
Om Im
. . .Im
−γ0Im −γ1Im . . . −γk−1Im
, B =
Om...
Om
Im
, C =[K0 K1 . . . Kk−1
].
(49)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 81 Realizabilitate
Intr–adevar, cu
Θ(s) :=
ImsIm...sk−1Im
se verifica direct ca
(sI −A)Θ(s) = Bγ(s)
sau incaΘ(s)
γ(s)= (sI −A)−1B. (50)
Cum
CΘ(s) = K0 +K1s+ . . .+Kk−1sk−1
inmultind (50) la stanga cu C si tinand cont de (48) obtinem T (s) = C(sI −A)−1B. Realizarea (A,B,C,D) astfel obtinuta este controlabila si de aceea semai numeste realizarea standard controlabila a lui T (s). Controlabilitatea perechii(A,B) se poate testa imediat cu criteriul PBH. In general, realizarea obtinuta nu
CAPITOLUL 3: PROPRIETATI STRUCTURALE 82 Realizabilitate
este insa observabila (poate fi!). O realizare standard observabila este data de
A =
Om −γ0IpIp −γ1Ip
. . . ...Ip −γk−1Ip
, B =
K0
K1...
Kk−1
, C =[Op Op . . . Ip
].
(51)Aceasta realizare nu este in general controlabila.
Observatie: Pentru matrici de transfer rationale de dimensiuni arbitrare nu existain general posibilitatea sa scriem direct o realizare care sa fie simultan controlabilasi observabila.
Coeficienti Markov si Matrici Hankel
Studiem acum relatiile care exista intre doua realizari ale unei matrici rationaleproprii. In primul rand este clar ca cele doua matrici ”D” sunt egale. DezvoltandT (s) in serie Laurent in jurul punctului s = ∞ obtinem pentru ∥s∥ > r, unde r
CAPITOLUL 3: PROPRIETATI STRUCTURALE 83 Realizabilitate
este ales suficient de mare,
T (s) = Γ1s−1 + Γ2s
−2 + . . . . (52)
Identificand coeficientii din (52) cu ajutorul lui (48) obtinem
Kk−1 = Γ1
Kk−2 = Γ2 + γk−1Γ1
. . . . . . . . .K0 = Γk + γk−1Γk−1 + . . .+ γ1Γ1
0 = Γk+i + γk−1Γk−1+i + . . .+ γ0Γi, i ≥ 1.
Coeficientii matriceali Γi ∈ Rp×m, i ≥ 1, s.n. coeficientii Markov ai matriceirationale T (s).
Daca (A,B,C,D) este o realizare a lui T (s) atunci avem
C(sI −A)−1B +D = D + CBs−1 + CABs−2 + CA2Bs−3 + . . . , (53)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 84 Realizabilitate
pentru ∥s∥ > rA, unde rA este raza spectrala a matricei A.
Coeficientii D si CAi−1B, i ≥ 1, se numesc coeficientii Markov ai sistemului(realizarii) (A,B,C,D). Identificand coeficientii in (52) si (53) obtinem
Γo := D, Γi = CAi−1B, ∀i ≥ 1. (54)
Deci toate realizarile lui T (s) au aceeasi coeficienti Markov, identici cu cei ai luiT (s). Introducem matricile de tip Hankel
Hij =
Γ1 Γ2 . . . Γj
Γ2 Γ3 . . . Γj+1...Γi Γi+1 . . . Γj+i−1
=
CB CAB . . . CAj−1BCAB CA2B . . . CAjB
...CAi−1B CAiB . . . CAj+i−2B
(55)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 85 Realizabilitate
=
CCA...
CAi−1B
[B AB . . . Ai−1B
]= QiRj i ≥ 1, j ≥ 1, (56)
unde Rj este matricea de controlabilitate in j pasi si Qi este matricea deobservabilitate in i pasi. Din aceasta relatie rezulta ca pentru orice doua realizari(A,B,C,D) si (A, B, C,D) ale aceluiasi T (s) avem
QiRj = QiRj, ∀i ≥ 1, j ≥ 1. (57)
Observatie: Matricile Hankel cu toate ca au dimensiuni arbitrar de mari au totusirangul marginit de n. Acest lucru rezulta din ultima egalitate din (56).
Realizari minimale
Definitia 30.O realizare (A,B,C,D) a rationalei proprii T (s) se numeste min-imala daca orice alta realizare are dimensiunea spatiului starilor mai mare sauegala cu aceasta.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 86 Realizabilitate
Teorema 31. O realizare este minimala daca si numai daca este controlabila siobservabila.
Demonstratie. Conditia este necesara. P.p. prin reducere la absurd ca realizareaminimala (A,B,C,D) de dimensiune n nu este controlabila si/sau observabila.Atunci printr–o transformare de echivalenta aducem sistemul la forma din teo-rema de descompunere structurala si rezulta ca realizarea (A22, B2, C2, D) aredimensiune strict mai mica ceea ce contrazice ipoteza de minimalitate a realizariioriginale.
Conditia este suficienta. Presupunem ca realizarea (A,B,C,D) de dimensiune neste controlabila si observabila. Atunci
rankRn = rankQn = n
rezultand in continuare ca
rankQnRn = rankRn − dim(ImRn ∩KerQn) = n. (58)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 87 Realizabilitate
P.p. prin absurd ca (A,B,C,D) nu este minimala. Atunci exista o realizare
(A, B, C,D) de dimensiune n cu
n < n.
Din (57) rezulta ca
rank QnRn = rankQnRn
ceea ce este absurd intrucat rank Qn ≤ n si rank Rn ≤ n.
Teorema 32. Oricare doua realizari minimale ale unei matrici de transfer pro-prii T (s) sunt echivalente pe stare.
Demonstratie. Fie (A,B,C,D) si (A, B, C,D) doua realizari minimale ale luiT (s). Conform teoremei precedente, ambele realizari au aceeasi dimensiune n sisunt controlabile si observabile. Din (56) avem
QnRn+1 = QnRn+1 (59)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 88 Realizabilitate
sau inca Qn
[B ARn
]= Qn
[B ARn
]de unde rezulta
QnB = QnB, QnARn = QnARn. (60)
Deoarece Qn este monica atunci QTnQn este nesingulara si din prima relatie din
(60) rezulta
B = TB (61)
unde
T := (QTnQn)
−1QTnQn ∈ Rn×n.
Similar, deoarece Rn este epica rezulta ca RnRTn este nesingulara si din a doua
egalitate din (60) rezulta ca
A = TAS (62)
unde
S = RnRTn (RnR
Tn )
−1 ∈ Rn×n.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 89 Realizabilitate
Din (59) rezulta ca CCA...
[Rn AnB
]=
C
CA...
[Rn AnB
]
de unde CRn = CRn sau incaC = CS. (63)
Din (61), (62) si (63) rezulta ca cele doua realizari sunt echivalente pe stare dacaaratam ca S = T−1. Intr–adevar,
TS = (QTnQn)
−1QTnQnRnR
Tn (RnR
Tn )
−1 = (QTnQn)
−1QTnQnRnR
Tn (RnR
Tn )
−1 = I.
Teorema 33. Fie µ si ν cei mai mici intregi pentru care rankHµ,ν =rankHµ+i,ν+j. Atunci ν = µ = n, unde n este dimensiunea realizarii mini-male.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 90 Realizabilitate
Demonstratie. Rezulta automat din (56).
Observatie: Pentru orice sistem descris de matrice de transfer rationala proprieT (s) putem calcula coeficientii Markov (unici) Γi pe baza descompunerii (52).Mai mult, daca stim o realizare (A,B,C,D) a sistemului dinamic cu matricea detransfer T (s), atunci coeficientii Markov se pot calcula pe baza expresiilor explicite(54). Mai mult, coeficientii Markov determina unic sirul dublu indexat de matriciHankel Hij care au rang finit egal cu n, pentru i, j ≥ n, unde n este dimensiuneaunei realizari minimale.
Problema inversa (fundamentala): Presupunand acum ca avem un sir de coeficientiMarkov Γi ∈ Rp×m, i ≥ 0, se pune problema fireasca daca exista intotdeauna unsistem dinamic care are acesti coeficienti Markov ? Mai exact, seria din membruldrept din (52) converge intotdeauna la o rationala proprie ce este matricea detransfer a unui sistem (A,B,C,D) ? Sau, echivalent, exista intotdeauna matricile(A,B,C,D) de dimensiuni potrivite a.i. sa aibe loc relatiile (54) ?
Raspuns: NU (in general)! Rezultatul urmator da un raspuns complet acestei
CAPITOLUL 3: PROPRIETATI STRUCTURALE 91 Realizabilitate
probleme.Teorema 34. Fie un sir de matrici reale Γi ∈ Rp×m, i ≥ 0, pentru care existaj ≥ 1 a.i. Γj = 0. Atunci exista o p×m matrice rationala proprie T (s) ai careicoeficienti Markov sunt exact elementele sirului Γi daca si numai daca existaun intreg n ≥ 1 a.i.
n = rankHn+i,n+j, ∀i, j ≥ 0. (64)
In cazul in care (64) are loc, intregul n ≥ 1 se numeste gradul McMillan alrationalei T (s).
Observatie (fundamentala): Gradul McMillan al unei rationale proprii T (s)coincide cu dimensiunea unei realizari minimale.Corolarul 35. Functia f : N → Rp×m cu f(i) = Γi, i ≥ 0, este z–transformabila(are transformata z) si transformata z este o matrice rationala proprie daca sinumai daca este indeplinita conditia (64).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 92 Realizabilitate
Procedura de obtinere a unei realizari minimale pentru omatrice rationala proprie
T (s) =
[rij(s)
pij(s)
]1 ≤ i ≤ p1 ≤ j ≤ m
, grad(pij) ≥ grad(rij), ∀i, j.
Pasul 0: Se pune D := T (∞) si se aduce matricea rationala (strict proprie)
T (s) := T (s)−D la forma
T (s) =K0 +K1s+ . . .+Kk−1s
k−1
γ0 + γ1s+ . . .+ γk−1sk−1 + sk(65)
unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun
(monic) al numitorilor tuturor elementelor rationalei T (s) iar Ki, i = 0, . . . , k− 1,sunt p×m matrici constante.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 93 Realizabilitate
Pasul 1: Se scrie realizarea standard controlabila
A =
Om Im
. . .Im
−γ0Im −γ1Im . . . −γk−1Im
, B =
Om...
Om
Im
, C =[K0 K1 . . . Kk−1
],
(66)in care perechea (A,B) este automat controlabila.Pasul 2: Se aplica teorema de descompunere observabila perechii (C,A) si seobtine
A = TAT−1 =
[A1 A3
O A2
]}n− µ}µ︸︷︷︸ ︸︷︷︸
n− µ µ
,
B = TB =
[B1
B2
]}n− µ}µ , C = CT−1 =
[O C2
],︸︷︷︸ ︸︷︷︸
n− µ µ
in care perechea (C2, A2) este observabila.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 94 Realizabilitate
Pasul 3: Deoarece perechea (A,B) este controlabila, rezulta automat ca
perechile (A, B) si (A2, B2) sunt deasemenea controlabile. Prin urmare sistemul(A2, B2, C2, D) care este echivalent intrare–iesire cu sistemul original (A,B,C,D)este controlabil, observabil si deci minimal. Prin urmare (A2, B2, C2, D) este orealizare minimala pentru T (s) si
T (s) = C2(sI −A2)−1B2 +D.
Observatii: a) Din punct de vedere procedural, algoritmul de calcul al realizariiminimale urmeaza exact pasii de mai sus cu observatia ca transformarea T de lapasul 2 se alege intotdeauna ortogonala T−1 = TT .b) Pentru obtinerea unei realizari minimale se poate proceda dual, calculand laPasul 1 o realizare standard observabila (51) si facand la Pasul 2 o descompunerecontrolabila (25)–(26).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 95 Realizabilitate
5. Conexiunile Sistemelor Dinamice pe Stare si Operatii cuSisteme
Consideram cateva posibile conexiuni standard ale sistemelor dinamice descrise prinintermediul realizarilor de stare si ne punem problema sa gasim o realizare de starepentru sistemul echivalent rezultant. In particular, vom considera urmatoareletipuri de conexiuni: serie, paralel, bucla cu reactie inversa, transformare liniarfractionara si produs Redheffer.
Intocmai ca in cazul sistemelor cu o intrare si o iesire (SISO) anumite conexiunipot sa nu fie definite (in sens general sau in sens strict) – cu semnificatia casistemul rezultant nu are matrice de transfer (vectorul marimilor de iesire nu esteunic definit pentru un vector dat de marimi de intrare) sau matricea de transferrezultanta nu este proprie (sistemul rezultant nu are o realizare standard de stare).Prin urmare vom spune ca o anumita conexiune a doua sisteme pe stare estebine definita daca sistemul rezultant este deasemenea un sistem pe spatiul starilor.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 96 Conexiuni si operatii
Buna definire a conexiunii implica deci ca sistemul rezultant are o matrice detransfer rationala care este proprie.
Ca un exemplu relevant pentru discutia de mai sus sa consideram inversul unuisistem (A,B,C,D) – sistemul care are intrarile si iesirile inversate. Inversul existadaca si numai daca matricea D este inversabila iar o realizare a inversului este data
xI(t) = (A−BD−1C)xI(t) + BD−1uI(t),yI(t) = −D−1CxI(t) + D−1uI(t),
(67)
(uI(t) = y(t), yI(t) = u(t)) iar matricea de transfer este
T−1(s) =
[AI BI
CI DI
]=
[A−BD−1C BD−1
−D−1C D−1
]. (68)
Observatii: • Un sistem este inversabil daca si numai daca are acelasi numar deintrari si iesiri (p = m).• Ipoteza de inversabilitatea a lui D nu este necesara pentru existenta inversei
CAPITOLUL 3: PROPRIETATI STRUCTURALE 97 Conexiuni si operatii
matricii de transfer T (vazuta ca matrice rationala) si este facuta doar pentru aasigura ca T−1(s) este proprie si deci este matricea de transfer a unui sistem pespatiul starilor (AI, BI, CI, DI).• Daca sistemul original este controlabil/observabil/minimal atunci realizareainversului (68) este automat controlabila/observabila/minimala. – Exercitiu!
Conexiunea paralel
Fie doua sistemex1(t) = A1x1(t) +B1u1(t),y1(t) = C1x1(t) +D1u1(t),
(69)
six2(t) = A2x2(t) +B2u2(t),y2(t) = C2x2(t) +D2u2(t),
(70)
avand matricile de transfer
T1 =
[A1 B1
C1 D1
], T2 =
[A2 B2
C2 D2
], (71)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 98 Conexiuni si operatii
respectiv. Daca cele doua sisteme au acelasi numar de intrari si iesiri (m1 = m2,p1 = p2), atunci se defineste conexiunea paralel a lui T1 cu T2 ca fiind sistemul careare intrarea u obtinuta punand u1 ≡ u2 = u si iesirea y := y1 + y2. Conexiuneaparalel este intotdeauna bine definita, matricea de transfer a sistemului rezultanteste
T (s) := T1(s) + T2(s), (72)
avand o realizare data de
T (s) =
A1 O B1
O A2 B2
C1 C2 D1 +D2
. (73)
Conexiunea serie
Fie doua sisteme (69) si (70), avand matricile de transfer date in (71). Dacanumarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului
CAPITOLUL 3: PROPRIETATI STRUCTURALE 99 Conexiuni si operatii
T2 atunci se defineste conexiunea serie a lui T1 cu T2 (in aceasta ordine) cafiind sistemul cu intrarea u := u1 si iesirea y := y2, obtinut punand u2 ≡ y1.Conexiunea serie este intotdeauna bine definita, matricea de transfer a sistemuluirezultant este
T (s) := T2(s)T1(s), (74)
(observati ordinea !) iar o realizare pentru sistemul rezultant este data de
T (s) =
A2 B2C1 B2D1
O A1 B1
C2 D2C1 D2D1
. (75)
Conexiunea in reactie inversa
Fie doua sisteme (69) si (70), avand matricile de transfer date in (71). Dacanumarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului T2
si numarul de iesiri ale sistemului T2 este egal cu numarul de intrari ale sistemului
CAPITOLUL 3: PROPRIETATI STRUCTURALE 100 Conexiuni si operatii
T1 (p1 = m2, p2 = m1) atunci se defineste conexiunea in reactie inversa a lui T1
cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u si iesirea y := y1, obtinutpunand u1 ≡ u + y2 si u2 ≡ y1. Conexiunea in reactie inversa este intotdeaunabine definita daca si numai daca matricea[
I D1
D2 I
](76)
este nesingulara. In acest caz functia de transfer a sistemului echivalent este
T (s) := T1(s)(I − T2(s)T1(s))−1, (77)
iar o realizare pentru sistemul rezultant este
T (s) =
A1 +B1D2S
−1C1 B1S−1C2 B1S
−1
B2S−1C1 A2 +B2D1S
−1C2 B2D1S−1
S−1C1 S−1D1C2 D1S−1
, (78)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 101 Conexiuni si operatii
unde S := I −D1D2 si S := I −D2D1 care sunt ambele inversabile din ipotezade nesingularitate a matricii (76).Exercitiu: Ce se poate spune despre controlabilitatea/observabilitatea/minimalitateasistemului echivalent paralel/serie/reactie inversa daca stim ca sistemele compo-nente sunt controlabile/observabile/minimale ?
Observatie: Pentru conexiunile paralel/serie/reactie inversa nu este necesar caspatiul starilor sistemelor componente sa fie de dimensiune egala.
Transformare liniar fractionara (TLF)
Aceste conexiuni pot fi privite ca o extensie la clasa sistemelor (sau mai precis laclasa functiilor matriceale rationale) a transformari liniar fractionare (sau Moebius)din cazul scalar
f(λ) =a+ bλ
c+ dλ,
unde a, b, c, d sunt scalari.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 102 Conexiuni si operatii
Fie doua sisteme date de
x = Ax+B1u1 +B2u2,y1 = C1x+D11u1 +D12u2,y2 = C2x+D21u1 +D22u2,
(79)
sixc = Acxc +Bcuc,yc = Ccxc +Dcuc,
(80)
avand matricile de transfer
T (s) =
[T11(s) T12(s)T21(s) T22(s)
]=
A B1 B2
C1 D11 D12
C2 D21 D22
(81)
si
Tc(s) =
[Ac Bc
Cc Dc
]. (82)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 103 Conexiuni si operatii
Un sistem de tipul (81) se numeste sistem generalizat si are intrarile si iesirilepartitionate in doua clase avand anumite semnificatii in controlul automat. DacaT22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p2,pc = m2) atunci de defineste transformarea liniar fractionara inferioara (TLFI) alui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesireay := y1 obtinut punand u2 ≡ yc si uc ≡ y2. Conexiunea este bine definita daca sinumai daca matricea
[I D22
Dc I
](83)
este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalenteste
TR = TLFI(T, Tc) := T11 + T12Tc(I − T22Tc)−1T21, (84)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 104 Conexiuni si operatii
si are o realizare data de
TR(s) =
A+B2S
−1DcC2 B2S−1Cc B1 +B2S
−1DcD21
BcS−1C2 Ac +BcS
−1D22Cc BcS−1D21
C1 +D12DcS−1C2 D12S
−1Cc D11 +D12DcS−1D21
,
(85)
unde S := I −D22Dc si S := I −DKD22 care sunt ambele inversabile din ipotezade inversabilitate asupra matricii (83). In particular avem DcS
−1 = S−1Dc si
S−1D22 = D22S−1 asa cum rezulta din identitatea matriciala U(I − V U)−1 =
(I−UV )−1U care are loc pentru oricare matrici U si V de dimensiuni compatibile.
Consideram din nou doua sisteme (79) si (80) avand matricile de transfer (81)si (82). Daca T11 are numarul de intrari/iesiri egal cu numarul de iesiri/intrariale lui Tc (mc = p1, pc = m1) atunci se defineste transformarea liniar fractionarasuperioara (TLFS) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrareau := u2 si iesirea y := y2 obtinut punand u1 ≡ yc si uc ≡ y1. Conexiunea este
CAPITOLUL 3: PROPRIETATI STRUCTURALE 105 Conexiuni si operatii
bine definita daca si numai daca matricea[I D11
Dc I
](86)
este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalenteste
TR = TLFS(T, Tc) := T22 + T21Tc(I − T11Tc)−1T12, (87)
si are o realizare data de
TR =
A+B1U
−1DcC1 B1U−1Cc B2 +B1U
−1DcD12
BcU−1C1 Ac +BcU
−1D11Cc BcU−1D12
C2 +D21DcU−1C1 D21U
−1Cc D22 +D21DcU−1D12
,
(88)
unde am notat U := I −D11Dc si U := I −DcD11 care sunt ambele inversabileintrucat matricea (86) este inversabila. Avem deasemenea ca DcU
−1 = U−1Dc si
U−1D11 = D11U−1.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 106 Conexiuni si operatii
Produs Redheffer
Aceasta conexiune este o extensie a transformarii liniar fractionare. Consideramdoua sisteme generalizate (79) si
xc = Acxc +Bc1uc1 +Bc2uc2,yc1 = Cc1xc +Dc11uc1 +Dc12uc2,yc2 = Cc2xc +Dc21uc1 +Dc22uc2,
(89)
avand matricile de transfer date de (81) si respectiv
Tc =
[Tc11 Tc12
Tc21 Tc22
]=
Ac Bc1 Bc2
Cc1 Dc11 Dc12
Cc2 Dc21 Dc22
. (90)
Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc11
(mc1 = p2, pc1 = m2) atunci se defineste produsul Redheffer al lui T cu Tc (in
CAPITOLUL 3: PROPRIETATI STRUCTURALE 107 Conexiuni si operatii
aceasta ordine) ca fiind sistemul cu intrarea u :=
[u1
uc2
]si iesirea y :=
[y1yc2
]obtinut punand u2 ≡ yc1 si uc1 ≡ y2. Conexiunea este bine definita daca si numai
daca
[I D22
Dc11 I
]este inversabila. In acest caz obtinem sistemul generalizat
TR =
T ⊗ Tc :=
[T11 + T12Tc11(I − Tc22Tc11)
−1T21 T12(I − Tc11T22)−1Tc12
Tc21(I − T22Tc11)−1T21 Tc22 + Tc21T22(I − Tc11T22)
−1Tc12
],
(91)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 108 Conexiuni si operatii
avand o realizare data de
TR =
A+B2S
−1Dc11C2 B2S−1Cc1 B1 +B2S
−1Dc11D21
Bc1S−1C2 Ac +Bc1S
−1D22Cc1 Bc1S−1D21
C1 +D12Dc11S−1C2 D12S
−1Cc1 D11 +D12Dc11S−1D21
Dc21S−1C2 Cc2 +Dc21S
−1D22Cc1 Dc21S−1D21
B2S−1Dc12
Bc2 +Bc1S−1D22Dc12
D12S−1Dc12
Dc22 +Dc21S−1D22Dc12
(92)
unde s–a notat S := I−D22Dc11 si S := I−Dc11D22 care sunt ambele inversabile.
Observatie: Daca in (81) avem T22(∞) = D22 = 0 atunci TLF si produsulRedheffer ale lui T cu Tc sunt automat bine definite.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 109 Conexiuni si operatii
6. Elemente Structurale ale Matricilor Rationale
Anumite elemente structurale ale matricilor rationale joaca un rol aparte in teoriacontrolului sistemelor dinamice pe spatiul starilor: poli, zerouri, forma SmithMcMillan, directiile de poli/zerouri, indicii singulari stanga si dreapta.
Conceptele de pol si zerou sunt considerabil mai dificile decat in cazul scalar inprincipal datorita posibilitatii ca o matrice rationala sa aibe pol si zerou in acelasipunct so ∈ C, cat si datorita posibilitatii existentei polilor si zerourilor la infinit(un concept relativ greu de explicitat in cazul multivariabil).
In cazul sistemic avem doua notiuni de poli: poli ai matricii de transfer (vazutaca matrice rationala) si poli ai sistemului pe spatiul starilor definiti ca fiind valorileproprii ale matricii A. Mai precis, so ∈ C este pol al matricii de transfer rationaleT (s) daca este pol cel putin al unui element al sau considerat ca rationalaireductibila. Polii matricii de transfer coincid cu polii sistemului daca si numaidaca realizarea corespunzatoare este minimala.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 110 Elemente Structurale ale Rationalelor
In cazul sistemic exista si doua notiuni de zerouri: zerouri de transmisie si zerouriinvariante. Notiunea de zerou de transmisie se introduce pe baza matricii detransfer rationale iar cea de zerou invariant pe baza unei matrici polinomialeconstruite pe baza unei realizari de stare (A,B,C,D).
Pentru a intelege intuitiv notiunea de zerou sa presupunem ca so ∈ C nu este polal rationalei. Atunci s0 se numeste zerou al rationalei T (s) daca si numai
rankT (so) < rank nT (s)
unde prin rank nT (s) intelegem rangul normal al rationalei, i.e., rangul pentruaproape toti s ∈ C. In termeni sistemici, cand T (s) are semnficatia de matricede transfer a unui sistem, zerourile ei se mai numesc zerouri de transmisie alesistemului.
Pentru a introduce notiunea de zerou invariant al unui sistem de tipul (A,B,C,D)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 111 Elemente Structurale ale Rationalelor
sa presupunem conditii initiale nule. Atunci avem in transformate Laplace
(sI −A)x−Bu = 0,Cx+Du = y
sau echivalent [sI −A −B
C D
] [xu
]=
[0y
].
Matricea polinomiala (de grad 1)
S(s) :=
[sI −A −B
C D
]∈ R[s](n+p)×(n+m) (93)
se numeste matricea sistem (sau de transmisie) si joaca un rol central in studiulsistemelor dinamice liniare atat din punct de vedere teoretic cat si procedural.s0 ∈ C se numeste zerou invariant al sistemului daca
rankS(s0) < rank nS(s) =: r.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 112 Elemente Structurale ale Rationalelor
Rangul normal este egal cu dimensiunea maxima a unui minor al lui S(s) carenu are determinantul identic nul. Fie χ(s) cel mai mare divizor comun altuturor determinantilor minorilor de rang (avand dimensiunea egala cu rangulnormal). Atunci zerourile invariante ale sistemului (A,B,C,D) sunt exact zerourilepolinomului χ(s).
Din identitatea [sI −A −B
C D
]=[
I OC(sI −A)−1 I
] [sI −A O
O T (s)
] [I −(sI −A)−1BO I
]se observa ca daca s0 ∈ Λ(A) atunci so este zerou invariant daca si numai dacaeste zerou de transmisie.
Problemele majore apar insa atunci cand exista zerouri comune cu poli. Pentru aintelege riguros aceste concepte avem nevoie de o teorie mai sofisticata a formelorcanonice pentru matrici rationale si matrici polinomiale de gradul 1 (numitefascicole matriciale).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 113 Elemente Structurale ale Rationalelor
Forma Smith–McMillan a rationalei T (s) – o forma canonica sub transformariunimodulare –
Teorema 36 (Forma Smith–McMillan). Fie T (s) o p ×m matrice rationala cucoeficienti in R avand rangul normal r. Atunci exista o p × p matrice polino-miala U(s) si o m × m matrice polinomiala V (s), ambele cu coeficienti in Rsi determinant constant nenul (independent de s), care aduce T (s) la formaSmith–McMillan
S(s) = U(s)T (s)V (s), (94)
unde
S(s) := diag
{ϵ1(s)
η1(s),ϵ2(s)
η2(s), . . . ,
ϵr(s)
ηr(s), 0, . . . , 0
}, (95)
polinoamele ϵi(s), ηi(s) sunt monice (au coeficientul termenului de grad maximegal cu 1), sunt doua cate doua coprime pentru i = 1, . . . , r, si satisfac propri-etatile de divizibilitate
ϵi(s) | ϵi+1(s),ηi+1(s) | ηi(s),
i = 1, . . . , r − 1. (96)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 114 Elemente Structurale ale Rationalelor
Mai mult, polinoamele ϵi(s) si ηi(s) sunt unic definite de T (s) si se numescdivizori elementari ai lui T (s).
Definimz(s) := ϵ1(s) · · · ϵr(s),p(s) := η1(s) · · · ηr(s).
(97)
Atunci cele nz (np) radacini ale lui z(s) (p(s)) sunt prin definitie zerourile (polii)finiti ai lui T (s).
Ordinul zeroului (polului) s0 al lui T (s) este prin definitie multiplicitatea sa caradacina a polinomului z(s) (p(s)).
Ordinele partiale ale zeroului (polului) s0 al lui T (s) sunt prin definitie mul-tiplicitatile nenule ale lui s0 ca radacina a polinoamelor ϵi(s) (ηi(s)), pentrui = 1, . . . , r.
Spunem ca ∞ este zerou (pol) al lui T (s) daca s = 0 este zerou (pol) al matricii
rationale T (s) = T (1s), si definim ordinele zeroului (polului) s = ∞ al lui T (s) ca
fiind ordinele zeroului (polului) s = 0 al lui T (s).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 115 Elemente Structurale ale Rationalelor
Notam cu Z(T ) si respectiv P(T ) reuniunea tuturor zerourilor si respectiv tuturorpolilor (incluzand infinitul si repetitii in acord cu ordinele elementelor).
Gradul McMillan al lui T este prin definitie suma tuturor ordinelor polilor (finiti siinfiniti). Deci gradul McMillan al unei matrici rationale este egal cu numarul depoli (socotind ordinele inclusiv ale polilor de la infinit).
Observatie: Daca rationala este proprie atunci nu are poli la infinit si definitiile demai sus se simplifica corespunzator.
Cand suntem interesati de un singur punct s0 se poate folosi o forma Smith–McMillan locala care pune in evidenta numai ordinele zeroului si polului din s0.Teorema 37 (Forma Smith–McMillan locala). Fie T (s) o p×m matrice rationalacu coeficienti in R, avand rangul normal r, si fie s0 ∈ C. Atunci exista o p× pmatrice rationala U(s) si o m×m matrice rationala V (s), ambele nesingularesi fara poli sau zerouri in so, care aduc T (s) la forma Smith–McMillan locala(in jurul lui s0),
Sℓ(s) = U(s)T (s)V (s), (98)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 116 Elemente Structurale ale Rationalelor
unde
Sℓ(s) := diag{(s− s0)
k1, (s− s0)k2, . . . , (s− s0)
kr}, (99)
si
k1 ≤ k2 ≤ . . . ≤ kr
sunt numere intregi. Mai mult, intregii strict pozitivi (sau strict negativi) kisunt ordinele partiale ale lui s0 ca zerou (pol) al lui T .
Forma Smith–McMillan in jurul lui s = ∞ se obtine din forma Smith–McMillan alui T (1s) in jurul lui s = 0.
Baze minimale pentru spatiile nucleu la stanga si dreapta
Fie T (s) o p×m matrice rationala avand rangul normal r.
Nucleul la dreapta (peste rationale) are dimensiune m− r iar nucleul la stanga aredimensiune p− r. Introducem in continuare notiunile de indici minimali la dreaptasi stanga. Pentru acesta avem nevoie de cateva notiuni de subspatii rationale.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 117 Elemente Structurale ale Rationalelor
Definim gradul unui vector de polinoame ca fiind cel mai mare grad al elementelorrespectivului vector. Dandu–se un subspatiu in Rm(s) (vectori rationali de dimen-siune m), putem intotdeauna construi o baza polinomiala pentru el. Coloaneleunei matrici polinomiale P(s) formeaza o baza minimala pentru spatiul pe care-lgenereaza daca au loc simultan:
1. P (s) este monica pentru toti s ∈ C finiti;
2. P (s) este redusa pe coloane (sau proprie pe coloane). Mai precis, fie ni gradulcoloanei i a lui P (s) si construim matricea constanta Pn a carei coloana i estecoeficientul vectorial al lui sni in coloana i a lui P(s). Atunci P(s) este de tipcoloana redusa daca Pn este monica.
Echivalent, o baza polinomiala este minimala daca suma tuturor gradelor vectorilorpolinomiali care o formeaza este cat mai mica posibila.
Multimea gradelor vectorilor din orice baza minimala a unui subspatiu este invari-anta in raport cu operatiile unimodulare pe coloane, si aceste grade se numesc
CAPITOLUL 3: PROPRIETATI STRUCTURALE 118 Elemente Structurale ale Rationalelor
indici minimali (sau indici Kronecker ) ai subspatiului.
Se numesc indici minimali la stanga si dreapta ai unei matrici rationale multimeaindicilor minimali ai subspatiilor nule (nucleu) la stanga si respectiv la dreapta.
Pentru o matrice rationala arbitrara are loc o relatie interesanta intre indiciistructurali. Fie nr si nℓ suma indicilor minimali la dreapta si respectiv la stanga sifie nz si np numarul total de zerouri si respectiv de poli. Atunci are loc relatia
np = nz + nr + nℓ.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 119 Elemente Structurale ale Rationalelor
7. Fascicole Matriciale si Forme Canonice
Fie M si N doua m× n matrici cu elemente in R. Matricea polinomiala (de grad1) sM −N se numeste fascicol matricial sau pe scurt fascicol.
Ne concentram intai atentia asupra fascicolelor sM − N care sunt regulate, i.e.,care sunt patrate (n× n) si au un determinant neidentic nul det(sM −N) ≡ 0.Un fascicol care nu este regulat se numeste singular. In particular, daca M sau Nsunt inversabile atunci fascicolul sM −N este regulat. In general vom fi interesatide fascicole arbitrare (inclusiv singulare).
Dandu-se un fascicol regulat sM − N , cu M,N ∈ Rn×n, problema de gasire asolutiilor ecuatiei polinomiale
χ(s) := det (sM −N) = 0 (100)
se numeste problema de valori proprii generalizate.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 120 Fascicole matriciale
Deoarece M poate fi singulara, polinomul caracteristic χ(s) are gradul nf ≤ n.
Cele nf radacini ale lui χ(s) se numesc valori proprii generalizate finite alefascicolului sM −N .
s = ∞ este o valoare proprie (generalizata) a lui sM − N daca s = 0 este ovaloare proprie (generalizata) a fascicolului reciproc sN −M . Multiplicitatea n∞a valorii proprii de la infinit este prin definitie multiplicitatea valorii proprii s = 0pentru fascicolul sN −M . Evident avem n∞ = n− nf .
Prin urmare un fascicol matricial regulat de dimensiune n × n are intotdeauna nvalori proprii (finite si infinite) care formeaza spectrul fascicolului notat Λ(M,N).
Pentru o valoare proprie s0 exista intotdeauna un vector nenul x ∈ Cn – numitvector propriu generalizat a.i.{
Nx = s0Mx daca s0 este finita,Mx = 0 daca s0 este infinit.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 121 Fascicole matriciale
Forma canonica Weierstrass a unui fascicol regulat
Introducem o relatie de echivalenta pentru fasciole matriciale si studiem intaiproprietatile si consecintele asupra fascicolelor regulate.
Doua fascicole sM −N si sM − N , cu M,N, M, N ∈ Cm×n se numesc (strict)echivalente daca exista doua matrici inversabile Q ∈ Cm×m, Z ∈ Cn×n, a.i.
Q(sM −N)Z = sM − N . (101)
Relatia de echivalenta stricta (101) induce o forma canonica pe multimea fasci-colelor regulate de dimensiune n × n numita forma canonica Weierstrass. Prinurmare, pentru oricare fascicol regulat sM − N , cu M,N ∈ Cn×n, exista douamatrici inversabile Q,Z ∈ Cn×n a.i.
Q(sM −N)Z = sMW −NW
CAPITOLUL 3: PROPRIETATI STRUCTURALE 122 Fascicole matriciale
undesMW −NW := diag (sM∞ − In∞, sInf
−Nf), (102)
Nf este in forma canonica Jordan, M∞ este nilpotenta si este in forma canonicaJordan
M∞ := diag (Js∞1 (0), Js∞2 (0), . . . , Js∞h∞
(0)) (103)
si Jsi(0) este un bloc elementar (nilpotent) Jordan de dimensiune si×si cu valoareproprie s = 0.
Observatii: • Valorile proprii generalizate finite ale fascicolului sM −N coincid cuvalorile proprii ale matricii Nf . Prin urmare se poate folosi matricea Nf pentrua defini conceptele de multiplicitate partiala, algebrica si geometrica a unei valoriproprii generalizate finite a lui sM −N .• Similar, se definesc multiplicitatea partiala, algebrica si geometrica a valorii pro-prii generalizate de la infinit ca fiind multiplicitatea corespunzatoare a valorii propriis = 0 a matricii M∞. Prin urmare pentru s = ∞ multiplicitatile partiale sunt s∞i(i = 1, . . . , h∞), multiplicitatea algebrica este n∞ si satisface n∞ =
∑h∞i=1 s
∞i , iar
multiplicitatea geometrica este h∞.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 123 Fascicole matriciale
•Multimea valorilor proprii generalizate impreuna cu multiplicitatile partiale deter-mina complet forma canonica Weierstrass a unui fascicol matricial regulat (panala o permutare a blocurilor diagonale).
Daca M este inversabila atunci fascicolul nu are are valori proprii infinite si formacanonica Weierstarss se reduce la forma canonica Jordan a matricii M−1N .
CAPITOLUL 3: PROPRIETATI STRUCTURALE 124 Fascicole matriciale
Problema de valori proprii generalizate: cazul general
Extindem in continuare studiul asupra fascicolelor arbitrare (posibil singulare)sM −N de dimensiune m× n cu elemente in R. Un fascicol este numit singulardaca nu este patrat sau daca este patrat dar det(sM − N) ≡ 0. In particular,sM −N are rang constant pentru toti s ∈ C cu exceptia unui numar finit pentrucare are rang strict mai mic.
Observatii: Rangul normal r al fascicolului sM − N este rangul lui sM − Npentru aproape toti s ∈ C. Pentru un fascicol regulat avem m = n = r.Daca νr := n − r > 0 atunci fasciolul are structura singulara la dreapta. Dacaνℓ := m − r > 0 atunci fascicolul are structura singulara la stanga. Un fascicolregulat nu are structura singulara nici la stanga si nici la dreapta.
Polinomul caracteristic χ(s) al fascicolului este cel mai mare divizor comun alpolinoamelor Ri(s), unde {Ri(s)} este multimea tutoror minorilor de dimensiuner.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 125 Fascicole matriciale
Problema rezolvarii ecuatiei polinomiale
χ(s) := χ0 + χ1s+ . . .+ χnfsnf = 0,
cu χnf= 0, se numeste problema de valori proprii generalizate pentru fascicolul
sM −N .
Cele nf radacini ale lui χ(s) se numesc valori proprii finite. Spunem ca s = ∞ estevaloare proprie lui sM −N daca s = 0 este valoare proprie a fascicolului reciprocsN −M sau, echivalent, daca rankM < r. Multiplicitatea n∞ a v.p. de la infiniteste prin definitie multiplicitatea v.p. s = 0 a lui sN −M .
Reuniunea (nedisjuncta) a celor nf + n∞ v.p. generalizate (finite si infinite)formeaza spectrul lui sM −N notat Λ(M,N).
Forma canonica Kronecker a unui fascicol general
Relatia de stricta echivalenta induce o forma canonica pe multimea fascicolelor dedimensiune m × n numita forma canonica Kronecker. Mai exact, pentru oricare
CAPITOLUL 3: PROPRIETATI STRUCTURALE 126 Fascicole matriciale
fascicol sM −N , cu M,N ∈ Cm×n, exista doua matrici inversabile Q ∈ Cm×m siZ ∈ Cn×n a.i.
Q(sM −N)Z = sMKR −NKR,
unde
sMKR −NKR :=
Lϵ1 . . .Lϵνr
sM∞ − In∞sInf
−Nf
LTη1 . . .
LTηνℓ
, (104)
Nf este o matrice in forma canonica Jordan, M∞ este o matrice nilpotenta in
CAPITOLUL 3: PROPRIETATI STRUCTURALE 127 Fascicole matriciale
forma canonica Jordan, si Lk (k ≥ 0) este un k × (k + 1) fascicol bidiagonal
Lk :=
s −1. . . . . .
s −1
.
k poate fi zero corespunzand unei linii sau coloane de zerouri in fascicolul (104).Structura Kronecker este complet determinata de partea regulata si singulara.
Valorile proprii (finite si infinite) ale fascicolului sM − N sunt valorile proprii alefascicolului regulat
s
[M∞ OO Inf
]−
[In∞ OO Nf
]Partea singulara a fascicolului este determinata de structura singulara Kronecker lastanga si dreapta. Blocurile de dimensiune ϵi× (ϵi+1) notate Lϵi, (i = 1, . . . , νr),sunt blocurile elementare Kronecker la dreapta si ϵi ≥ 0 sunt indicii Kronecker ladreapta. Blocurile de dimensiune (ηj + 1) × ηj notate Lηj
T , (j = 1, ..., νℓ), suntblocurile elementare Kronecker la stanga si ηj ≥ 0 sunt indicii Kronecker la stanga.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 128 Fascicole matriciale
Din forma canonica Kronecker avem
rank n(sM −N) = nr + n∞ + nf + nℓ, (105)
unde nr :=∑νr
i=1 ϵi si nℓ :=∑νℓ
j=1 ηj. Daca sM −N este regulat atunci nu exista
indici Kronecker (i.e., blocurile Lϵi, LTηj
dispar) si forma canonica Kronecker sereduce la forma canonica Weierstrass.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 129 Fascicole matriciale
8. Elemente Structurale ale unei Matrici Rationale inTermenii Realizarilor de Stare
Intre elementele structurale ale matricii de transfer rationale T (s) a unui sistemdinamic si formele canonice ale fasciolelor
sI −A,
[sI −A −B
C D
]asociate unei realizari arbitrare – numite fascicolul de poli si fascicolul de zerouri(sau matricea de transmisie) – exista o legatura stransa.Teorema 38. Fie T (s) o p×m matrice rationala proprie avand gradul McMillann si rangul normal r. Fie
T =
[A BC D
](106)
CAPITOLUL 3: PROPRIETATI STRUCTURALE 130
o realizare de dimensiune k cu coeficienti in R si fie
sI −A, sET −AT :=
[sI −A −B−C −D
]fasciolele de poli si respectiv de zerouri asociate acestei realizari.
1. Pentru orice realizare (106) avem:
(a) Rangul normal: Rangurile normale ale lui T (s) si sET −AT satisfac
rank nT (s) = rank n(sET −AT )− k.
(b) Poli: Reuniunea polilor P(T ) este inclusa Λ(A),
P(T ) ⊂ Λ(A).
CAPITOLUL 3: PROPRIETATI STRUCTURALE 131
(c) Zerouri: Reuniunea zerourilor de transmisie Z(T ) (finite si infinite) alelui T este inclusa in Λ(ET , AT ),
Z(T ) ⊂ Λ(ET , AT ).
2. Pentru o realizare minimala (106) avem in plus:
(a) Poli: Polii lui T (s) coincid cu valorile proprii ale lui A. Ordinele partialeale polilor lui T (s) sunt egale cu multiplicitatile partiale ale v.p. ale lui A.
(b) Zerouri finite : Zerourile finite (de transmisie) ale lui T coincid cu v. p.finite ale lui sET −AT . Ordinele partiale ale zerourilor finite ale lui T (s)sunt egale cu multiplicitatile partiale ale v.p. finite ale lui sET −AT .
(c) Zerouri infinite: Ordinele partiale ale zerourilor infinite (de transmisie)ale lui T sunt egale cu multiplicitatile partiale ale v.p. infinite a lui sET −AT minus 1.
CAPITOLUL 3: PROPRIETATI STRUCTURALE 132
(d) Indici minimali la stanga. Indicii minimali la stanga ai lui T sunt egalicu indicii Kronecker la stanga ai lui sET −AT .
(e) Indici minimali la dreapta. Indicii minimali la dreapta ai lui T sunt egalicu indicii Kronecker la dreapta ai lui sET −AT .
CAPITOLUL 3: PROPRIETATI STRUCTURALE 133
CAPITOLUL 4: SINTEZA ELEMENTARA
1. Compensatoare Dinamice : Problematica
2. Lege de Comanda, Stabilizabilitate, Alocabilitate
3. Estimatori de Stare
4. Estimatori de Tip 1
5. Compensatorul Kalman
6. Estimatori de Stare de Ordin Redus (Tip 2)
7. Reglarea Sistemelor Dinamice
CAPITOLUL 4: SINTEZA ELEMENTARA 134 SINTEZA ELEMENTARA
1. Compensatoare Dinamice : Problematica
Consideram un sistem liniar{x(t) = Ax(t) +Bu(t), x(0) = xo
y(t) = Cx(t) +Du(t)(107)
cu x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp.
Problema sintezei (naturala): Cum putem sa modificam dinamica acestui sistemastfel incat sa satisfaca anumite cerinte ? Cerintele elementare discutate si in cazulsistemelor SISO sunt legate de stabilitate si comporatarea sistemului la diversesemnale de referinta/perturbatii.
Raspuns: Cerintele de proiectare se pot realiza prin cuplarea unui nou sistemdinamic (de preferinta din aceeasi clasa de modele) astfel incat sistemul rezultantsa se comporte in modul dorit.
CAPITOLUL 4: SINTEZA ELEMENTARA 135 Compensatoare Dinamice: Problematica
Asa cum am vazut in cazul sistemelor SISO, conexiunile serie si paralel nu potasigura in general nici macar cerinta minimala de stabilitate (interna) si acest fapteste specific si sistemelor dinamice (Ex: Aratati acest lucru prin analogie cu cazulSISO sau direct pe realizarile de stare ale conexiunilor serie/paralel). Prin urmarene indreptam atentia din nou asupra conexiunii in bucla de reactie negativa.
In conjunctie cu sistemul (107) consideram sistemul dinamic pe spatiul starilor(numit compensator dinamic sau regulator){
xc(t) = Acxc(t) +Bcuc(t), xc(0) = xco
yc(t) = Ccxc(t) +Dcuc(t),(108)
unde xc(t) ∈ Rnc, uc(t) ∈ Rp, yc(t) ∈ Rm, cuplat in reactie inversa cu (107) a. i.
u ≡ yc + uR, yR ≡ y ≡ uc
unde uR este intrarea (semnal extern) si yR este iesirea sistemului rezultant.
CAPITOLUL 4: SINTEZA ELEMENTARA 136 Compensatoare Dinamice: Problematica
Pentru simplificare presupunem S := Ip − DDc = I, S = Im − DcD = I (deexemplu D = 0 sau Dc = 0). Atunci ecuatiile dinamice ale sistemului echivalentsunt
˙[xxc
]=
[A+BDcC BCc
BcC Ac +BcDCc
] [xxc
]+
[B
BcD
]uR
yR =[C DCc
] [ xxc
]+DuR.
(109)
Notand
xR :=
[xxc
], AR :=
[A+BDcC BCc
BcC Ac +BcDCc
], BR :=
[B
BcD
],
CR :=[C DCc
], DR := D
CAPITOLUL 4: SINTEZA ELEMENTARA 137 Compensatoare Dinamice: Problematica
obtinem echivalent xR(t) = ARxR(t) +BRuR(t), xR(0) =
[xo
xco
]yR(t) = CRxR(t) +DRuR(t).
(110)
Se formuleaza urmatoarele probleme fundamentale:
1. Problema stabilizarii: Pentru sistemul original (A,B,C,D) sa se gaseasca unregulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in buclainchisa sa fie intern asimptotic stabil (Λ(AR) ⊂ C−).
2. Problema alocarii: Pentru sistemul original (A,B,C,D) sa se gaseasca unregulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in buclainchisa sa aibe o dinamica impusa (mai precis valorile proprii ale sistemului inbucla inchisa sa coincida cu multimea Λ0 de n + nc valori complexe date, i.e.,Λ(AR) = Λ0.
CAPITOLUL 4: SINTEZA ELEMENTARA 138 Compensatoare Dinamice: Problematica
Observatii: a) Ambele probleme impun conditii numai asupra matricii AR.b) In ambele probleme trebuie implicit determinat si nc (dimensiunea compen-satorului) fiind de dorit ca aceasta sa fie cat mai mica. Problemele de stabi-lizare/alocare in care se impune conditia suplimentara de minimalitate a lui nc suntprobleme structurale in general foarte dificile.c) Multimea Λ0 se ia in general simetrica, i.e. daca s ∈ Λ0 atunci si s ∈ Λ0,regulatorul rezultand automat cu coeficienti reali. Λ0 se da in general ca cerinta deproiectare asigurand automat o anumita viteza de raspuns, timp tranzitoriu, etc.d) Spre deosebire de problema alocarii, problema stabilizarii nu pretinde spectrufix ci doar locatia acestuia in C−.
In mod traditional au existat cateva abordari ale acestei probleme:
• Prin extensie dinamica: Problema se reduce simplu la o problema algebricade alocare de poli ce insa s-a dovedit a fi foarte dificil de rezolvat in conditiigenerale.
• Principiul separatiei: S–a pus in evidenta un principiu fundamental in teoria
CAPITOLUL 4: SINTEZA ELEMENTARA 139 Compensatoare Dinamice: Problematica
sistemelor liniare numit principiul separatiei si care reduce problema originala ladoua probleme algebrice de alocare ce se rezolva independent.
• Parametrizarea lui Youla: cea mai completa solutie disponibila (foloseste implicitprincipiul separatiei) necesitand insa dezvoltarea teoriei factorizarilor de matricirationale peste S (relativ sofisticata) – solutia este formal identica cu cazulSISO.
Extensie dinamica
Consideram pentru simplitateD = 0. Metoda se bazeaza pe observatia ca matriceade stare AR a sistemului rezultant se poate scrie succesiv
AR :=
[A+BDcC BCc
BcC Ac
]=
[A OO O
]+
[B OO Inc
] [Dc Cc
Bc Ac
] [C OO Inc
]
= Ae +BeKCe (111)
CAPITOLUL 4: SINTEZA ELEMENTARA 140 Compensatoare Dinamice: Problematica
unde
Ae :=
[A OO O
], Be :=
[B OO Inc
], Ce :=
[C OO Inc
],K :=
[Dc Cc
Bc Ac
].
(112)Deci problema originala de stabilizare/alocare dinamica prin gasirea compensatoru-lui (Ac, Bc, Cc, Dc) s–a redus la problema echivalenta de gasire a matricii constanteK astfel incat spectrul matricii (111) sa fie in C−. Aceasta din urma problema estein fapt o problema de gasire a unei reactii constante dupa iesire (reactie inversa cucompensator constant) pentru sistemul (Ae, Be, Ce).
Sistemul extins (Ae, Be, Ce) se obtine prin adaugarea la sistemul initial (A,B,C,D)a sistemului
xa(t) = ua(t),ya(t) = xa(t),
CAPITOLUL 4: SINTEZA ELEMENTARA 141 Compensatoare Dinamice: Problematica
unde xa(t), ua(t), ya(t) ∈ Rnc. Obtinem astfel ecuatiile dinamice{xe(t) = Aexe(t) +Beue(t),ye(t) = Cexe(t),
xe(t) :=
[x(t)xa(t)
], ue(t) :=
[u(t)ua(t)
], ye(t) :=
[y(t)ya(t)
]sunt starea, intrarea si respectiv iesirea extinsa.
Daca conectam un compensator constant in reactie inversa cu sistemul extinsobtinem ca matricea de stare a sistemului in bucla inchisa este (111). Deciproblema originala de gasire a unui compensator (Ac, Bc, Cc, Dc) s-a redus laproblema de gasire a unei reactii cst. K (112) pentru sistemul extins (Ae, Be, Ce).
Cu toate ca aceasta problema pare mai simpla decat cea originala, solutionarea eieste foarte dificila intrucat nu este cunoscuta dimensiunea nc. Chiar cu nc impus,problema se reduce la rezolvarea unei probleme de optimizare neconvexe (dificile!).
CAPITOLUL 4: SINTEZA ELEMENTARA 142 Compensatoare Dinamice: Problematica
Principiul separatiei
Un compensator dinamic se poate obtine rezolvand independent problemele:
• Constructia unei legi de reactie dupa stare F ∈ Rm×n care aloca sau stabilizeaza(face ca matricea A+BF sa aibe spectrul dorit sau sa fie asimptotic stabila).
• Constructia unui estimator de stare (prelucreaza semnalele exogene – marimilede intrare u si de iesire y – si genereaza o estimare a marimii de stare x).
In final, regulatorul (de tip Kalman) se obtine luand reactia F dupa starea estimata.
Problema de alocare (cu reactie dinamica dupa iesire) are solutie daca si numaidaca perechea (A,B) este controlabila si perechea (C,A) este observabila.
Problema de stabilizare (cu reactie dinamica dupa iesire) are solutie daca si numaidaca perechea (A,B) este stabilizabila si perechea (C,A) este detectabila.
CAPITOLUL 4: SINTEZA ELEMENTARA 143 Compensatoare Dinamice: Problematica
2. Lege de Comanda, Alocabilitate, Stabilizabilitate
Definitia 39. • Pentru un sistem (A,B,C,D) dependenta
u = Fx+Gv (113)
se numeste lege de comanda prin reactie dupa stare, unde F ∈ Rm×n, G ∈Rm×m, F se numeste matricea de reactie si v este noua marime de intrare.(FIG)• Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m se numeste stabilizabila daca existao matrice de reactie dupa stare F ∈ Rm×n a.i.
Λ(A+BF ) ⊂ C−.
• Perechea (C,A), C ∈ Rp×n, A ∈ Rn×n se numeste detectabila daca exista omatrice de reactie dupa stare K ∈ Rn×p a.i.
Λ(A+KC) ⊂ C−.
CAPITOLUL 4: SINTEZA ELEMENTARA 144 Lege de Comanda, Alocabilitate, Stabilizabilitate
• Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m, se numeste alocabila daca oricarear fi multimea simetrica Λ0 de n numere complexe (orice s ∈ Λ0 ⇒ s ∈ Λ0),exista o matrice de reactie dupa stare F ∈ Rm×n a.i.
Λ(A+BF ) = Λ0.
Proprietatile de stabilizabilitate si detectabilitate sunt duale.
Considerand sistemul dinamic{x(t) = Ax(t) +Bu(t), x(0) = xo
y(t) = Cx(t) +Du(t)(114)
legea de comanda dupa stare implica accesul (din punct de vedere tehnic) la stare,i.e., cunoasterea marimii de stare ! Dupa implementarea comenzii (113) sistemul
CAPITOLUL 4: SINTEZA ELEMENTARA 145 Lege de Comanda, Alocabilitate, Stabilizabilitate
in bucla inchisa devine{x(t) = (A+BF )x(t) +BGv(t), x(0) = xo
y(t) = (C +DF )x(t) +DGv(t)(115)
avand noua intrare v si iesirea y.
Exercitiu: Explicitati in domeniul timp si al transformatelor Laplace traiectoria,iesirea si legea de comanda pentru sistemul (115). Scrieti o realizare de stare pentruacest sistem si precizati cum sunt influentate controlabilitatea/ observabilitatea/minimalitatea/ stabilizabilitatea/ detectabilitatea/ polii/ zerourile printr–o lege decomanda cu reactie dupa stare.Teorema 40. Fie A ∈ Rn×n, B ∈ Rn×m, F ∈ Rm×n, G ∈ Rm×m nesingulara sifie AF := A+BF .a) Perechea (A,B) este controlabila daca si numai daca perechea (AF , BG) estecontrolabila.b) Subspatiile controlabile in k pasi ale perechii (A,B) si perechii (AF , BG)
CAPITOLUL 4: SINTEZA ELEMENTARA 146 Lege de Comanda, Alocabilitate, Stabilizabilitate
coincid, i.e.,Rk(A,B) = Rk(AF , BG). (116)
Demonstratie. a) Avem succesiv
rank[sI −A−BF BG
]= rank
[sI −A B
] [ I O−F G
]= rank
[sI −A B
]si concluzia rezulta folosind criteriul PBH de controlabilitate.b) Demonstram prin inductie. Pentru k = 0 avem prin definitie
R0(A,B) = R0(AF , BG) = {0}
iar pentru k = 1 avem
R1(A,B) = ImB = ImBG = R1(AF , BG).
CAPITOLUL 4: SINTEZA ELEMENTARA 147 Lege de Comanda, Alocabilitate, Stabilizabilitate
Presupunem acum (116) adevarata. Atunci pentru k + 1 avem
Rk+1(AF , BG) = ImBG+AFRk(AF , BG)
= ImB +AFRk(A,B) = ImB +ARk(A,B) = Rk+1(A,B).
Solutia problemei alocariiTeorema 41. Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca sinumai daca este controlabila.
Demonstratia acestui rezultat este relativ complicata si o vom face in cateva etapeformulate ca rezultate separate:• Demonstram suficienta pentru m = 1 (o intrare);• Aratam ca problema cu m > 1 se poate reduce printr-o (pre)reactie dupa stareF la problema cu m = 1;• Demonstram teorema pentru m general.
CAPITOLUL 4: SINTEZA ELEMENTARA 148 Lege de Comanda, Alocabilitate, Stabilizabilitate
Teorema 42 (Cazul m=1). Perechea (A, b), A ∈ Rn×n, b ∈ Rn×1 este alocabiladaca este controlabila.
Demonstratie. Fie Λ0 un set simetric de n numere si ∈ C, i = 1, 2, . . . , n. Aratamca exista f ∈ Rn×1 a.i.
Λ(A+ bfT ) = Λ0.
Demonstratia este constructiva (furnizeaza reactia care aloca). Deoarece (A, b)este controlabila, matricea de controlabilitate
R =[b Ab A2b . . . An−1b
]are dimensiune n× n si rang n si deci este inversabila. Atunci ecuatia
qTR = eTn (117)
are solutie unica qT = eTnR−1 ∈ R1×n, unde eTn =
[0 . . . 0 1
](qT este
ultima linie a lui R−1). Fie Λ0 un set simetric fixat de n numere complexe si,
CAPITOLUL 4: SINTEZA ELEMENTARA 149 Lege de Comanda, Alocabilitate, Stabilizabilitate
i = 1, 2, . . . , n si fie
χ(s) = Πni=1(s− si) = sn + αn−1s
n−1 + . . .+ α0 (118)
polinomul avand radacinile date de Λ0. Aratam ca exista un f a.i. polinomulcaracteristic a lui A+ bfT sa coincida cu χ(s) ceea ce este echivalent cu a spuneca matricea A+ bfT are spectrul Λ0. Pentru aceasta este suficient sa aratam ca
χ(A+ bfT ) = 0
pentru un f potrivit ales. Scriind (117) explicit obtinem
qT b = 0qTAb = 0...qTAn−2b = 0qTAn−1b = 1
CAPITOLUL 4: SINTEZA ELEMENTARA 150 Lege de Comanda, Alocabilitate, Stabilizabilitate
care se pot rescrie pentru orice f ∈ Rn sub forma
qT = qT
qT (A+ bfT ) = qTAqT (A+ bfT )2 = qTA2
...qT (A+ bfT )n−1 = qTAn−1
qTAnb = qTAn + qTAn−1bfT = qTAn + fT .
(119)
Inmultind succesiv ecuatiile cu α0, α1, . . . αn−1 si 1, adunandu-le membru cumembru si folosind (118) rezulta
qTχ(A+ bfT ) = qTχ(A) + fT . (120)
AlegandfT := −qTχ(A) (121)
rezulta automat caqTχ(A+ bfT ) = 0. (122)
CAPITOLUL 4: SINTEZA ELEMENTARA 151 Lege de Comanda, Alocabilitate, Stabilizabilitate
Folosind (119), obtinem prin inmultire succesiva cu A, A2, . . ., An−1 ca
Tχ(A+ bfT ) = 0, TR =
0 0 . . . 0 10 0 . . . 1 0... ... ... ... ...0 1 . . . 0 01 0 . . . 0 0
, T :=
qT
qTA...qTAn−1
.
Deci T este inversabila si prin urmare χ(A + bfT ) = 0 pentru f dat de (121),q.e.d.
Dam in continuare un rezultat care permite reducerea problemei generale de alocarecu m > 1 la cazul m = 1.Teorema 43. Daca perechea (A,B) este controlabila atunci pentru orice b ∈Rn, b = 0, exista o matrice de reactie F astfel incat perechea (A + BF, b) estecontrolabila.
CAPITOLUL 4: SINTEZA ELEMENTARA 152 Lege de Comanda, Alocabilitate, Stabilizabilitate
Demonstratie. Fie b = 0 fixat. Definim recurent n vectori
xk+1 = Axk +Buk, k = 1, 2, . . . , n− 1, x1 = b (123)
unde uk ∈ Rm.
Aratam ca putem intotdeauna alege vectorii uk (in numar de n− 1) a. i. vectoriix1, . . . , xn sa fie liniar independenti. Presupunem prin reducere la absurd ca amconstruit vectorii liniar independenti x1, . . . , xk (k < n) si oricare ar fi uk ∈ Rm
avem ca xk+1 este liniar dependent de precedentii, i.e.,
xk+1 = Axk +Buk ∈ Sk := Im[x1 x2 . . . , xk
], ∀uk ∈ Rm. (124)
Din (124) rezulta automat ca
Axk ∈ Sk, ImB ∈ Sk.
CAPITOLUL 4: SINTEZA ELEMENTARA 153 Lege de Comanda, Alocabilitate, Stabilizabilitate
Avem deasemenea
ASk = Im[Ax1 Ax2 . . . Axk
]
= Im[x2 −Bu1 x3 −Bu2 . . . xk+1 −Buk
]⊂ Sk
ceea ce inseamna ca Sk este A–invariant si contine ImB. Deoarece perechea(A,B) este controlabila avem ca R = Rn si deci
Rn = R ⊂ Sk
ceea ce implica automat k = n obtinand astfel o contradictie.
Consideram acum ecuatia
F[x1 x2 . . . xn
]=
[u1 u2 . . . , un−1 0
](125)
CAPITOLUL 4: SINTEZA ELEMENTARA 154 Lege de Comanda, Alocabilitate, Stabilizabilitate
care are o solutie unica F . Daca premultiplicam ecuatia de mai sus cu B obtinem
Bui = BFxi, i = 1, 2, . . . , n− 1
care inlocuite in (123) genereaza
xk+1 = (A+BF )xk, k = 1, 2, . . . , n− 1, x1 = b
sau incaxk = Ak−1
F b, k = 1, 2, . . . , n.
Deoarece xk sunt liniar independenti rezulta ca matricea[b AF b . . . An−1
F b]
este inversabila si deci perechea (AF , b) cu F dat de (125) este controlabila.
Teorema 44. Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca sinumai daca este controlabila.
CAPITOLUL 4: SINTEZA ELEMENTARA 155 Lege de Comanda, Alocabilitate, Stabilizabilitate
Demonstratie. Suficienta: Deoarece perechea (A,B) este controlabila inseamnaca B = 0 si deci exista g ∈ Rm a.i. b = Bg = 0. Din Teorema 42 rezulta atuncica exista F a.i. perechea (AF , b) sa fie controlabila, unde AF := A + BF . Dinteorema 42 rezulta ca pentru orice Λ0 set simetric de n numere exista f ∈ Rm a.i.
Λ(AF + bfT ) = Λ0.
Prin urmare punand
F := F + gfT (126)
rezulta ca
Λ(A+BF ) = Λ(A+B(F + gfT )) = Λ(AF + bfT ) = Λ0
de unde concluzia ca perechea (A,B) este alocabila si reactia care aloca este datade (126).Necesitatea: Pp prin absurd ca perechea (A,B) este alocabila dar nu este
CAPITOLUL 4: SINTEZA ELEMENTARA 156 Lege de Comanda, Alocabilitate, Stabilizabilitate
controlabila. Atunci aplicand teorema de descompunere controlabila obtinem innoul sistem de coordonate
T (A+BF )T−1 = A+ BF =
[A1 A3
O A2
]+
[B1
O
] [F1 F2
]
=
[A1 +B1F1 A3 +B1F2
O A2
](127)
unde am notat F := FT−1. De aici rezulta ca
Λ(A+BF ) = Λ(A+ BF ) = Λ(A1 +B1F1) ∪ Λ(A2)
si deci Λ(A2) ⊂ Λ(A+ BF ) oricare ar fi reactia F ceea ce contrazice ipoteza dealocabilitate a perechii (A,B).
Observatii: a) Relatia (127) evidentiaza ca orice pereche (A,B) are o subperechecare poate fi alocata (parte din spectru poate fi alocat) – aceasta coincide cu
CAPITOLUL 4: SINTEZA ELEMENTARA 157 Lege de Comanda, Alocabilitate, Stabilizabilitate
partea controlabila – si o parte nealocabila, i.e. anumiti poli ficsi dati de Λ(A2).Acesti poli sunt invarianti in raport cu orice reactie dupa stare.b) Teorema de mai sus arata ca proprietatea ”benefica” fundamentala a uneiperechi controlabile (A,B) este ca dinamica sistemului (determinata de v.p. alematricii de stare) poate fi modificata in mod arbitrar printr–o reactie dupa stare.c) Alocarea se poate extinde si asupra vectorilor proprii (simultan cu valorile proprii)cu anumite precautii privitoare la alegerea acestora.d) Demonstratia teoremelor de mai sus este constructiva rezultand proceduri deobtinere a reactiei care aloca. Aceaste metode au insa numeroase dezavantaje dpdvnumeric si de aceea s-au dezvoltat alte proceduri numeric stabile de constructie areactiei F (algoritm de tip Schur, alocare cu norma minima, etc).e) Alocabilitatea nu implica in general faptul ca matricea A + BF are oriceelemente prescrise ci doar orice spectru prescris !
Procedura de Alocare: Cazul m = 1
Pasul 0: Dandu–se perechea controlabila (A, b), A ∈ Rn×n, b ∈ Rn, si un set
CAPITOLUL 4: SINTEZA ELEMENTARA 158 Lege de Comanda, Alocabilitate, Stabilizabilitate
simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul
χ(s) = Πni=1(s− si) = α0 + α1s+ α2s
2 + . . .+ αn−1sn−1 + sn
cu α0, α1, . . . , αn−1 ∈ R.
Pasul 1: Se construieste matricea de controlabilitate
R =[b Ab . . . An−1b
]care este automat patrata si nesingulara.
CAPITOLUL 4: SINTEZA ELEMENTARA 159 Lege de Comanda, Alocabilitate, Stabilizabilitate
Pasul 2: Se rezolva ecuatia
RTq = en =
00...01
in necunoscuta q ∈ Rn.
Pasul 3: Se calculeaza
fT = −qTχ(A).
Pentru a explicita procedura pentru cazul multivariabil avem nevoie de un rezultatauxiliar.
CAPITOLUL 4: SINTEZA ELEMENTARA 160 Lege de Comanda, Alocabilitate, Stabilizabilitate
Propozitia 45. Fie (A,B) controlabila, A ∈ Rn×n, B ∈ Rn×m. Controlabili-tatea perechii (A + BF, b) este generica in raport cu F ∈ Rm×n si b := Bg,0 = g ∈ Rm. Mai exact, alegand aleator perechea (F, g) perechea (AF , b) este(generic) controlabila.
Demonstratie. Demonstratia este lasata ca exercitiu fiind asemanatoare cu demon-strarea genericitatii controlabilitatii unei perechi de matrici alese arbitrar.
Procedura de Alocare: Cazul General
Pasul 0: Dandu–se perechea controlabila (A,B), A ∈ Rn×n, B ∈ Rn×m, si unset simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul
χ(s) = Πni=1(s− si) = α0 + α1s+ α2s
2 + . . .+ αn−1sn−1 + sn
cu α0, α1, . . . , αn−1 ∈ R.
CAPITOLUL 4: SINTEZA ELEMENTARA 161 Lege de Comanda, Alocabilitate, Stabilizabilitate
Pasul 1: Se aleg F ∈ Rm×n si g ∈ Rm aleator si se construiesc matricile
AF := A+BF , b = Bg.
Pasul 2: Se aplica procedura de alocare (cu m = 1) perechii (AF , b) sipolinomului χ(s) obtinandu-se reactia f ∈ Rm.
Pasul 3: Calculam reactia finala sub forma
F = F + gfT .
Propozitia 46 (Criteriul Hautus de Stabilizabilitate/Detectabilitate). •Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m este stabilizabila daca si numai daca
rank[sI −A B
]= n, ∀s ∈ C+ ∪ C0. (128)
CAPITOLUL 4: SINTEZA ELEMENTARA 162 Lege de Comanda, Alocabilitate, Stabilizabilitate
• Perechea (C,A), C ∈ Rp×n, A ∈ Rn×n este detectabila daca si numai daca
rank
[sI −A
C
]= n, ∀s ∈ C+ ∪ C0. (129)
Demonstratie. Exercitiu ! Indicatie: Se foloseste teorema de descompunerecontrolabila punandu-se in evidenta polii ficsi.
CAPITOLUL 4: SINTEZA ELEMENTARA 163 Lege de Comanda, Alocabilitate, Stabilizabilitate
3. Estimatori de Stare
Asa cum am vazut, legea de comanda cu reactie dupa stare poate asigura inmod satisfacator cerintele fundamentale ale sintezei sistemelor de stabilizare sialocare cu conditia ca starea sa fie disponibila pentru masura (sa fie accesibiladpdv tehnic). Din pacate acest lucru nu este in general posibil si atunci ne punemproblema estimarii cat mai exacte a starii unui sistem dinamic prin constructiaunui nou sistem care sa citeasca marimile accesibile sau masurabile (intrarea u siiesirea y) si care sa genereaze la iesire o estimare a starii x. Un astfel de sistem senumeste estimator de stare (FIG).Problema: Dandu–se un sistem
{x(t) = Ax(t) +Bu(t), x(0) = xo
y(t) = Cx(t) +Du(t),(130)
CAPITOLUL 4: SINTEZA ELEMENTARA 164 Estimatori de Stare
dorim sa construim un nou sistem{w(t) = Jw(t) +Hy(t) +Mu(t),x(t) = Kw(t) +Ny(t) + Pu(t)
(131)
(care are deci ca intrari intrarea u si iesirea y, are ca iesiri starea estimata x, simarimea de stare w) care sa indeplineasca simultan urmatoarele doua conditii:
1. Sa fie intern asimptotic stabil, i.e., matricea de stare J sa satisfaca
Λ(J) ⊂ C−.
2. limt→∞(x(t)−x(t)) = 0, i.e., iesirea x(t) (numita estimatia starii) sa aproximezeasimptotic starea sistemului original x(t).
CAPITOLUL 4: SINTEZA ELEMENTARA 165 Estimatori de Stare
Observatii: a) Ideal ar fi x(t) = x(t), ∀t. Acest lucru nu este insa in general posibil(explicati de ce !) si atunci aceasta cerinta se relaxeaza la cea asimptotica.b) Cerinta de stabilitate interna este esentiala pentru constructia estimatorului(explicati de ce!).
Pentru a solutiona problema punem in evidenta ”fidelitatea” cu care starea esti-matorului (131) urmareste starea sistemului original, i.e. evaluam
w − V x
unde V este o matrice ce ”adapteaza” dimensiunile eventual diferite ale lui x si w.Folosind (130) si (131) avem succesiv
w − V x = Jw +Hy +Mu− V Ax− V Bu,
(w − V x)′= J(w − V x) + JV x+HCx+HDu− V Ax+ (M − V B)u,
CAPITOLUL 4: SINTEZA ELEMENTARA 166 Estimatori de Stare
(w − V x)′= J(w − V x) + (JV +HC − V A)x+ (M − V B +HD)u. (132)
Calculam succesiv
x− x = Kw +Ny + Pu− x = K(w − V x) +KV x+NCx+NDu− x+ Pu
x− x = K(w − V x) + (KV +NC − I)x+ (P +ND)u (133)
Combinand (132) cu (133) obtinem{(w − V x)
′= J(w − V x) + (JV +HC − V A)x+ (M − V B +HD)u,
x− x = K(w − V x) + (KV +NC − I)x+ (P +ND)u.
Pentru ca starea estimatorului sa urmareasca asimptotic starea sistemului original(conditia 2) trebuie ca iesirea sistemului dinamic de mai sus sa tinda asimptotic lazero (indiferent de initializari si de semnalele de intrare x si u). Acest lucru esteposibil daca satisfacem simultan urmatoarele conditii:
CAPITOLUL 4: SINTEZA ELEMENTARA 167 Estimatori de Stare
a) J asimptotic stabila;b) JV +HC − V A = 0;c) M − V B +HD = 0;d) KV +NC − I = 0;e) P +ND = 0.Daca aceste conditii sunt simultan satisfacute obtinem comportarea dinamica{
(w − V x)′
= J(w − V x),x− x = K(w − V x).
Obtinem deci
limt→∞
(w(t)− V x(t)) = 0, limt→∞
(x(t)− x(t)) = 0
indiferent de initializarea sistemului sau estimatorului !
Problema de constructie a estimatorului asimptotic stabil s–a redus la problema
CAPITOLUL 4: SINTEZA ELEMENTARA 168 Estimatori de Stare
algebrica de satisfacere simultana a conditiilor a) – e): avem 5 conditii (4 ecuatiialgebrice si o locatie de spectru) si 7 necunoscute.
Evident c) si e) se pot satisface automat alegand M := V B−HD si P := −ND.Raman in continuare mai multe grade de libertate in satisfacerea restului de conditii
Λ(J) ⊂ C−,JV +HC − V A = 0,KV +NC − I = 0,
functie de care se deosebesc mai multe tipuri de estimatori.
CAPITOLUL 4: SINTEZA ELEMENTARA 169 Estimatori de Stare
4. Estimatori de Tip 1: N = 0
Conditia este echivalenta cu a a spune ca estimatorul nu are transfer direct I/O,i.e., matricea sa “D” este zero. In acest caz obtinem
JV +HC − V A = 0,KV = I
si putem alege K = I, V = I, ramand de satisfacut doar conditia
J = A−HC, Λ(J) ⊂ C−.
Aceasta conditie se poate satisface automat daca perechea (C,A) este detectabila,caz in care alegem −H egal cu reactia care stabilizeaza (problema de stabilizarepentru perechea (AT , CT )). Mai mult, daca perechea (C,A) este observabila,atunci spectrul matricii de stare J a estimatorului poate fi alocat arbitrar.
CAPITOLUL 4: SINTEZA ELEMENTARA 170 Estimatori de Tip 1
In concluzie am obtinut pentru un estimator de tipul 1 urmatoarea constructie:
CAPITOLUL 4: SINTEZA ELEMENTARA 171 Estimatori de Tip 1
Pasul 1: Se foloseste procedura de alocare pentru perechea (AT , CT ) si se
determina o matrice F a.i. (AT ) + (CT )F sa aibe spectrul dorit (un anumitspectru impus sau doar localizat in C− in functie de cerinta de proiectare).Pasul 2: Se calculeaza estimatorul cu parametrii
H = −FT , J = A−HC, K = V = I, M = B −HD, P = 0,
rezultand{w(t) = (A−HC)w(t) +Bu(t)−HDu(t) +Hy(t),x(t) = w(t),
(134)
sau, sub forma echivalenta,
˙x = Ax+Bu+ L(Cx+Du− y) (135)
in care este cunoscut sub numele de estimator Luenberger (am notat L := −H).
CAPITOLUL 4: SINTEZA ELEMENTARA 172 Estimatori de Tip 1
Observatii: a) Pentru a construi un estimator Luenberger avem nevoie doar saspecificam spectrul estimatorului Λ0 si sa construim reactia L care aloca respectiviipoli pentru estimator Λ(A + LC) = Λ0. Pentru ca estimatorul sa rezulte cucoeficienti reali, spectrul se alege intotdeauna simetric.b) Daca perechea (C,A) este observabila atunci spectrul matricii de stare aestimatorului poate fi alocat arbitrar si deci este posibil ca estimatorul sa furnizezeo estimatie cat de precisa a starii intr-un timp oricat de scurt !c) Din (135) observam ca estimatorul “copiaza” dinamica sistemului original +termen proportional cu “inovatia” Cx+Du− y care de fapt masoara “calitatea”estimarii ! Pentru o estimare perfecta avem x(t) = x(t) si deci inovatia este zerodeoarece
Cx+Du− y = Cx− Cx = 0.
d) Daca facem o transformare de similaritate asupra sistemului original estimatorulLuenberger se modifica corespunzator (Ex: aratati cum ! )e) Pentru a construi estimatorul Luenberger singura conditie pe care am impus-osistemului intitial este cea de detectabilitate (sau respectiv de observabilitate)asupra perechii (C,A). Conditia este nu numai suficienta pentru constructia unui
CAPITOLUL 4: SINTEZA ELEMENTARA 173 Estimatori de Tip 1
estimator Luenberger ci si necesara asa cum vom vedea in continuare. Mai mult,conditia este necesara pentru existenta unui estimator general de tipul (131).f) Estimatorul de tipul 1 (Luenberger) are dimensiunea n si de aceea se mainumeste de ordin integ. Asa cum vom vedea, in anumite situatii se pot construiestimatori de ordin mai mic.Teorema 47. Fie sistemul (A,B,C,D) descris de (130). Atunci exista un esti-mator (131) daca si numai daca perechea (C,A) este detectabila. Daca (C,A)este detectabila atunci un estimator (de tip 1 sau Luenberger) este dat de ecu-atille {
w = (A+ LC)w +Bu+ LDu− Ly,x(t) = w(t)
(136)
unde L este orice matrice a.i. Λ(A+ LC) ⊂ C−.
Demonstratie. Partea de suficienta am aratat-o deja. Demonstram necesitateaprin reducere la absurd. Presupunem ca perechea (C,A) nu este detectabila sifara a restrange generalitatea presupunem deasemenea ca perechea (C,A) este in
CAPITOLUL 4: SINTEZA ELEMENTARA 174 Estimatori de Tip 1
forma de descompunere observabila
A =
[A1 A3
O A2
], C =
[O C2
]unde Λ(A1) ⊂ C− (aceasta rezulta automat din testul PBH aplicat perechii
nedetectabile (C,A)). Fie s+ ∈ C− o valoare proprie si x+ un vector propriucorespunzator ale lui A1. Luam starea initiala x0 a sistemului (A,B,C,D) deforma
xo =
[x+
O
].
Evident xo apartine subspatiului neobservabil al perechii (C,A), i.e., x0 ∈ N (C,A).Deasemenea luam w(0) = 0 si u(t) ≡ 0. Atunci ecuatiile pentru x si estimatorul(131) sunt
x = Ax,w = Jw +HCx,x = Kw +NCx.
CAPITOLUL 4: SINTEZA ELEMENTARA 175 Estimatori de Tip 1
Deoarece x0 ∈ N (C,A) rezulta ca iesirea sistemului (A,B,C,D) este identic nula
y(t) = Cx(t) = CeAtx0 = 0,∀t ≥ 0,
si deasemeneaw(t) = 0, x(t) = 0, ∀t.
Pe de–alta parte, avem
x(t) = eAtx0 = es+tx0 → 0
si deci x(t) − x(t) → 0 pentru comanda u ≡ 0, starea initiala a estimatoruluiw(0) = 0 si x0 aleasa ca mai sus ceea ce contrazice ipoteza ca (131) este unestimator pentru sistemul (A,B,C,D).
Observatii: a) Dimensiunea unui estimator de tip Luenberger (de tip 1) este egalacu n (dimensiunea spatiului starilor sistemului orginal (A,B,C,D)). Asa cum vomvedea mai tarziu, in anumite situatii se pot construi estimatoare de dimensiune mai
CAPITOLUL 4: SINTEZA ELEMENTARA 176 Estimatori de Tip 1
mica si se poate formula problema de constructie a unui estimator de dimensiuneminimala (legata de teoria estimatoarelor de tipul 2).b) Am vazut ca un sistem poate fi stabilizat/alocat cu o reactie constanta dupastare. Deoarece starea nu este in general cunoscuta am construit mai sus un sistem(numit estimator) care estimeaza asimptotic starea sistemului pe baza informatiilorfurnizate de semnalele de intrare u si de iesire y. Intrebarea naturala este dacaputem stabiliza/aloca sistemul original prin implementarea reactiei constante dupastarea estimata x (in locul starii reale x care nu este accesibila) ? Raspunsul estepozitiv obtinandu-se compensatorul Kalman.
CAPITOLUL 4: SINTEZA ELEMENTARA 177 Estimatori de Tip 1
5. Compensatorul Kalman
Fie (A,B,C,D) un sistem dinamic si presupunem pentru problema de stabilizarecu reactie dinamica dupa iesire ca (A,B) este stabilizabila si (C,A) este detectabilaiar pentru problema cu alocare dinamica dupa iesire ca (A,B) este controlabila si(C,A) este observabila.
Consideram un compensator cu reactie constanta F dupa starea estimata de catreun estimator Luenberger descris de ecuatiile (136). Obtinem atunci ecuatiiledinamice ale compensatorului – numit compensator Kalman –{
˙x = (A+ LC)x+Bu+ LDu− Ly,u = Fx,
(137)
sau inca {˙x = (A+ LC +BF + LDF )x− Ly,u = Fx,
(138)
CAPITOLUL 4: SINTEZA ELEMENTARA 178 Compensatorul Kalman
avand matricea de transfer
K(s) :=
[AK BK
CK DK
]=
[A+ LC +BF + LDF −L
F O
], u = Ky.
Matricile F si L se aleg a.i. A + BF si A + LC sa fie asimptotic stabile (sieventual cu spectru impus).
Conectand compensatorul Kalman in reactie inversa cu sistemul original obtinempentru matricea de stare a sistemului rezultant in bucla inchisa
AR =
[A BF
−LC A+BF + LC
].
Aplicand transformarea de similaritate
T :=
[I O−I I
]CAPITOLUL 4: SINTEZA ELEMENTARA 179 Compensatorul Kalman
asupra lui AR obtinem
TART−1 =
[A+BF BF
O A+ LC
]ceea ce arata ca dinamica (polii) sistemului in bucla inchisa satisfac
Λ(AR) = Λ(A+BF ) ∪ Λ(A+ LC)
si deci sistemul in bucla inchisa este intern asimptotic stabil (si eventual aredinamica prescrisa).
Observatii: a) Polii sistemului in bucla inchisa sunt dati de reuniunea polilor alocatiai lui A+BF prin reactia dupa stare F cu polii alocati de estimator Λ(A+ LC)prin reactia L. Cele doua alocari se pot face independent, punandu-se astfel inevidenta celebrul principiu al separatiei.b) Un sistem este stabilizabil/alocabil prin reactie (dinamica) dupa iesire daca
CAPITOLUL 4: SINTEZA ELEMENTARA 180 Compensatorul Kalman
perechea (A,B) este stabilizabila/controlabila si perechea (C,A) este de-tectabila/observabila. Aceste conditii sunt nu numai suficiente ci si necesareasa cum reiese din urmatoarea teorema.Teorema 48. Un sistem (A,B,C,D) este stabilizabil/alocabil prin reac-tie dinamica dupa iesire daca si numai daca perechea (A,B) este stabiliz-abila/controlabila si perechea (C,A) este detectabila/observabila.
Demonstratie. Suficienta a fost demonstrata constructiv mai sus. Ramane saaratam necesitatea (Exercitiu !). Indicatie: Pp prin reducere la absurd ca nueste adevarat si puneti in evidenta printr-o descompunere controlabila/observabilaanumiti poli ficsi ai sistemului rezultant (ce nu pot fi modificati indiferent dereactia dupa stare.
CAPITOLUL 4: SINTEZA ELEMENTARA 181 Compensatorul Kalman
6. Estimatori de Stare de Ordin Redus (Tip 2)
Fie un sistem (A,B,C,D) cu m intrari, p iesiri si ordinul n (dimensiunea spatiuluistarilor). Daca dorim estimarea starii acestui sistem nu este nevoie sa construim unestimator care sa estimeze direct toate cele n stari intrucat o parte dintre acestearezulta automat pe baza iesirilor. Intr–adevar, sa presupunem ca C are rangul egalcu numarul de iesiri p. Atunci cunoscand iesirea y(t) si estimand numai n− p starirezulta ca celelate p stari se pot calcula din ecuatiile corespunzatoare ale iesirii.Un astfel de estimator de ordin redus se numeste estimator de tipul 2.
Pentru constructia estimatorului de tipul 2 facem ipotezele:i) Matricea C este epica, i.e., rankC = p;ii) Matricea C are forma
C =[O Ip
]. (139)
Observatii: a) Ipoteza i) nu constituie o restrictie majora intrucat o putem asigurain etapa de modelare printr-o alegere judicioasa a iesirilor sistemului. In cazul in
CAPITOLUL 4: SINTEZA ELEMENTARA 182 Estimatori de Ordin Redus
care prin modelare nu s-a asigurat indeplinirea ei se poate face o schimbare devariabile in spatiul marimilor de iesire punandu–se in evidenta anumite iesiri identiczero sau redundante ce pot fi eliminate ramanand o matrice C ce satisface ipoteza.b) Ipoteza ii) se poate asigura printr–o simpla transformare de coordonate inspatiul starilor (presupunand evident ipoteza i) adevarata) !c) Rationand prin dualitate, in anumite circumstante matricea intrarilor B se poate
presupune monica si de forma
[ImO
].
d) Ipotezele i) si ii) implica ca
y = Cx+Du =[O Ip
] [ x1
x2
]+Du = x2 +Du
deci starile x2 – in numar de p – sunt automat cunoscute (prin cunoastereaintrarilor si iesirilor) si raman de estimat starile x1 – in numar de n− p.
Asa cum am vazut, pentru constructia unui estimator general (131) trebuie sa
CAPITOLUL 4: SINTEZA ELEMENTARA 183 Estimatori de Ordin Redus
satisfacem relatiileΛ(J) ⊂ C−,
JV +HC − V A = 0,KV +NC − I = 0,
(celelalte relatii fiind automat satisfacute prin alegerea lui P si M). Pentru aexplicita aceste relatii, partitionam matricile A, B, V , K, N conform cu C in(139),
A =
[A1 A3
A2 A4
], B =
[B1
B2
], V =
[V1 V2
],K =
[K1
K2
], N =
[N1
N2
]si obtinem
V1A1 + V2A2 = JV1, V1A3 + V2A4 = JV2 +H,{K1V1 = I, K1V2 +N1 = 0,K2V1 = 0, K2V2 +N2 = I.
Alegem K1 := V1 := I si rezulta automat K2 = 0, N2 = I, N1 = −V2 ceea ce
CAPITOLUL 4: SINTEZA ELEMENTARA 184 Estimatori de Ordin Redus
determina complet matricile K si N , ramanand de satisfacut doar conditiile
A1 + V2A2 = J, Λ(J) ⊂ C−, H = A3 + V2A4 − (A1 + V2A2)V2. (140)
Daca perechea (A1, A2) este detectabila (observabila) atunci putem alege automatV2 := L unde L este reactia care aloca Λ(A1 + LA2) ⊂ C− iar H se defineste pebaza ultimei ecuatii din (140).
Ramane sa aratam ca perechea (A1, A2) este detectabila daca sunt indepliniteconditiile de existenta ale unui estimator general, i.e. perechea (C,A) estedetectabila. Formulam acest rezultat sub forma unei propozitii de sine statatoare.Teorema 49. Fie un sistem (A,B,C,D) avand matricea C epica.i) Exista o transformare de coordonate a.i.
TAT−1 =
[A1 A3
A2 A4
]}n− p}p︸︷︷︸ ︸︷︷︸
n− p p
,
CAPITOLUL 4: SINTEZA ELEMENTARA 185 Estimatori de Ordin Redus
TB =
[B1
B2
]}n− p}p , CT−1 =
[O Ip
],︸︷︷︸ ︸︷︷︸
n− p p
(141)
ii) Perechea (A2, A1) este detectabila (observabila) daca si numai daca perechea(C,A) este detectabila (observabila).
Demonstratie. i) Intrucat C este epica de dimensiune p × n, exista o matrice Cde dimensiune (n− p)× n a. i. matricea
T :=
[CC
]
sa fie inversabila. Avem evident[CC
]T−1 =
[In−p OO Ip
]CAPITOLUL 4: SINTEZA ELEMENTARA 186 Estimatori de Ordin Redus
de unde concluzionam ca CT−1 are forma din (141).ii) Avem succesiv
rank
[sI −A
C
]= rank
[T (sI −A)T−1
CT−1
]= rank
sI −A1 −A3
−A2 sI −A4
O Ip
= p+ rank
[sI −A1
A2
], ∀s ∈ C
de unde concluzia rezulta direct din criteriul Hautus de detectabilitate (observabil-itate).
In concluzie am obtinut pentru un estimator de tipul 2 urmatoarea constructie:Pasul 0: Dandu-se sistemul (A,B,C,D) cu perechea (C,A) detectabila (observ-abila) si matricea C epica, se gaseste cf. Teoremei 49 o transformare de similaritate
CAPITOLUL 4: SINTEZA ELEMENTARA 187 Estimatori de Ordin Redus
T a.i. in noul sistem de coordonate sa avem (refolosind notatiile)
A =
[A1 A3
A2 A4
]}n− p}p︸︷︷︸ ︸︷︷︸
n− p p
, (142)
B =
[B1
B2
]}n− p}p , C =
[O Ip
],︸︷︷︸ ︸︷︷︸
n− p p
in care perechea (A2, A1) este detectabila (observabila).Pasul 1: Se foloseste procedura de alocare pentru perechea (A2, A1) si se determinao matrice V2 a.i. A1 + V2A2 sa aibe spectrul dorit (un anumit spectru impus saudoar localizat in C− in functie de cerinta de proiectare).Pasul 2: Se calculeaza estimatorul cu parametrii
J = A1 + V2A2, H = A3 + V2A4 −A1V2 − V2A2V2, M = B1 + V2B2 −HD,
CAPITOLUL 4: SINTEZA ELEMENTARA 188 Estimatori de Ordin Redus
K =
[In−p
O
], N =
[−V2
Ip
], V =
[In−p V2
], P =
[V2D−D
]rezultand w(t) = (A1 + V2A2)w(t) +Hy(t) + (B1 + V2B2 −HD)u(t),
x(t) =
[x1(t)x2(t)
]=
[In−p
O
]w(t) +
[−V2
Ip
]y(t) +
[V2D−D
]u(t).
(143)Pasul 3: Se “reverseaza” corespunzator transformarea de similaritate asupraestimatorului, obtinandu-se in final un estimator de tip 2 pentru sistemul original.Observatii: a) Estimatorul de tip 2 obtinut are ordinul egal cu n− p (dimensiuneaspatiului starii w(t)).b) Ecuatia iesirii pentru estimatorul de tip 2 (143) contine o parte de dimensiunen− p ce este estimata prin intermediul dinamicii w(t) de forma
x1(t) = w(t)− V2y(t) + V2Du(t)
CAPITOLUL 4: SINTEZA ELEMENTARA 189 Estimatori de Ordin Redus
si o parte ce este deja cunoscuta de dimensiune p (nu se estimeaza prin intermediuldinamicii) de forma
x2(t) = y(t)−Du(t).
De obicei in ecuatiile dinamice ale estimatorului de tip 2 se pastreaza numai primaparte (x1(t)).c) Din cele de mai sus rezulta ca in ipoteza (C,A) detectabila si C epicaputem intotdeauna construi un estimator de ordin n − p (dimensiunea matriciiJ). Problema naturala care se pune este daca pe baza acestui estimator putemconstrui in continuare un compensator care stabilizeaza intern – exact cum amfacut in cazul estimatorului de tip 1 obtinand compensatorul Kalman.
Interpretarea Estimatorului de Tip 2 (Ordin Redus)
Estimatorul de tip 2 poate fi obtinut si prin scrierea directa a unui estimator detip 1 pentru partea starii ce trebuie efectiv estimata. Intr–adevar, cu notatiile dejaintroduse avem ca sistemul original este descris de ecuatiile (pentru simplificarea
CAPITOLUL 4: SINTEZA ELEMENTARA 190 Estimatori de Ordin Redus
calculelor facem ipoteza D = 0)
x1 = A1x1 +A3x2 +B1u,x2 = A2x1 +A4x2 +B2u,y = x2
(144)
si inlocuind ultima ecuatie in precedentele doua avem
x1 = A1x1 +A3y +B1u,x2 = y = A2x1 +A4y +B2u,
sau inca
x1 = A1x1 +A3y +B1u,y −A4y −B2u = A2x1,
(145)
care este un sistem cu dinamica x1 ce se doreste estimata si intrarile u si y.
CAPITOLUL 4: SINTEZA ELEMENTARA 191 Estimatori de Ordin Redus
Reamintim ca un estimator de tip 1 se poate pune sub forma
˙x = Ax+Bu+L(Cx+Du−y) = Ax+Bu+LדEROAREA DE ESTIMARE”.(146)
Scriind un astfel de estimator pentru sistemul (145) obtinem
˙x1 = A1x1 +A3y +B1u+ L(A2x1 − y +A4y +B2u). (147)
Eliminam y facand schimbarea de variabile x1 = w − Ly si notam V2 := L.Obtinem echivalent
w−V2y = A1(w−V y)+A3y+B1u+V2(A2(w−V2y)− y+A4y+B2u) (148)
sau inca
w = (A1 + V2A2)w+ (−A1V2 +A3 − V2A2V2 + V2A4)y+ (B1 + V2B2)u. (149)
CAPITOLUL 4: SINTEZA ELEMENTARA 192 Estimatori de Ordin Redus
Din ultima ecuatie din (144) obtinem[x1
x2
]=
[In−p
O
]w +
[−V2
Ip
]y. (150)
Comparand ecuatille (149), (150) cu ecuatille (143) observam ca acestea coincidin ipoteza facuta D = 0. In consecinta am reobtinut expresia estimatorului de tip2 scriind un estimator de tip 1 pentru susbsisemul cu dinamica ce trebuie efectivestimata x1 !Exercitiu: Aratati acelasi lucru fara a face ipoteza D = 0 !
Stabilizarea cu Estimatoare Generale
Am vazut ca daca folosim o schema de compensare cu reactie constanta F dupastarea estimata printr-un estimator de tip 1 se obtine un compensator Kalmancare stabilizeaza intern sistemul si eventual aloca o dinamica dorita. Aratam incontinuare ca o schema similara in care insa estimarea se face cu un estimatorgeneral se poate deasemenea folosi pentru stabilizare/alocare.
CAPITOLUL 4: SINTEZA ELEMENTARA 193 Estimatori de Ordin Redus
In particular, in cazul in care estimarea se face cu un estimator de ordin redus (detipul 2) sistemul rezultant va avea dimensiunea spatiului starilor de dimensiuneredusa (< 2n).
Fie un sistem {x = Ax+Bu,y = Cx+Du,
(151)
si un estimator general descris de ecuatiile
{w = Jw +Hy +Mu,x = Kw +Ny + Pu,
(152)
ce satisface automat conditiile:a) J asimptotic stabila;b) JV +HC − V A = 0;c) M − V B +HD = 0;d) KV +NC − I = 0;
CAPITOLUL 4: SINTEZA ELEMENTARA 194 Estimatori de Ordin Redus
e) P +ND = 0.
Consideram o schema de compensare cu reactie constanta F dupa starea estimatax, i.e.,
u = Fx. (153)
Studiem comportarea dinamica in bucla inchisa a sistemului descris de (151), (152)si (153). Evaluam intai
Ny + Pu = NCx+NDu−NDu = NCx, (154)
unde am folosit proprietatea e). Avem succesiv
x = Ax+Bu = Ax+BFx = Ax+BF (Kw +Ny + Pu)= Ax+BFKw +BFNCx = (A+BFNC)x+BFKw
(155)
CAPITOLUL 4: SINTEZA ELEMENTARA 195 Estimatori de Ordin Redus
in care am folosit (154). Pentru dinamica w obtinem
w = Jw +Hy +Mu = Jw +HCx+HDu+MF (Kw +NCx)= (HC +MFNC)x+ (J +MFK)w +HDu
(156)
in care am folosit succesiv (153) si (154). Evaluam separat
HDu = HDFx = HDF (Kw +NCx) = HDFNCx+HDFKw
pe care il inlocuim in (156) obtinand
w = (HC +MFNC +HDFNC)x+ (J +MFK +HDFK)w. (157)
Din (155) si (157) avem ca dinamica sistemului rezultant este data de
˙[xw
]=
[A+BFNC BFK
HC + (M +HD)FNC J + (M +HD)FK
] [xw
]CAPITOLUL 4: SINTEZA ELEMENTARA 196 Estimatori de Ordin Redus
si deci matricea de stare a sistemului rezultant este
AR =
[A+BFNC BFK
HC + V BFNC J + V BFK
]in care am folosit proprietatea c). Pentru a pune in evidenta spectrul acesteimatrici facem o transformare de coordonate
T =
[I O
−V I
]si obtinem
TART−1 =
[A+BFNC +BFKV BFK−V A+HC + JV J
]=
[A+BF BFK
O J
],
unde pentru ultima egalitate am folosit proprietatile d) si b). Din relatia de maisus concluzionam ca
Λ(AR) = Λ(A+BF ) ∪ Λ(J)
CAPITOLUL 4: SINTEZA ELEMENTARA 197 Estimatori de Ordin Redus
si deci Λ(AR) ⊂ C− daca alegem F a.i. Λ(A+BF ) ⊂ C−.Observatii: a) Daca (A,B) controlabila atunci putem aloca orice spectru pentruA + BF si daca (C,A) observabila atunci putem aloca orice spectru pentruestimator Λ(J) rezultand ca putem aloca orice dinamica pentru sistemul rezultantin bucla inchisa.b) Ordinul sistemului rezultant este n+ ne unde ne este ordinul estimatorului.
CAPITOLUL 4: SINTEZA ELEMENTARA 198 Estimatori de Ordin Redus
7. Reglarea Sistemelor Dinamice
Problematica, Ipoteze
In aceasta sectiune abordam problema reglarii sistemelor dinamice. Problemaclasica de reglare intern stabila consta in gasirea unui regulator care sa realizezesimultan urmatoarele deziderate asupra sistemului rezultant in bucla inchisa:
(S) Sa fie intern asimptotic stabil;
(Re) Sa urmareasca (macar) asimptotic anumite semnale (sau clase de semnale)prescrise numite referinte r;
(Rj) Sa rejecteze (macar) asimptotic anumite perturbatii d sau zgomote w; (FIG).
Solutia generala a problemei de reglare intern stabila are o serie de inconvenientemajore:
CAPITOLUL 4: SINTEZA ELEMENTARA 199 Reglarea Sistemelor Dinamice
(i) Este foarte complicata;
(ii) Este bazata pe geometria interna a sistemului original si pe o serie de descom-puneri structurale sofisticate in spatiul starilor;
(iii) Conditiile de solvabilitate sunt in general greu de verificat dpdv procedural;
(iv) Solutia generala este complet nerobusta in raport cu perturbatiile paramet-rice sau structurale ale modelului (A,B,C,D) limitand major aplicabilitateametodelor la cazul sistemelor cu dimensiuni medii sau relativ mari.
In continuare vom prezenta solutia in anumite cazuri particulare insa de mareinteres practic in care neajunsurile de mai sus sunt partial eliminate prin ipotezelefacute. Ne restrangem la prezentarea unei solutii in caz particular deoarece:
• Efortul de a prezenta/intelege solutia completa (in intreaga ei complexitate) nuse justifica in general in raport cu clasa aplicatiilor concrete ”real–life”;
CAPITOLUL 4: SINTEZA ELEMENTARA 200 Reglarea Sistemelor Dinamice
• Solutia generala este nerobusta;
• Exista abordari alternative bazate pe teoria sistemelor robuste ce furnizeazasolutii mult mai fezabile;
Ipotezele pe care le facem sunt:
(I1) d = 0 (nu apar perturbatii);
(I2) w = 0 (nu apar zgomote);
(I3) D = 0 (ipoteza facuta ptr. simplificarea calculelor);
(I4) r(t) = 1(t) (referintele sunt semnale de tip treapta).
Conditiile de reglare asimpotic stabila
CAPITOLUL 4: SINTEZA ELEMENTARA 201 Reglarea Sistemelor Dinamice
Incepem prin a explicita conditiile pe care trebuie sa le indeplineasca sistemul inbucla inchisa pentru a realiza dezideratele (S) si (Re) sub ipotezele (I1)-(I3). Infinal, vom introduce principiul modelului intern pentru sistemele descrise pe spatiulstarilor si vom particulariza constructia efectiva a unui regulator in ipoteza (I4) –care realizeaza urmarirea asimptotica a unor referinte de tip treapta –.
PROBLEMA: Dandu–se sistemul dinamic
x = Ax+Buy = Cx
(158)
avand m intrari, p iesiri si dimensiunea spatiului starilor n, si vectorul de semnalede referinta r(t) ∈ Rp, se cere un sistem dinamic (regulator)
xK = AKxK +BKϵu = CKxK +DKϵ,
(159)
in care ϵ = r − y, astfel incat sa aibe loc:
CAPITOLUL 4: SINTEZA ELEMENTARA 202 Reglarea Sistemelor Dinamice
(S) Sistemul in bucla inchisa sa fie intern asimptotic stabil;
(Re) Iesirile y sa urmareasca asimptotic referintele r(t), i.e.,
limt→∞
ϵ(t) = 0.
Clasa semnalelor referinta se considera de tip persistent generate de un generatorliniar de semnal (de tipul celor introduse la studiul regimului permanent/tranzitoriu)
xr = Arxr xr(0) = xro, Λ(Ar) ⊂ C− ∪ C0
r = Crxr.(160)
Referintele vor avea atunci expresia
r(t) = CreArtxro.
CAPITOLUL 4: SINTEZA ELEMENTARA 203 Reglarea Sistemelor Dinamice
Eliminand succesiv semnalele din bucla si tinand cont ca ϵ = r − y = r − Cxobtinem
xK = AKxK +BKr −BKCxu = CKxK +DKr −DKCx.
(161)
Inlocuind ultima ecuatie in x = Ax+Bu obtinem succesiv
x = Ax+B(CKxK +DKr −DKCx) = (A−BDKC)x+BCKxK +BDKr
si deci pentru sistemul in bucla inchisa obtinem ecuatiile dinamice
˙[xxK
]=
[A−BDKC BCK
−BKC AK
] [xxK
]+
[BDK
BK
]r
ϵ =[−C O
] [ xxK
]+ Ipr
y =[C O
] [ xxK
] (162)
CAPITOLUL 4: SINTEZA ELEMENTARA 204 Reglarea Sistemelor Dinamice
sau
xR = ARxR +BRrϵ = CRxR +DRr,
(163)
unde
AR =
[A−BDKC BCK
−BKC AK
], BR =
[BDK
BK
], CR =
[−C O
], DR = Ip, xR =
[xxK
].
(164)Conditia (S) de stabilitate interna devine atunci
Λ(AR) ⊂ C−
si explicitam in continuare conditia de reglare (Re). Combinand ecuatiile sistemuluiin bucla inchisa (163) cu cele ale generatorului de semnale de referinta (160)
CAPITOLUL 4: SINTEZA ELEMENTARA 205 Reglarea Sistemelor Dinamice
obtinem
˙[xR
xr
]=
[AR BRCr
O Ar
] [xR
xr
], xR(0) = xRo, xr(0) = xro,
ϵ =[CR Cr
] [ xR
xr
] (165)
sauxRr = ARrxRr, xRr(0) = xRro,ϵ = CRrxRr
(166)
unde am folosit notatiile
ARr =
[AR BRCr
O Ar
], CRr =
[CR Cr
], xRr =
[xR
xr
], xRro =
[xRo
xro
].
(167)Conditia de reglare (Re)
limt→∞
ϵ(t) = 0, ∀ xRro
CAPITOLUL 4: SINTEZA ELEMENTARA 206 Reglarea Sistemelor Dinamice
devine atunci
limt→∞
CRreARrtxRro = 0, ∀ xRro. (168)
Observatie fundamentala: Aceasta cerinta nu poate fi realizata prin impunereaconditiei ca matricea de stare ARr sa fie intern asimptotic stabila deoarece ARr
contine valori proprii care sunt sigur in C+ ∪ C0 (semnalul r a fost presupuspersistent)! Singura posibilitate pentru a satisface conditia de (Re) ramanesa impunem ca dinamica care nu este stabila sa fie neobservabila in raport cuperechea (CRr, ARr) si acest lucru sa-l satisfacem prin alegerea judicioasa aparametrilor regulatorului ce se regasesc implicit in parametrii sistemului rezultant(AR, BR, CR, DR) ! In consecinta conditia de reglare implica satisfacerea anumitorproprietati structurale relativ sofisticate in spatiul starilor sistemului rezultant !
Pentru a satisface conditia (Re) trebuie sa impunem deci conditia ca subspatiulinvariant asociat dinamicii Ar sa fie neobservabil in perechea (CRr, ARr) explicitatain (167). O baza pentru subspatiul invariant corespunzator lui Ar – notat V+ are
CAPITOLUL 4: SINTEZA ELEMENTARA 207 Reglarea Sistemelor Dinamice
evident expresia
V+ =
⟨[VInr
]⟩unde V este o matrice ce se determina din conditia ca V+ sa fie neobservabil.Facand o completare pana la o transformare inversabila obtinem
S =
[InR
VO Inr
]de unde
S−1ARrS =
[AR ARV +BRCr − V Ar
O CRV + Cr
], CRrS =
[CR CRV + Cr
]iar in noul sistem de coordonate avem
V+ =
⟨[OInr
]⟩.
CAPITOLUL 4: SINTEZA ELEMENTARA 208 Reglarea Sistemelor Dinamice
Din conditia ca V+ este ARr invariant si inclus in KerCRr se obtin conditiile
ARV +BRCr − V Ar = 0, CRV + Cr = 0. (169)
Deci existenta unei matrici V care satisface relatiile (169) este echivalenta cusatisfacerea cerintei de reglare (Re) explicitata sub forma (168).
Observatie: Prima conditie (169) este o ecuatie Sylvester ce are intotdeauna osolutie unica deoarece Λ(AR) ⊂ C− si Λ(Ar) ⊂ C+ ∪ C0 (Explicati acest lucrupe baza conditiilor generale de existenta/unicitate a solutiilor ecuatiilor Sylvester –vezi Appendix).
In concluzie am redus problema originala de reglare intern asimptotic stabila lagasirea unui sistem (AK, BK, CK, DK) a.i. :
(S) Λ(AR) ⊂ C−;
(Re) Solutia unica V a ecuatiei Sylvester ARV + BRCr − V Ar = 0 sa satisfacaCRV + Cr = 0.
CAPITOLUL 4: SINTEZA ELEMENTARA 209 Reglarea Sistemelor Dinamice
Observatie: Tinand cont de expresiile explicite ale matricilor sistemului in buclainchisa (AR, BR, CR, DR) ca functii de parametrii regulatorului (AK, BK, CK, DK)(vezi (164)) este clar ca aceste conditii algebrice nu sunt deloc triviale sau usor deexplicitat intr-o forma procedurala. De aceea ne vom limita la prezentarea cazuluireprezentativ al referintelor de tip treapta.
Reglarea la Referinte Treapta
Fie sistemul (A,B,C,D = 0) avand matricea de transfer T (s) si y = Tu. Facemipotezele ca (A,B) este stabilizabila si (C,A) este detectabila, conditii ce suntnecesare si suficiente pentru existenta unui compensator stabilizator.
Considerand o schema clasica de reglare cu regulatorul K(s) montat pe caleadirecta intre eroare ϵ := r − y si comanda u, i.e., u = Kϵ.
Conform principiului modelului intern, pentru a regla la referinte de tip treaptatrebuie ca modelul referintei M(s) sa fie inclus in matricea de transfer in bucladeschisa, in cazul nostru L(s) := T (s)K(s). Mai exact, cum T (s) este dat,
CAPITOLUL 4: SINTEZA ELEMENTARA 210 Reglarea Sistemelor Dinamice
impunem ca modelul referintei sa fie inclus in
K(s) = K(s)M(s) (170)
unde M(s) este matricea de transfer a modelului referintei. Aceasta conditieasigura automat cerinta de reglare (Re). Daca consideram reglarea la referintatreapta atunci
M(s) =1
sIp.
Pentru a asigura cerinta (S) trebuie ca regulatorul K(s) sa stabilizeze intern T (s)
sau, echivalent, ca K(s) sa stabilizeze intern T (s) = M(s)T (s) (FIG) – K(s)
are o parte fixata R(s) pe care o includem in T (s) –. In consecinta proiectam
un compensator stabilizator K(s) pentru T (s) dupa care regulatorul dorit secalculeaza din (170).
Explicitam in continuare aceste conditii in termenii ecuatiilor dinamice de stare.
CAPITOLUL 4: SINTEZA ELEMENTARA 211 Reglarea Sistemelor Dinamice
FiexM = AMxM +BMϵy = CMxM +DMϵ
(171)
sau incaxM = AMxM +BM(r − Cx)y = CMxM +DM(r − Cx)
(172)
ecuatiile ce descriu dinamica modelului referintei si
x = Ax+Bu,y = Cx,
ecuatiile ce descriu sistemul. O realizare de stare pentru sistemul T cu y = T u seobtine automat inseriind T (s) cu M(s) (semnalul exogen r = 0)
T =
[A B
C D
]=
A O B−BMC AM O
O CM O
. (173)
CAPITOLUL 4: SINTEZA ELEMENTARA 212 Reglarea Sistemelor Dinamice
Deci problema s-a redus la constructia unui compensator pentru T dat de (173).
In cazul particular in care dorim reglarea la referinte de tip treapta avem AM = 0,BM = Ip, CM = Ip, DM = 0 si (173) devine
T =
[A B
C D
]=
A O B−C O OO Ip O
. (174)
Pentru scrierea unui compensator stabilizator pentru T putem aplica schemastandard de scriere a unui compensator Kalman (sau orice schema de stabilizare
cu estimator de stare si reactie dupa starea estimata). Intrucat matricea C esteepica preferam sa scriem un estimator de ordin redus si sa luam o reactie dupastarea estimata obtinand in final un sistem compensator de ordin mai mic decatT (s) (si de acelasi ordin cu T (s)).
Pentru scrierea unui estimator de ordin redus folosim direct formulele (143)
CAPITOLUL 4: SINTEZA ELEMENTARA 213 Reglarea Sistemelor Dinamice
observand in prealabil ca realizarea (174) este in forma (142) si facand identificarile
A =
[A O−C O
]=
[A1 A3
A2 A4
], B =
[BO
]=
[B1
B2
], C =
[O Ip
].
Conditia necesara si suficienta pentru existenta unui estimator este ca perechea(A2, A1) = (−C,A) sa fie detectabila ceea ce este automat asigurat in ipotezele de
lucru ((C,A) este detectabila). Fie L = −L a.i. Λ(A+LC) = Λ(A− LC) ⊂ C−.Obtinem pentru ecuatiile estimatorului de ordin redus
w = (A+ LC)w + (A+ LC)Ly +Bu,
x =
[x1
x2
]=
[In−p
O
]w +
[LIp
]y.
(175)
Un compensator stabilizator se obtine atunci luand o reactie stabilizanta dupa
CAPITOLUL 4: SINTEZA ELEMENTARA 214 Reglarea Sistemelor Dinamice
starea estimata de forma
u =[F F
] [x1
x2
]= F (w + Ly) + F y. (176)
O astfel de reactie stabilizanta exista daca si numai daca perechea (A, B) estestabilizabila. Acest lucru nu este insa automat indeplinit decat daca facem ipotezaca modelul referintei (polii s = 0) nu este simplificat de modelul sistemului T (s) !(Ex: faceti conexiunea cu sistemele SISO – trebuie ca diag {1s} sa apara in fctia detransfer in bucla deschisa si deci nu trebuie sa se simplifice in produsul L = TK–. O conditie suficienta ca sa nu apara aceasta simplificare este ca sistemul T sanu aibe zerouri in s = 0 ceea ce este asigurat de impunerea conditiei
rank
[−A −BC O
]= n+ p. (177)
Intr-adevar, daca (A,B) stabilizabila si are loc (177) atunci (A, B) este stabilizabila(Ex: Demonstrati acest lucru folosind criteriul PBH).
CAPITOLUL 4: SINTEZA ELEMENTARA 215 Reglarea Sistemelor Dinamice
Deci in ipotezele (A,B) stabilizabila, (C,A) detectabila si (177) exista un com-pensator stabilizator care se obtine luand o reactie dupa starea estimata prinintermediul unui estimator de ordin redus pentru sistemul T . Ecuatiile compen-satorului sunt
w = (A+ LC)w + (A+ LC)Ly +Bux1 = w + Lyx2 = y
u = F (w + Ly) + F y
(178)
sau eliminand w prin inlocuire din a doua ecuatie si inlocuind u in prima ecuatieobtinem
˙x1 = (A+ LC +BF )x1 ++BF x2 + Lϵ˙x2 = ϵ
u = Fx1 + F x2
(179)
unde am tinut cont ca y = x2 si ˙x2 = ϵ. Deci un compensator stabilizator pentru
CAPITOLUL 4: SINTEZA ELEMENTARA 216 Reglarea Sistemelor Dinamice
T (s) este dat de
K(s) =
[AK BK
CK DK
]=
A+ LC +BF BF LO O I
F F O
. (180)
A ramas de verificat ca intr–adevar acest compensator (regulator) asigura de faptreglarea. Acest lucru se arata verificand conditiile de reglare (169)
ARV +BRCr − V Ar = 0, CRV + Cr = 0
in care Ar = O, Cr = I. Aceasta este echivalent cu a arata ca solutia ecuatiei
ARV = −BR
verifica CRV = −Ip. Inlocuind expresiile lui AR, BR si CR cu datele obtinute
CAPITOLUL 4: SINTEZA ELEMENTARA 217 Reglarea Sistemelor Dinamice
rezulta dupa partitionarea corespunzatoare a lui V
(ARV =)
A BF BF
−LC A+BF + LC BF−C O O
V1
V2
V3
=
O−L−Ip
(= −BR)
(181)si
(CRV =)[−C O O
] V1
V2
V3
= −Ip. (182)
Inspectand ultima relatie observam ca este identica cu ultima ecuatie din (181) sideci daca V verifica (181) atunci automat verifica si (182). In final, V exista sieste unic intrucat AR este inversabila (Λ(AR) ⊂ C− asa cum rezulta din teoriastabilizarii cu compensatoare de ordin redus).
Procedura de reglare la referinta treapta cu compensare asimptotic intern stabila
– Exercitiu –
CAPITOLUL 4: SINTEZA ELEMENTARA 218 Reglarea Sistemelor Dinamice