TSA Global

Teoria Sistemelor Automate

Cristian Oara, Radu Stefan

Facultatea de Automatica si CalculatoareUniversitatea “Politehnica” Bucurestie-mail: {oara,stefan}@riccati.pub.roURL: http://www.riccati.pub.ro/

TEORIA SISTEMELOR AUTOMATE

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

1. Sisteme Dinamice pe Spatiul Starilor

2. Evolutia Starii, Tranzitia Intrare–Iesire

3. Echivalenta Sistemelor Liniare

4. Stabilitatea Sistemelor

5. Regimurile Permanent/Tranzitoriu/Stationar

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 1 SISTEME DINAMICE PE SPATIUL STARILOR

1. Sisteme Dinamice pe Spatiul Starilor

Clasa sistemelor considerate:

• LINIARE

• INVARIANTE IN TIMP

• FINIT DIMENSIONALE

• MULTI-INTRARE/MULTI-IESIRE (MIMO)

Definitia 1. Se numeste sistem dinamic liniar, invariant in timp, cu timpcontinuu un cuadruplu de matrici constante (A,B,C,D), unde A ∈ Rn×n,

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 2 Sisteme Dinamice pe Spatiul Starilor

B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m ce se expliciteaza prin{x(t) = Ax(t) +Bu(t), x(to) = xo

y(t) = Cx(t) +Du(t)(1)

unde x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp;u(t) → intrarea sistemului, u(·) ∈ U , U → spatiul functiilor (semnalelor) de intrare;y(t) → iesirea sistemului, y(·) ∈ Y, Y → spatiul functiilor (semnalelor) de iesire;x(t) → starea sistemului, x(·) ∈ X , X → spatiul starilor.

Observatii:• Sistemul dinamic astfel definit admite o scriere matriciala ce expliciteaza de faptun sistem de n ecuatii diferentiale cu n necunoscute (starile) iar iesirile sunt ocombinatie liniara a starilor si intrarilor (FIG);• Sistemul este automat invariant in timp, liniar, finit dimensional si cauzal !• Datorita invariantei in timp se poate lua intotdeauna to = 0 si deci conditiainitiala se rescrie x(0) = xo;


• Sistemul dinamic astfel definit se poate figura ca un sistem intrare–iesire in carestarea joaca rolul de variabila de cuplare (FIG) !• Sistemul este complet precizat de cele patru matrici (A,B,C,D);• Conditii uzuale: u(t) continua cel putin pe portiuni caz in care x(t) si y(t)rezulta functii continue;


2. Evolutia Starii, Tranzitia Intrare–Iesire

Prima ecuatie a sistemului

x(t) = Ax(t) +Bu(t), x(0) = xo

este in fapt un sistem de n ecuatii diferentiale ordinare cu n necunoscute avando solutie unica in cazul in care starea initiala xo si comanda u(t), t ≥ 0, suntprecizate (u(·) este continua pe portiuni). Din teoria ecuatiilor diferentiale ordinaresolutia rezulta

x(t) = ϕ(t, xo, u(·)) = eAtxo +∫ t

0eA(t−τ)Bu(τ)dτ

= ϕ(t, xo, 0) + ϕ(t, 0, u(·))= xℓ(t) + xf(t).

Functia ϕ : R × Rn × U → Rn se numeste functia de tranzitie a starii. Descom-punerea aditiva de mai sus pune in evidenta superpozitia efectelor (datorate starii

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 5 Evolutia Starii, Tranzitia Intrare–Iesire

initiale xo – regim liber – si respectiv comenzii u(·) – regim fortat).

Matricea

Φ(t) := eAt

se numeste matricea de tranzitie a starii. Cu aceasta notatie solutia sistemului deecuatii diferentiale se rescrie

x(t) = Φ(t)xo +

∫ t

0

Φ(t− τ)Bu(τ)dτ. (2)

Problema: Ce inseamna si cum se calculeaza eAt ?Avem prin definitie

ex = 1 +1

1!x+

1

2!x2 + . . .+

1

n!xn + . . .


care in cazul matricial devine

eAt = In +1

1!(At) +

1

2!(At)2 + . . .+

1

n!(At)n + . . . . (3)

Calculul matricii de tranzitie a starii se bazeaza pe forma Jordan a matricii A si vafi explicitat mai tarziu.

Reversibilitatea timpului: Deoarece Φ(t) = 0, ∀t finit, obtinem din (2)

xo = Φ(−t)x(t)−∫ t

0Φ(−t)Φ(t− τ)Bu(τ)dτ

= Φ(−t)x(t)−∫ t

0Φ(−τ)Bu(τ)dτ

(4)

de unde rezulta ca in cazul sistemelor netede (cu timp continuu) starea initiala sepoate intotdeauna recupera daca se cunoaste “unde s-a ajuns” si comanda care agenerat starea respectiva. (FIG)

Iesirea sistemului se obtine imediat ca o combinatie liniara de intrari si stari sub


forma (vezi (1) si (2))

y(t) = f(t, xo, u(·)) = CeAtxo +∫ t

0CeA(t−τ)Bu(τ)dτ

= f(t, xo, 0) + f(t, 0, u(·))= yℓ(t) + yf(t).

Matricile

T (t) := CΦ(t)B, Tc(t) :=

{0, t < 0,T (t), t ≥ 0

se numesc matricea pondere respectiv matricea de raspuns cauzal la impuls. Maimult

Tc(t) = T (t)1(t)

unde 1(t) := diag {1(t)} iar 1(t) este functia treapta (Heaviside). Cu acestenotatii

y(t) = CΦ(t)xo +

∫ t

0

Tc(t− τ)u(τ)dτ.


In particular daca xo = 0 obtinem

y(t) =

∫ t

0

Tc(t− τ)u(τ)dτ = yf(t)

ceea ce arata ca matricea de raspuns cauzal la impuls permite exprimarea iesiriiatunci cand conditia initiala este nula. Mai precis, in conditii initiale nule sistemuldinamic se poate exprima ca un sistem de convolutie sub forma

y(t) =

∫ ∞

−∞Tc(t− τ)u(τ)dτ = Tc(t) ∗ u(t),

(u = 0 pentru t < 0 si Tc(t− τ) = 0 pentru t− τ < 0). Daca m = p = 1 atunciTc(t) = hc(t) si are semnificatia de raspuns cauzal al sistemului atunci cand laintrare se aplica un impuls Dirac u(t) = δ(t).

Functie (Matrice) de Transfer


Restrangem intrarile la clasa functiilor original, i.e., U ⊂ O. Atunci automat x(t)si y(t) vor fi functii original, i.e. X ⊂ O si Y ⊂ O. In aceste conditii aplicandtransformatele Laplace sistemului original (1) obtinem{

sx(s)− xo = Ax(s) +Bu(s),y(s) = Cx(s) +Du(s),

(5)

de unde tinand cont ca (sI −A) este a.p.t. nesingulara

x(s) = (sI −A)−1xo + (sI −A)−1Bu(s) = xℓ(s) + xf(s).

Avem deasemenea

Φ(s) := L(Φ(t)) = L(eAt) = (sI −A)−1

care se numeste matricea rezolventa si deci

Φ(t) = L−1((sI −A)−1).


Mai mult,

Φ(s) = s−1I + s−2A+ s−3A3 + . . .

care are loc pentru |s| > R unde R := max{|λ|, λ ∈ Λ(A)}. Deasemenea

Φ(s) = (sI −A)−1 =(sI −A)∗

χ(s)=

G(s)

ν(s)

unde χ(s) := det(sI − A) si ν(s) sunt polinomul caracteristic respectiv minimalale lui A. In operational iesirea devine

y(s) = Cx(s)+Du(s) = C(sI−A)−1xo+C(sI−A)−1Bu(s)+Du(s) = yℓ(s)+yf(s).

Matricea de transfer este prin definitie

T (s) := L(Tc(t)) = C(sI −A)−1B +D =:

[A BC D

]CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 11 Evolutia Starii, Tranzitia Intrare–Iesire

unde ultima expresie explicita se obtine comparand expresiile iesirii in domeniultimp si operational. Mai departe,

T (s) =C(sI −A)∗B

χ(s)+D =

R(s)

χ(s)=

R(s)

ν(s)= {Tij(s)} 1 ≤ i ≤ p

1 ≤ j ≤ m

.

Matricea de transfer a unui sistem dinamic (in acceptiunea definitiei date) este op×m matrice de functii rationale proprii. Ea permite explicitarea in operational aiesirii in functie de intrare atunci cand conditiile intiale sunt nule

y(s) = T (s)u(s) (xo = 0).


3. Echivalenta Sistemelor Liniare

Definitia 2. Doua sisteme liniare (A,B,C,D) si (A, B, C, D) avand acelasinumar de intrari si iesiri si aceeasi dimensiune a spatiului starilor (p = p, m =m, n = n) se numesc echivalente (izomorfe) pe stare daca exista o transformarenesingulara T astfel incat

A = TAT−1,

B = TB,

C = CT−1,

D = D.

Transformarea T este de fapt o schimbare de coordonate la nivelul marimii de

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 13 Echivalenta Sistemelor Liniare

stare. Intr–adevar, daca {x(t) = Ax(t) +Bu(t),y(t) = Cx(t) +Du(t),

(6)

si definim pentru un T inversabil fixat

x(t) := Tx(t) ⇔ x(t) = T−1x(t)

atunci obtinem {T−1 ˙x(t) = AT−1x(t) +Bu(t),y(t) = CT−1x(t) +Du(t),

⇒ (7){˙x(t) = TAT−1x(t) + TBu(t),

y(t) = CT−1x(t) +Du(t),⇒{

˙x(t) = Ax(t) + Bu(t),

y(t) = Cx(t) + Du(t),


unde

A = TAT−1, B = TB, C = CT−1, D = D.

Propozitia 3 (Exercitiu). Doua sisteme echivalente pe stare care au conditiileinitiale asemenea prin T si sunt supuse aceleiasi comenzi u(·) au traiectoriilede stare asemenea prin T si evolutii la iesire identice.Definitia 4. Doua sisteme dinamice (A,B,C,D) si (A, B, C, D) se numescechivalente intrare–iesire daca au aceeasi functie de transfer, i.e.,

T (s) = C(sI − A)−1B + D = C(sI −A)−1B +D = T (s).

Observatii: a) Doua sisteme echivalente intrare–iesire trebuie sa aibe acelasi numarde intrari (m = m) si acelasi numar de iesiri (p = p). Este posibil insa cadimensiunea vectorului de stare sa difere, i.e. n = n.


b) Pentru doua sisteme echivalente intrare–iesire avem automat

D = T (∞) = T (∞) = D.


Relatia intre Echivalenta de Stare si Echivalenta Intrare–Iesire

Propozitia 5.Doua sisteme echivalente pe stare sunt echivalente intrare–iesire.

Demonstratie. Intr-adevar,

T (s) = C(sI − A)−1B + D = CT−1(sI − TAT−1)−1TB +D= CT−1(T (sI −A)T−1)−1TB +D = C(sI −A)−1B +D = T (s).

Observatii: a) Reciproca nu este in general valabila (este posibil ca pentru douasisteme echivalente intrare–iesire) sa avem n = n). (EX)b) Diferenta in definitiile echivalentei consta in aceea ca una este centrata pe starepe cand cealalta este centrata pe functia de transfer (intrare–iesire).c) Pentru orice matrice de transfer exista o infinitate de realizari de stare.


d) Problema dimensiunii realizarii de stare este esentiala: exista o dimensiune ceeste minima (realizare minimala), strict legata de anumite proprietati structurale.


4. Stabilitatea Sistemelor Dinamice

Stabilitatea este o proprietate calitativa a sistemelor asociata comportarii dinamicea acestora.

Daca stabilitatea se refera la comportarea lui x(t) se numeste stabilitate de tipLyapunov iar daca se refera la y(t) se numeste stabilitate externa.

Stabilitate Interna (Libera sau Lyapunov)

Acest tip de stabilitate se refera la comportarea marimii de stare x(t) atunci candintrarea este identic nula. Ecuatia relevanta este

x(t) = Ax(t), x(0) = xo.

Definitia 6. Un sistem dinamic se numeste intern stabil daca ∀ϵ > 0, ∃δ(ϵ) > 0

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 19 Stabilitatea Sistemelor Dinamice

a.i. ∀xo cu ∥xo∥ < δ(ϵ) avem

∥x(t)∥ ≤ ϵ, ∀t ∈ R+.

Definitia 7. Un sistem dinamic s. n. intern asimptotic stabil daca ∀xo avem

limt→∞

∥x(t)∥ = 0.

Observatii: a) Definitia este generala folosindu-se si in cazul sistemelor neliniare.In cazul liniar exista anumite consecinte simple deoarece avem solutia

x(t) = eAtxo.

b) Sistemul este intern asimptotic stabil daca si numai daca limt→∞Φ(t) = 0.

Evaluarea lui Φ(t) = eAt


Consideram succesiv urmatoarele cazuri:a) A este un bloc Jordan elementar cu valoare proprie 0;b) A este un bloc Jordan elementar oarecare;c) A oarecare.

a) In acest caz presupunem A ∈ Rn×n si

A = J0 =

0 1 . . . 0... ... . . . ...0 0 . . . 10 0 . . . 0

.

Evident A este nilpotenta cu indice de nilpotenta egal cu n, i.e. An = 0 si


An−1 = 0. Folosind definitia exponentialei matriciale (3) obtinem in acest caz

eAt = In+

0 t

1! . . . 0... ... . . . ...0 0 . . . t

1!0 0 . . . 0

+· · ·+

0 0 . . . tn−1

(n−1)!... ... . . . ...0 0 . . . 00 0 . . . 0

=

1 t

1! . . . tn−1

(n−1)!... ... . . . ...0 0 . . . t

1!0 0 . . . 1

.

b) In acest caz presupunem A ∈ Rn×n si

A = Jo + Λo, unde Λo =

λo 0 . . . 0... ... . . . ...0 0 . . . 00 0 . . . λo

= λoIn.

Avem eAt = e(Jo+Λo)t = eJoteΛ0t (relatie ce are loc pentru ca Λo comuta cu Jo).


Tinand cont ca eΛot = eλotIn obtinem in final

eAt = eλot

1 t

1! . . . tn−1

(n−1)!... ... . . . ...0 0 . . . t

1!0 0 . . . 1

.

c) Cazul general se reduce la cazurile precedente prin aducerea matricii A la formacanonica Jordan. Mai precis, ∀A ∈ Rn×n, ∃T ∈ Rn×n nesingulara a.i.

J = TAT−1 =

J1 0. . .

0 Jk

unde J este o matrice Jordan (bloc diagonala avand pe diagonala blocuri elementare


Jordan Ji la valorile proprii ale matricii A). Matricea de tranzitie a starii devine

eAt = eT−1JTt = T−1eJtT = T−1

eJ1t 0. . .

0 eJkt

T.

Recapitulare: Polinom caracteristic, minimal, forma canonica Jordan, valori proprii,multiplicitati algebrice si geometrice;Teorema 8. 1. Sistemul dinamic (A,B,C,D) este intern asimptotic stabil dacasi numai daca Λ(A) ⊂ C− (spectrul matricii de stare A este localizat in semi-planul stang deschis).2. Sistemul dinamic (A,B,C,D) este intern stabil daca si numai daca Λ(A) ⊂C− ∪ C0 iar valorile proprii care au partea reala nula sunt radacini simple alepolinomului minimal.

Demonstratie: 1. Suficienta conditiilor rezulta automat din forma Jordan. Pentrunecesitate pp ca sistemul este intern asimptotic stabil. Atunci rezulta ca Φ(t)xo →0 pentru t → ∞, ∀xo ∈ Rn. Pp prin absurd ca nu este indeplinita conditia de


spectru. Atunci ∃ λ0 ∈ Λ(A) cu Re λo ≥ 0. Fie xo un vector propriu asociat luiλo. Atunci

eAtxo = eλotxo → 0

ceea ce contrazice ipoteza de stabilitate asimptotica.2. Demonstratia este similara tinand cont ca eJit este marginita (Ji este blocJordan elementar) daca si numai daca v. p. corespunzatoare are partea reala saustrict negativa sau zero cu multiplicitatea cel mult unu.Observatii: a) Testarea stabilitatii interne pentru un sistem dinamic se reducedin punct de vedere procedural la calculul valorilor proprii ale matricii de stare A(aducerea matricii la forma Schur).b) Deoarece stabilitatea interna a unui sistem depinde exclusiv de locatia spectruluimatricii de stare A uneori se foloseste abuziv terminologia de matrice (asimptotic)stabila.

Ecuatia Lyapunov si Stabilitatea Sistemelor Liniare

EcuatiaATP + PA+Q = 0, A ∈ Rn×n, Q ∈ Rn×n (8)


in necunoscuta P ∈ Rn×n se numeste ecuatie Lyapunov (matriciala, algebrica, intimp continuu).Teorema 9. Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci ecu-atia Lyapunov are o solutie unica data explicit de expresia

P :=

∫ ∞

0

eAT tQeAtdt. (9)

Demonstratie. Sa observam intai ca deoarece A este asimptotic stabila expresia(9) este bine definita (integrala nedefinita este convergenta). Calculand

ATP + PA =∫∞0

(ATeAT tQeAt + eA

T tQeAtA)dt =∫∞0

ddt(e

AT tQeAt)dt

= eAT tQeAt

∣∣∣∞0

= −Q

concluzionam ca intr-adevar P dat de (9) este o solutie a ecuatiei Lyapunov.


Ramane sa aratam ca P este unica solutie. Consideram aplicatia liniara

P : Rn2→ Rn2

, P(P ) := ATP + PA.

Aceasta aplicatie este insa surjectiva deoarece tocmai am aratat ca ∀Q ∈ Rn2 ⇒∃P ∈ Rn2

(dat de (9)) a.i. P(P ) = −Q. Deoarece o aplicatie liniara si surjectivaeste automat injectiva (si deci bijectiva) rezulta ca pentru Q fixat P dat de (9)este unica solutie a ecuatiei Lyapunov (8). In particular, P = P−1(−Q).

Observatii: a) Daca Q = QT atunci rezulta automat din (9) ca P = PT .b) Daca Q = QT ≥ 0 atunci P = PT ≥ 0.c) Daca Q = QT > 0 atunci P = PT > 0.

Ecuatia Lyapunov se foloseste in special in teoria sistemelor neliniare pentru testareastabilitatii. In cazul liniar avem urmatorul rezultat (un fel de reciproca).Teorema 10 (Lyapunov). Presupunem ca ∃P = PT > 0 si Q = QT ≥ 0 a. i.

ATP + PA+Q = 0.


Atunci Λ(A) ⊂ C−0 .

Demonstratie. Fie λ ∈ Λ(A) o valoare proprie a lui A si x un vector propriuasociat, i.e.,

Ax = λx (λ ∈ C, x ∈ Cn, x = 0).

Hermitizand aceasta ecuatie (transpus + conjugat) obtinem

xHAT = λxH,

iar din ecuatia Lyapunov avem succesiv

xHATPx+ xHPAx = −xHQx;

λxHPx+ λxHPx = −xHQx;

2Re(λ)xHPx = −xHQx.

Deoarece xHPx > 0 si −xHQx ≤ 0 rezulta automat Re(λ) ≤ 0.


Observatii: a) Daca in teorema de mai sus intarim ipotezele a.i. P > 0, Q > 0atunci rezulta ca A este asimptotic stabila (Λ(A) ⊂ C−).b) Indicatii procedurale de testare a (semi)pozitivitatii si rezolvare a ecuatiilorLyapunov.c) Ecuatia Lyapunov se poate folosi pentru a testa stabilitatea unui sistem prinrezolvarea unui sistem de ecuatii liniare (o problema considerabil mai simpla dpdvteoretic decat calculul valorilor proprii ale matricii A).


5. Regimurile Permanent/Tranzitoriu/Stationar ale Sistemelor

Fie sistemul {x = Ax+Bu, x(0) = xo,y = Cx+Du

(10)

avand matricea de transfer

T (s) = C(sI −A)−1B +D.

Pentru a pune in evidenta regimurile permanent si tranzitoriu ale unui sistem facemipotezele:a) Sistemul este intern asimptotic stabil, i.e., Λ(A) ⊂ C−;b) Comanda u este produsa de regimul liber al unui sistem antistabil{

xe = Aexe, xe(0) = xeo,u = Cexe

(11)

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 30 Regim Permanent/Tranzitoriu/Stationar

cu Λ(Ae) ⊂ C+ ∪ C0. Comanda are deci expresia

u(t) = CeeAetxeo

si cum Λ(Ae) ⊂ C+ ∪ C0 rezulta ca u este un semnal persistent (in particular,daca Ae = 0 avem u = Cexeo = cst).

Deoarece sistemul (A,B,C,D) este asimptotic stabil putem afirma intuitiv cadupa un timp suficient de lung (asimptotic) starea sistemului va urma semnalul deintrare produs de sistemul instabil (generatorul de semnal u). Prin urmare incercamsa vedem daca se poate pune in evidenta la nivelul starii x o descompunere detipul

x(t) = ξ(t) + V xe(t) (12)

unde limt→∞ ξ(t) = 0 (componenta tranzitorie) si V xe(t) este proportionala cuu(t) = Cexe(t) (componenta permanenta). Inlocuind (12) in (10) obtinem

ξ + V xe = Aξ +AV xe +BCexe


sau incaξ = Aξ + (AV − V Ae +BCe)xe. (13)

Deoarece Λ(A) ∩ Λ(Ae) = ∅ rezulta ca ecuatia Sylvester

AV − V Ae +BCe = 0

are o solutie unica V . Punand acest V in (12) si (13) regimul dinamic devine

ξ = Aξ, ξ(0) = ξ0

si cum sistemul original este asimptotic stabil avem ca limt→∞ ξ(t) = 0. Prinurmare, in ipotezele facute exista si este unic V a.i. sa avem descompunerea

x(t) = xp(t) + xt(t)

in regim permanent si respectiv regim tranzitoriu

xp(t) := V xe, xt(t) := ξ(t). (14)


Observatii: a) Descompunerea in regim permanent si tranzitoriu se face in raportcu clasa de semnale exogene {u(·)|u(t) = Cee

Aetxeo, xeo ∈ Rne}.b) Descompunerea in regim permanent si tranzitoriu este specifica sistemelor liniare(apare numai in context liniar) pe cand descompunerea in regim liber si fortat areloc si in cazul sistemelor neliniare.c) Daca Ae = 0 atunci avem de-a face cu un regim stationar (intrari constante),xe(t) = xeo,∀t ≥ 0, ecuatia Sylvester are solutia V = −A−1BCe si obtinem

xp(t) = −A−1BCexeo = −A−1BCu0,

yp(t) = −CA−1BCexe0 +Du0 = −CA−1Bu0 +Du0 = T (0)u0,

unde u0 := Cexe0 si T (s) = C(sI − A)−1B + D este matricea de transfer asistemului.d) Daca Ae = jωI, Ce = I, avem u = uoe

jωt iar ecuatia Sylvester devine

AV − jωV +B = 0


avand solutia unicaV = (jωI −A)−1B.

Regimul permanent este atunci

yp = C(jωI −A)−1Buoejωt = T (jω)uoe

jωt

unde uo = Cexeo.

Exercitiu: Puneti in evidenta regimurile liber/fortat, permanent/tranzitoriu pentruun circuit RLC cu intrarea generata de un sistem cu matricea de stare Ae avanddoua radacini pur imaginare complex conjugate. Specificati regimul stationarpentru acest circuit.


CAPITOLUL 3: PROPRIETATI STRUCTURALE

Exista anumite proprietati fundamentale ale sistemelor dinamice pe spatiul starilorcare influenteaza decisiv posibilitate de analiza si sinteza: controlabilitate, ob-servabilitate, minimalitate, stabilizabilitate, detectabilitate. Aceste proprietati sereflecta in anumite proprietati structurale ale matricilor sistemice (A,B,C,D).

1. Controlabilitatea

2. Observabilitatea

3. Descompunere Structurala

4. Realizabilitate

5. Conexiunea Sistemelor

CAPITOLUL 3: PROPRIETATI STRUCTURALE 35 PROPRIETATI STRUCTURALE

1. Controlabilitatea (“Posibilitatea de a Controla”)

Controlabilitatea este o proprietate calitativa ce caracterizeaza abilitatea unuisistem {

x(t) = Ax(t) +Bu(t), x(0) = xo

y(t) = Cx(t) +Du(t),(15)

de a putea tranzita dintr-o stare in alta prin intermediul unei anumite comenzi(control). Pentru controlabilitate este relevanta numai prima ecuatie din (28) sisolutia corespunzatoare

x(t) = eA(t)xo +

∫ t

0

eA(t−τ)Bu(τ)dτ, t ≥ 0. (16)

Stare/Sistem Controlabil(a)Definitia 11. O stare x ∈ Rn se numeste controlabila la momentul t > 0 dacaexista o comanda u(·) ∈ U care transfera xo = 0 (originea) in starea x(t) = x.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 36 Controlabilitatea

Observatii: a) Aparent pentru a stabili controlabilitatea unei stari la momentul ttrebuie rezolvata ecuatia functionala (16) in necunoscuta u(·) : [0, t] → Rn (cuxo = 0).b) Conform definitiei, controlabilitatea unei stari x depinde de perechea de matrici(A,B) si de momentul t > 0. Vom vedea ca de fapt controlabilitatea este oproprietate ce depinde exclusiv de perechea (A,B) (este independenta de t).

Gramian de Controlabilitate

Pentrul studiul controlabilitatii se introduce Gramianul de Controlabilitate la mo-mentul t > 0 definit de

Lc(t) =

∫ t

0

eA(t−τ)BBTeAT (t−τ)dτ. (17)

Observatii:a) Lc(t) = Lc(t)T ;

b) Lc(t) ≥ 0;c) Pentru orice matrice simetrica X = XT ∈ Rn×n avem Ker (X) ⊥ Im (X) si


Rn = Ker (X)⊕ Im (X). Cum se obtine asa ceva ?

Caracterizarea Controlabilitatii prin Gramianul de Controlabilitate

Teorema 12. Starea x este controlabila la momentul t > 0 daca si numai dacax ∈ ImLc(t).

Demonstratie. Necesitatea: Presupunem ca x este controlabila la momentul t > 0adica ∃u(·) a.i.

x =

∫ t

0

eA(t−τ)Bu(τ)dτ.

Avem x = xK + xI unde xK ∈ KerLc(t), xI ∈ ImLc(t). Aratam ca xK = 0.Intr-adevar,

xTKx = ∥xK∥2 =

∫ t

0

xTKeA(t−τ)Bu(τ)dτ (18)

si pentru a arata ca xK = 0 este suficient sa aratam ca xTKeA(t−τ)B = 0,


∀τ ∈ [0, t]. Aceasta identitate rezulta insa automat din sirul de egalitati

0 = xTKLc(t)xK =

∫ t

0

xTKeA(t−τ)BBTeA

T (t−τ)xKdτ =

∫ t

0

∥BTeAT (t−τ)xK∥2dτ

si din analiticitatea functiei BTeAT (t−τ)xK pe [0, t].

Suficienta: Presupunem ca x ∈ ImLc(t) ceea ce este echivalent cu

x = Lc(t)z =

∫ t

0

eA(t−τ)BBTeAT (t−τ)zdτ (19)

pentru un z ∈ Rn potrivit ales. Definim

u(τ) := BTeAT (t−τ)z, τ ∈ [0,∞) (20)


care introdus in (19) arata ca

x =

∫ t

0

eA(t−τ)u(τ)dτ

sau ca starea x este controlabila la momentul t.

Observatii: a) Deoarece z = Lc(t)#x comanda (20) se mai poate scrie ca

u(τ) := BTeAT (t−τ)Lc(t)

#x, (21)

unde Lc(t)# este pseudoinversa (Moore-Penrose) a lui Lc(t).

b) Daca x ∈ ImLc(t) atunci comanda (21) duce starea initiala (originea) in stareax la momentul t iar daca x ∈ ImLc(t) atunci comanda (21) duce originea cat sepoate de aproape de x la momentul t (adica transfera starea pe directia data deimaginea gramianului)!

Caracterizarea Controlabilitatii prin Matricea de Controlabilitate


Din cele discutate pana acum controlabilitatea unei stari depinde de momentul detimp t > 0. In continuare vom vedea ca de fapt proprietatea de controlabilitateeste independenta de t.

Introducem matricea de controlabilitate asociata unui sistem dinamic (sau maiprecis unei perechi matriciale (A,B), A ∈ Rn×n, B ∈ Rn×m):

R :=[B AB A2B . . . An−1B

]. (22)

Matricea de controlabilitate are dimensiune n× (nm).Teorema 13. Fie t > 0 fixat. Atunci x ∈ ImLc(t) ⇔ x ∈ ImR, i.e.,

ImLc(t) = ImR. (23)

Demonstratie. Sa observam mai intai ca Lc(t) fiind simetrica conditia (34) este


echivalenta cu KerLc(t) = KerRT sau inca

Lc(t)x = 0 ⇔ xTR = 0, x ∈ Rn. (24)

Aratam intai implicatia directa. Avem

Lc(t)x = 0 ⇔∫ t

0

xTeA(t−τ)BBTeAT (t−τ)xdτ = 0 ⇔

∫ t

0

∥xTeA(t−τ)B∥2dτ = 0.

Rezulta succesiv ca

xTeA(t−τ)B = 0, ∀0 ≤ τ ≤ t,

xTeAτB = 0, ∀τ ∈ R,

ultima egalitate rezultand din analiticitatea functiei xTeAτB (daca o functieanalitica este nula pe un interval deschis atunci este nula pe toata axa reala, iar


[0, t] contine automat un interval deschis). Mai departe obtinem ca

dk

dtk[BTeA

T τx]τ=0 = 0, k = 0, 1, 2, . . .

de unde

xTB = 0, xTAB = 0, , . . . , xTAkB = 0, . . .

ceea ce este echivalent cu xT[B AB A2B . . . An−1B

]= 0 sau xTR = 0.

Aratam acum implicatia inversa. Fie x = 0 a.i. xTR = 0. AtuncixT

[B AB A2B . . . An−1B

]= 0 sau inca

xTB = 0, xTAB = 0, , . . . , xTAn−1B = 0.

Din teorema Hamilton–Cayley rezulta imediat ca

xTAkB = 0, ∀k ≥ 0.


Definim functia analitica ϕ(τ) := xTeAτB, ϕ : [0, t] ⇒ Rm. Din relatiile demai sus rezulta ca toate derivatele evaluate in zero sunt nule, i.e., ϕ(0) = 0,ϕ(1)(0) = 0, . . . ϕk(0) = 0. Din analiticitate rezulta automat ca

ϕ(τ) = 0, ∀τ ∈ [0, t]

si mai departe ca

xTLc(t)x =

∫ t

0

ϕ(τ)ϕ(τ)Tdτ = 0.

Cum Lc(t) ≥ 0 rezulta in continuare Lc(t)x = 0 q.e.d.

Observatii: a) O stare x ∈ Rn este controlabila independent de momentul t > 0.Proprietatea este intrinseca starii x si perechii (A,B).b) Se poate arata ca daca extindem clasa de semnale de intrare la functiigeneralizate (incluzand distributii) atunci daca x este controlabila exista o comandacare duce originea in acea stare intr-un timp infinit mic (nul) – fenomene de tipBushow.


c) Putem introduce definitia echivalenta: o stare x s.n. controlabila daca existat > 0 si o comanda u(·), u : [0, t], a.i. traiectoria satisface x(t) = x.Corolarul 14.

R := ImR = ImLc(t), ∀t > 0.

Introducem notiunea de sistem controlabil (sau pereche (A,B) controlabila) cusemnificatia ca fiecare stare x ∈ Rn este controlabila. Avem atunci urmatorulrezultat central.Teorema 15. Fie perechea (A,B).1. O stare x este controlabila daca si numai daca x ∈ R.2. Perechea (A,B) (sau sistemul corespunzator) este controlabila (controlabil)daca si numai daca R = Rn (sau, echivalent, rankR = n).

Observatie: Din punct de vedere procedural controlabilitatea unui sistem se poatetesta verificand ca rangul matricii de controlabilitate este n, i.e. rankR = n.Pentru testarea controlabilitatii exista un algoritm dedicat foarte eficient numit“controllability staircase”. Cu toate ca acest algoritm este numeric stabil atragematentia ca problema testarii controlabilitatii este o problema “ill–posed” (prost


conditionata numeric).

Gramian de Controlabilitate in Timp Infinit

Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limita

limt→∞

Lc(t)

este finita, se noteaza cu Lc ∈ Rn×n = LTc ≥ 0 si este numita gramian de

controlabilitate asimptotic. El verifica automat ecuatia Lyapunov

ALc + LcAT +BBT = 0

si are expresia explicita

Lc :=

∫ ∞

0

eAτBBTeAT τdτ.


Observatie: Ecuatia Lypunov verificata de gramianul asimptotic are solutie unica.Aceasta ecuatie are insa solutii (unice) in conditii mult mai generale decat atuncicand A este stabila.Propozitia 16. Daca A este asimptotic stabila si perechea (A,B) este controla-bila atunci Lc > 0.

Demonstratie. Rationam prin reducere la absurd. Stim ca Lc ≥ 0 si pp ca ∃x = 0a.i. Lcx = 0. Atunci din ecuatia gramianului rezulta succesiv ca BTKerLc = 0,KerLc este AT invariant, BTATKerLc = 0, . . . BT (AT )kKerLc = 0, ∀k ≥ 0.De aici rezulta ca pentru orice x = 0, x ∈ KerLc, avem xTR = 0 ceea cecontrazice ipoteza ca rankR = n si deci ipoteza ca (A,B) este controlabila.


Semnificatia Gramianului de Controlabilitate in Timp Infinit

Presupunem A stabila, perechea (A,B) controlabila si deci Lc > 0. Atunci avemΛ(Lc) = {σ1, σ2, . . . , σn}, σi > 0, unde indexarea s-a facut in ordine descrescatoare(i = 1, . . . , n). Fie xi vectori proprii ce formeaza o baza ortonormata (xi ⊥ xj,∥xi∥ = 1). Ne propunem sa calculam energia corespunzatoare comenzii ce duceoriginea in starea xi. Avem

xi =

∫ ∞

0

eA(t−τ)Bui(τ)dτ = Lczi

unde

ui(τ) = BTeAT τzi = BTeA

T τL−1c xi = BTeA

T τxi1

σi.

Energia comenzii este

∥ui(τ)∥22 =1

σ2i

∫ ∞

0

xTi e

AτBBTeAT τxidτ =

1

σ2i

xTi Lcxi =

1

σ2i

xTi σixi =

1

σi.


Din aceasta expresie concluzionam ca gramianul de controlabilitate asimptoticmasoara efortul energetic al sistemului pentru a transfera originea pe sfera unitate(cu cat Gramianul este mai mare – mai pozitiv – avem nevoie de o energie acomenzii mai mica). Valorile proprii ale gramianului pun in evidenta niveleleenergetice ale sistemului si dau o procedura efectiva de reducere dimensionala.

Subspatii controlabile

Se introduc

Rk :=[B AB . . . Ak−1B

], Rk := ImRk, k ≥ 1,

numite matricea de controlabilitate respectiv subspatiul controlabil in k pasi(semnificatia numelui va deveni clara la studiul sistemelor cu timp discret).Rk poseda urmatoarele proprietati:a) Rk+1 = ImB +ARk = Rk +AkImB, unde Ro := {0};b) Ro ⊂ R1 ⊂ . . .Rk ⊂ . . . adica subspatiile formeaza un lant crescator. In limbaj


matricial avem

rankRo ≤ rankR1 ≤ · · · ≤ Rk ≤ · · · .Din finitudinea dimensionala rezulta ca aceste incluziuni nu pot fi stricte decatpentru un numar finit de subspatii (maxim n) si exista un subspatiu Rν, pentru unν suficient de mare, care le va contine pe toate celelalte. Sa observam ca daca νeste cel mai mic indice pentru care Rν+1 = Rν atunci Rν+1 = Rν+2 = . . . = R.Acest indice ν se numeste indice de controlabilitate iar Rν = R := ImR adica Rν

este exact subspatiul controlabil (al perechii (A,B));c) R este A–invariant si contine ImB. Intr–adevar, avem ca R = ImB +AR;d) R este cel mai mic subspatiu A–invariant care contine ImB. Intr–adevar, fieV un spatiu A–invariant care contine ImB. Aratam prin inductie ca Rk ⊂ V deunde concluzia ca R ⊂ V. Deoarece ImB ⊂ V rezulta ca R1 ⊂ V. Presupunemca Rk ⊂ V si aratam ca Rk+1 ⊂ V. Intr–adevar, Rk+1 = ImB + ARk. DarImB ⊂ V si ARk ⊂ V (deoarece V este A–invariant si din ipoteza Rk ⊂ V) deunde concluzia. Cu alte cuvinte, subspatiul controlabil R este solutia infimala insubspatii a ecuatiei

T = ImB +AT


in necunoscuta T . Mai precis,

R = inf{T |T = AT + ImB} = inf{T |AT ⊂ T si ImB ⊂ T }.

Recapitulare: Subspatii invariante, spectru restrans la un subspatiu, operatii cusubspatii, suma directa, completari ortogonale etc.

Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant ? Avem AV ⊂ Viar daca V = ImV , unde V este o n× ρ matrice baza pentru V atunci automat

AV = V J

unde J este o matrice patrata ρ× ρ cu Λ(J) ⊂ Λ(A). Facand o completare panala o matrice nesingulara S =

[V W

]si notand T := S−1 obtinem

A := TAT−1 =

[A1 A3

O A2

].


Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant si contine ImB ?Repetand schimbarea de coordonate si aplicand-o corespunzator si lui B avem

A := TAT−1 =

[A1 A3

O A2

], B = TB =

[B1

O

]deoarece ImB ⊂ V. Cu aceasta schimbare de coordonate, matricea de controla-bilitate corespunzatoare a perechii (A, B) este

R =

[B1 A1B1 A2

1B1 · · · An−11 B1

O O O · · · O

]}ρ

.

Daca spatiul A–invariant (ce contine si ImB) in raport cu care s-a facut descom-punerea este chiar R, atunci perechea (A1, B1) este automat controlabila si avem

ca rankR = rank R = ρ = ν (indicele de controlabilitate).Teorema 17 (Teorema de Descompunere Controlabila). Un sistem dinamic oare-care descris de (A,B,C,D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este


intotdeauna echivalent pe stare cu un sistem (A, B, C,D) avand structura

A = TAT−1 =

[A1 A3

O A2

]}ν}n− ν︸︷︷︸︸︷︷︸

ν n− ν

, (25)

B = TB =

[B1

O

]}ν}n− ν

, C = CT−1 =[C1 C2

],︸︷︷︸︸︷︷︸

ν n− ν

(26)

in care perechea (A1, B1) este controlabila. Mai mult, sistemele (A,B,C,D),

(A, B, C,D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e.,

T (s) =

[A BC D

]=

[A B

C D

]=

[A1 B1

C1 D

].


Observatii: a) Teorema afirma in particular ca dandu-se un sistem dinamic putemintotdeauna gasi un alt sistem echivalent intrare–iesire care este controlabil (avanddimensiunea spatiului starilor mai mica sau egala cu cea a sistemului initial).b) Obtinerea descompunerii controlabile se bazeaza in mod esential pe matriceaS = T−1 care se poate obtine facand o completare pana la o inversabila a oricareibaze V a subspatiului controlabil R = ImR (consecinte procedurale).c) Proprietatea de controlabilitate este invarianta in raport cu relatia de echivalentape stare. Mai precis, un sistem este controlabil daca si numai daca orice sistemechivalent pe stare este controlabil.

Criteriul lui Popov–Belevitch–Hautus (PBH)

Folosind teorema de descompunere controlabila se poate obtine un criteriu extremde util pentru testarea controlabilitatii unei perechi (A,B).Teorema 18 (Criteriul lui Hautus). Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m, este


controlabila daca si numai daca

rank[sI −A B

]= n, ∀s ∈ C. (27)

Demonstratie. Necesitatea: Pp prin absurd ca (27) nu este satisfacuta. Atunciexista s0 ∈ C si un vector x0 = 0, x0 ∈ Cn a.i.

xT0

[s0I −A B

]= 0.

De aici rezulta imediat ca

xT0R = xT

0

[B AB . . . An−1B

]= 0

si deci perechea (A,B) nu este controlabila intrucat rankR < n.Suficienta: Pp din nou prin reducere la absurd ca (A,B) nu este controlabila


(ν < n). Atunci conform teoremei de descompunere controlabila exista un sistemechivalent pe stare avand perechea (A1, B1) controlabila. Avem succesiv

rank[sI −A B

]= rankT

[sIn −A B

] [ T−1 OO I

]= rank

[sIν −A1 −A3 B

O sIn−ν −A2 O

].

Rangul ultimei matrici este insa mai mic decat n pentru orice s ∈ Λ(A2) ceea cecontrazice (27).

Observatii: a) Pentru a decide controlabilitatea unei perechi (A,B) este suficientsa testam criteriul lui Hautus pentru s ∈ Λ(A). Intr–adevar, pentru s ∈ C−Λ(A)avem automat rank (sI −A) = n si deci criteriul este indeplinit.b) Observatia de mai sus justifica introducerea de valoare proprie (sau mod) con-trolabila/necontrolabila: O valoare proprie a lui A s.n. controlabila (necontrolabila)daca satisface (nu satisface) criteriul lui Hautus. Din teorema de descompunere


controlabila rezulta imediat ca o valoare proprie λ a lui A este controlabila (necon-trolabila) daca si numai daca λ ∈ Λ(A1) (λ ∈ Λ(A2)).c) Din demonstratia de mai sus rezulta ca daca doua sisteme (A,B,C,D) si

(A, B, C, D) sunt echivalente pe stare cu matricea de echivalenta T atunci matri-

cile de controlabilitate corespunzatoare R si R satisfac

R = TR.

“Controlabilitatea este o proprietate generica”Teorema 19. Fie Fn,m := {(A,B)|A ∈ Rn×n, B ∈ Rn×m} familia tuturorperechilor (A,B) cu n si m fixati. Submultimea M ⊂ F a perechilor necon-trolabile formeaza o suprafata algebrica iar submultimea perechilor controlabile

este densa in Rn2+nm. Cu alte cuvinte, controlabilitatea este o proprietategenerica in F (o pereche (A,B) selectata la intamplare din F este controlabilasau, echivalent, probabilitatea de a selecta o pereche necontrolabila este nula).

Nul Controlabilitate


Am vazut ca proprietatea de controlabilitate exprima esentialmente capacitatea dea aduce un sistem din origine intr-o stare arbitrara. Introducem acum conceptulde nul controlabilitate (cu consecinte interesante in special in cazul sistemelor cutimp discret).Definitia 20. O stare x ∈ Rn se numeste nul controlabila la momentul t fixatdaca exista o comanda u(·) care transfera starea x0 = x in starea x(t) = 0 (inorigine).

Exercitii: a) Aratati ca o stare este controlabila daca si numai daca este nulcontrolabila.b) Perechi cu matricea B monica. (Explicitare)


2. Observabilitatea

Observabilitatea este o proprietate calitativa a sistemului{x(t) = Ax(t) +Bu(t), x(0) = xo

y(t) = Cx(t) +Du(t),(28)

de a determina o stare din prelucrarea marimii masurate y. Pentru observabilitateeste relevanta evolutia sistemului in regim liber, i.e., sub comenzi externe nule,

x(t) = Ax, x(0) = xo,y = Cx,

(29)

deci observabilitatea este o proprietate in caracterizarea careia intervine numaiperechea de matrici (C,A) – observati ordinea in pereche – . Din (29) rezulta

y(τ) = CeAτxo, τ ≥ 0. (30)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 59 Observabilitatea

Stare/Sistem Observabil(a)

Pentru studiul observabilitatii este mai simplu sa introducem notiunea de stareneobservabila in loc de cea de stare observabila.Definitia 21. O stare x ∈ Rn se numeste neobservabila la momentul t > 0 dacapentru x(0) = x regimul liber al iesirii y este identic zero pe intervalul [0, t],i.e., y(τ) = 0, 0 ≤ τ ≤ t, cu y(τ) furnizat de (30).

Notiunea de stare observabila se obtine prin negarea definitiei de mai sus.

Gramian de Observabilitate

Pentrul studiul observabilitatii se introduce Gramianul de Observabilitate la mo-mentul t > 0 definit de

Lo(t) =

∫ t

0

eAT τCTCeAτdτ. (31)


Observatii: a) Lo(t) = Lo(t)T ;

b) Lo(t) ≥ 0;c) Se poate obtine din nou o descompunere ortogonala a lui Rn in raport cu KerLo

si ImLo.

Caracterizarea Observabilitatii prin Gramianul de Observabilitate

Teorema 22. Fie t > 0 fixat (se poate si t ≥ 0). Starea x este neobservabila lamomentul t > 0 daca si numai daca x ∈ KerLo(t). Mai mult, daca o stare esteneobservabila la un t > 0 atunci este neobservabila la orice alt moment de timpT > 0.

Demonstratie. Necesitatea: Presupunem ca x este neobservabila la momentult > 0 adica y(τ) = CeAτx = 0, 0 ≤ τ ≤ t. De aici rezulta

0 = yT (t)y(t) = ∥y(t)∥2 =∫ t

0

xTeAT τCTCeAτxdτ = xTLo(t)x, (32)

de unde rezulta ca Lo(t)x = 0 sau inca x ∈ KerLo(t), q.e.d.


Suficienta: Avem x ∈ KerLo(t) de unde rezulta xTLo(t)x = 0 si folosind lantulde egalitati din (32) obtinem ∥y(τ)∥2 = 0, 0 ≤ τ ≤ t. Sa observam in plus cadeoarece y(τ) este analitica si nula pe un interval inchis nenul rezulta ca y(T ) = 0pentru orice T > 0, q.e.d.

Din cele discutate mai sus am vazut ca (ne)observabilitatea unei stari nu depindede momentul de timp. In continuare vom obtine o caracterizare a subspatiuluistarilor neobservabile pe baza matricii de observabilitate – notiune duala celei dematrice de controlabilitate.

Caracterizarea Observabilitatii prin Matricea de Observabilitate


Introducem matricea de observabilitate asociata unui sistem dinamic :

Q :=

CCACA2

...CAn−1

(33)

(sau mai precis unei perechi matriciale (C,A), C ∈ Rp×n, A ∈ Rn×n). Matriceade observabilitate are dimensiune (np)× n.Teorema 23. Fie t > 0 fixat. Atunci x ∈ KerLo(t) ⇔ x ∈ KerQ =: Q, i.e.,

KerLo(t) = Q. (34)

Demonstratie. Exercitiu (demonstratie similara celei date pentru Teorema 13).


Observatii: a) Avem deci ca

KerLo(t) = KerQ, ∀t > 0.

b) O stare x ∈ Rn este observabila/neobservabila independent de momentul t > 0– cu anumite precautii se poate lua t ≥ 0. Proprietatea este intrinseca starii x siperechii (C,A).c) Se poate introduce definitia echivalenta: o stare x s.n. neobservabila dacaexista t > 0 pentru care x este neobservabila la acest moment.

Introducem notiunea de sistem observabil (sau pereche (C,A) observabila) cusemnificatia ca fiecare stare x ∈ Rn, x = 0 este observabila. Avem atunciurmatorul rezultat central.Teorema 24. Fie perechea (C,A).1. O stare x este neobservabila daca si numai daca x ∈ Q.2. Perechea (C,A) (sau sistemul corespunzator) este observabila (observabil)daca si numai daca singura stare neobervabila este 0, i.e. Q = {0} (sau, echiva-lent, rankQ = n).


Gramian de Observabilitate in Timp Infinit

Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limt→∞Lo(t)este finita, se noteaza cu Lo ∈ Rn×n = LT

o ≥ 0 si este numita Gramian deObservabilitate asimptotic. El verifica automat ecuatia Lyapunov

ATLo + LoAT + CTC = 0

si are expresia

Lo :=

∫ ∞

0

eAT τCTCeAτdτ.

Observatii: a) Similar ca in cazul controlabilitatii, observabilitatea unui sistem sepoate testa dpdv procedural verificand ca rankQ = n (matricea Q este monica –rang intreg pe coloane).b) Daca perechea (C,A) este observabila atunci automat Lo(t) > 0 si Lo > 0.Gramianul de observabilitate asimptotic se poate calcula ca solutia unica a ecuatieiLyapunov respective.


c) Daca x ∈ Rn arbitrara, atunci putem descompune unic x = xI + xK, undexI ∈ ImLo(t) si xK ∈ KerLo(t) (deoarece Rn := ImLo(t)⊕KerLo(t)). Atunci

y(t) = CeAtx = CeAtxI + CeAtxK = CeAtxI.

Deci cu exceptia sistemelor din KerLo(t), toate celelalte “se vad” la iesire.

Subspatii neobservabile

Se introduc

Qk :=

CCA...CAk−1

, Nk := KerQk, k ≥ 1,

numite matricea de observabilitate respectiv subspatiul neobservabil in k pasi.Nk poseda urmatoarele proprietati:


a) Nk = ∩ki=1KerCAi−1 = ∩k

i=1A−i+1KerC (A−1 semnifica aici preimaginea si

nu inversa !);b) Nk+1 = KerC ∩A−1Nk;c) . . . ⊂ N2 ⊂ N1 ⊂ N0 := Rn adica subspatiile neobservabile Nk formeaza unlant descrescator. De aici rezulta ca exista un intreg µ, n ≥ µ ≥ 0, a.i.

. . .Nµ+2 = Nµ+1 = Nµ = Nµ−1 = . . . = N1 = N0

sau pe scurt

limk→∞

Nk = Nµ = Nn.

Intregul µ se numeste indice de observabilitate iar Nµ = Nn se numeste subspatiulneobservabil a perechii (C,A). Avem ca

N = KerQ.


In limbaj matricial obtinem

0 < rankQ1 < rankQ2 < rankQµ = rankQµ+1 = . . . .

d) Din cele de mai sus obtinem ca

N = KerC ∩A−1N

sau incaAN ⊂ N , N ⊂ KerC

adica N este un subspatiu A–invariant continut in KerC. Mai mult, se poatearata (exercitiu) ca N este cel mai mare subspatiu A–invariant continut in KerC.Deasemenea, considerand ecuatia

T = KerC ∩A−1T

in necunoscuta T rezulta ca N este solutia sa supremala.


Principiul Dualitatii

Principiul dualitatii este un principiu fundamental in teoria sistemelor dinamice,aratand in ce conditii anumite proprietati structurale sunt echivalente.Teorema 25 (Principiul dualitatii). Subspatiul controlabil in k pasi al perechii(A,B) este complementul ortogonal al subspatiului neobervabil in k pasi alperechii (BT , AT ), i.e.

Rk(A,B) = Nk(BT , AT )⊥.

In particular, perechea (A,B) este controlabila daca si numai daca perechea(BT , AT ) este observabila.

Pe baza principiului dualitatii se pot formula dualele tuturor rezultatelor obtinutein cazul controlabilitatii.Teorema 26 (Criteriul PBH). Perechea (C,A), C ∈ Rp×n, A ∈ Rn×n, este


observabila daca si numai daca

rank

[sI −A

C

]= n, ∀s ∈ C. (35)

Prin dualitate se introduc notiunile de valoare proprie (sau mod) observ-abil/neobservabil. Dam in continuare teorema de descompunere observabila indoua forme complet echivalente.Teorema 27 (Teorema de Descompunere Observabila). Un sistem dinamic oare-care descris de (A,B,C,D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este

intotdeauna echivalent pe stare cu un sistem (A, B, C,D) avand structura

A = TAT−1 =

[A1 A3

O A2

]}n− µ}µ︸︷︷︸︸︷︷︸

n− µ µ

,


B = TB =

[B1

B2

]}n− µ}µ , C = CT−1 =

[O C2

],︸︷︷︸︸︷︷︸

n− µ µ

in care perechea (C2, A2) este observabila. Mai mult, sistemele (A,B,C,D),


T (s) =

[A BC D

]=

[A B

C D

]=

[A2 B2

C2 D

].

Teorema 28 (Teorema de Descompunere Observabila – varianta). Un sistemdinamic oarecare descris de (A,B,C,D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n,

D ∈ Rp×m este intotdeauna echivalent pe stare cu un sistem (A, B, C,D) avandstructura

A = TAT−1 =

[A1 OA3 A2

]}µ}n− µ︸︷︷︸︸︷︷︸

µ n− µ

,


B = TB =

[B1

B2

]}µ}n− µ

, C = CT−1 =[C1 O

],︸︷︷︸︸︷︷︸

µ n− µ

in care perechea (C1, A1) este observabila. Mai mult, sistemele (A,B,C,D),


T (s) =

[A BC D

]=

[A B

C D

]=

[A1 B1

C1 D

].


3. Teorema de Descompunere Structurala

Avem intai nevoie de reamintirea catorva rezultate de algebra matriciala:• Ecuatie Sylvester;• Subspatiu A–invariant si consecinte.

Consideram un sistem definit de (A,B,C,D). Fie R subspatiul controlabil alperechii (A,B) si N subspatiul neobservabil al perechii (C,A).

FieX1 := R∩N (36)

si introducem subspatiile X2 si X3 ca fiind complementii lui X1 in R si respectivN , i.e.,

R = X1 ⊕X2, (37)

N = X1 ⊕X3. (38)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 73 Teorema de descompunere structurala

Fie deasemenea X4 complementul lui R∪N in Rn, i.e.,

Rn = (R∪N )⊕X4 = X1 ⊕X2 ⊕X3 ⊕X4 (39)

Subspatiile X2, X3 si X4 nu sunt unic definite. Deoarece

AR ⊂ R, ImB ⊂ R (40)

AN ⊂ N , N ⊂ KerC (41)

rezulta ca

AX1 ⊂ X1, X1 ⊂ KerC. (42)

Fie Xi matrici baza pentru subspatiile Xi (i=1...4), Xi =< Xi > si

T :=[X1 X2 X3 X4

]−1. (43)


Atunci sistemul echivalent pe stare fata de transformarea (42) are forma

A = TAT−1 =

A11 A12 A13 A14

O A22 O A24

O O A33 A34

O O O A44

, B = TB =

B1

B2

OO

C = CT−1 =

[O C2 O C4

],

(44)

structura ce rezulta din (36)-(43). Din teorema de descompunere controlabilarezulta ca perechea ([

A11 A12

O A22

],

[B1

B2

])(45)

este controlabila iar din teorema de descompunere observabila rezulta ca perechea

([C2 C4

],

[A22 A24

O A44

])(46)


este observabila. Aplicand criteriul PBH pentru perechea (45) rezulta

rank

[sI −A11 −A12 B1

O sI −A22 B2

]= dimX1 + dimX2, ∀s ∈ C

de unde rezulta automat ca

rank[sI −A2 B2

]= dimX2, ∀s ∈ C

deci perechea (A22, B2) este controlabila. Aplicand criteriul PBH dual perechii(46) rezulta similar ca perechea (C2, A22) este observabila. In consecinta rezultaca (sub)sistemul (A22, B2, C2, D) este controlabil si observabil (se mai numestepartea controlabila si observabila a sistemului initial) si inca

T (s) =

[A BC D

]=

[A B

C D

]=

[A22 B2

C2 D

].


Sintetizand cele de mai sus obtinem urmatorul rezultat remarcabil.Teorema 29 (Teorema de descompunere structurala). Orice sistem arbitrar

(A,B,C,D) este echivalent pe stare cu un sistem (A, B, C,D) cu structura (44)(unde unele blocuri pot avea dimensiune nula !) si echivalent intrare–iesire cusistemul controlabil si observabil (A22, B2, C2, D).


4. Realizabilitate

Am vazut ca orice sistem dinamic descris de ecuatii de tipul{x(t) = Ax(t) +Bu(t), x(to) = xo

y(t) = Cx(t) +Du(t)(47)

este automat invariant in timp, liniar, cauzal, finit dimensional. In particular,sistemul dinamic este un sistem de convolutie avand matrice de transfer data de

T (s) = C(sI −A)−1B +D.

Matricea de transfer descrie comportarea intrare–iesire in conditii initiale nule sieste o matrice avand drept elemente functii rationale proprii.

Problema naturala: Stiind ca matricea de transfer a unui sistem MIMO esterationala si proprie exista o descriere dinamica a sistemului de tipul (47) ? Mai

CAPITOLUL 3: PROPRIETATI STRUCTURALE 78 Realizabilitate

precis, stiind ca T (s) este o matrice rationala proprie de dimensiune p×m existaintotdeauna patru matrici (A,B,C,D), unde A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n,D ∈ Rp×m a.i. sistemul dinamic corespunzator (47) sa aibe matricea de transferT (s), i.e.,

T (s) = C(sI −A)−1B +D?

Atunci cand exista, cele patru matrici (A,B,C,D) se numesc o realizare arationalei T (s) (sau a sistemului avand ca matrice de transfer pe T (s)).

INTREBARI NATURALE:

• Exista intotdeauna o realizare si daca da cum se poate obtine ? DA!• Este realizarea unica ? NU !• Exista o realizare de dimensiune minima (maxima) ? DA (NU) !• Cum se pot caracteriza realizarile minimale ? Controlabile + observabile!• Cum se pot obtine realizarile minimale ? Teorema de Descompunere Structurala!• Sunt realizarile minimale unice ? NU !• Ce relatie exista intre doua realizari minimale ? Sunt echivalente pe stare !


Problema existentei

Fie T (s) o p×m matrice rationala proprie data de

T (s) =

[rij(s)

pij(s)

]1 ≤ i ≤ p1 ≤ j ≤ m

, grad(pij) ≥ grad(rij), ∀i, j,

in care rapoartele se considera ireductibile. Deoarece rationala este proprie avemca D := T (∞) ∈ Rp×m (finit). Problema realizabilitatii rationalei proprii T (s) se

reduce atunci la problema realizabilitatii rationalei strict proprii T (s) = T (s)−D,i.e., trebuie sa gasim trei matrici (A,B,C) a.i.

T (s) = C(sI −A)−1B.


Deoarece T (s) este strict proprie avem

T (s) =K0 +K1s+ . . .+Kk−1s

k−1

γ0 + γ1s+ . . .+ γk−1sk−1 + sk(48)

unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun

(monic) al numitorilor tuturor elementelor rationalei T (s) iar Ki, i = 0, . . . , k− 1,sunt p×m matrici constante.

O realizare a lui T (s) este data de

A =

Om Im

. . .Im

−γ0Im −γ1Im . . . −γk−1Im

, B =

Om...

Om

Im

, C =[K0 K1 . . . Kk−1

].

(49)


Intr–adevar, cu

Θ(s) :=

ImsIm...sk−1Im

se verifica direct ca

(sI −A)Θ(s) = Bγ(s)

sau incaΘ(s)

γ(s)= (sI −A)−1B. (50)

Cum

CΘ(s) = K0 +K1s+ . . .+Kk−1sk−1

inmultind (50) la stanga cu C si tinand cont de (48) obtinem T (s) = C(sI −A)−1B. Realizarea (A,B,C,D) astfel obtinuta este controlabila si de aceea semai numeste realizarea standard controlabila a lui T (s). Controlabilitatea perechii(A,B) se poate testa imediat cu criteriul PBH. In general, realizarea obtinuta nu


este insa observabila (poate fi!). O realizare standard observabila este data de

A =

Om −γ0IpIp −γ1Ip

. . . ...Ip −γk−1Ip

, B =

K0

K1...

Kk−1

, C =[Op Op . . . Ip

].

(51)Aceasta realizare nu este in general controlabila.

Observatie: Pentru matrici de transfer rationale de dimensiuni arbitrare nu existain general posibilitatea sa scriem direct o realizare care sa fie simultan controlabilasi observabila.

Coeficienti Markov si Matrici Hankel

Studiem acum relatiile care exista intre doua realizari ale unei matrici rationaleproprii. In primul rand este clar ca cele doua matrici ”D” sunt egale. DezvoltandT (s) in serie Laurent in jurul punctului s = ∞ obtinem pentru ∥s∥ > r, unde r


este ales suficient de mare,

T (s) = Γ1s−1 + Γ2s

−2 + . . . . (52)

Identificand coeficientii din (52) cu ajutorul lui (48) obtinem

Kk−1 = Γ1

Kk−2 = Γ2 + γk−1Γ1

. . . . . . . . .K0 = Γk + γk−1Γk−1 + . . .+ γ1Γ1

0 = Γk+i + γk−1Γk−1+i + . . .+ γ0Γi, i ≥ 1.

Coeficientii matriceali Γi ∈ Rp×m, i ≥ 1, s.n. coeficientii Markov ai matriceirationale T (s).

Daca (A,B,C,D) este o realizare a lui T (s) atunci avem

C(sI −A)−1B +D = D + CBs−1 + CABs−2 + CA2Bs−3 + . . . , (53)


pentru ∥s∥ > rA, unde rA este raza spectrala a matricei A.

Coeficientii D si CAi−1B, i ≥ 1, se numesc coeficientii Markov ai sistemului(realizarii) (A,B,C,D). Identificand coeficientii in (52) si (53) obtinem

Γo := D, Γi = CAi−1B, ∀i ≥ 1. (54)

Deci toate realizarile lui T (s) au aceeasi coeficienti Markov, identici cu cei ai luiT (s). Introducem matricile de tip Hankel

Hij =

Γ1 Γ2 . . . Γj

Γ2 Γ3 . . . Γj+1...Γi Γi+1 . . . Γj+i−1

=

CB CAB . . . CAj−1BCAB CA2B . . . CAjB

...CAi−1B CAiB . . . CAj+i−2B

(55)


=

CCA...

CAi−1B

[B AB . . . Ai−1B

]= QiRj i ≥ 1, j ≥ 1, (56)

unde Rj este matricea de controlabilitate in j pasi si Qi este matricea deobservabilitate in i pasi. Din aceasta relatie rezulta ca pentru orice doua realizari(A,B,C,D) si (A, B, C,D) ale aceluiasi T (s) avem

QiRj = QiRj, ∀i ≥ 1, j ≥ 1. (57)

Observatie: Matricile Hankel cu toate ca au dimensiuni arbitrar de mari au totusirangul marginit de n. Acest lucru rezulta din ultima egalitate din (56).

Realizari minimale

Definitia 30.O realizare (A,B,C,D) a rationalei proprii T (s) se numeste min-imala daca orice alta realizare are dimensiunea spatiului starilor mai mare sauegala cu aceasta.


Teorema 31. O realizare este minimala daca si numai daca este controlabila siobservabila.

Demonstratie. Conditia este necesara. P.p. prin reducere la absurd ca realizareaminimala (A,B,C,D) de dimensiune n nu este controlabila si/sau observabila.Atunci printr–o transformare de echivalenta aducem sistemul la forma din teo-rema de descompunere structurala si rezulta ca realizarea (A22, B2, C2, D) aredimensiune strict mai mica ceea ce contrazice ipoteza de minimalitate a realizariioriginale.

Conditia este suficienta. Presupunem ca realizarea (A,B,C,D) de dimensiune neste controlabila si observabila. Atunci

rankRn = rankQn = n

rezultand in continuare ca

rankQnRn = rankRn − dim(ImRn ∩KerQn) = n. (58)


P.p. prin absurd ca (A,B,C,D) nu este minimala. Atunci exista o realizare

(A, B, C,D) de dimensiune n cu

n < n.

Din (57) rezulta ca

rank QnRn = rankQnRn

ceea ce este absurd intrucat rank Qn ≤ n si rank Rn ≤ n.

Teorema 32. Oricare doua realizari minimale ale unei matrici de transfer pro-prii T (s) sunt echivalente pe stare.

Demonstratie. Fie (A,B,C,D) si (A, B, C,D) doua realizari minimale ale luiT (s). Conform teoremei precedente, ambele realizari au aceeasi dimensiune n sisunt controlabile si observabile. Din (56) avem

QnRn+1 = QnRn+1 (59)


sau inca Qn

[B ARn

]= Qn

[B ARn

]de unde rezulta

QnB = QnB, QnARn = QnARn. (60)

Deoarece Qn este monica atunci QTnQn este nesingulara si din prima relatie din

(60) rezulta

B = TB (61)

unde

T := (QTnQn)

−1QTnQn ∈ Rn×n.

Similar, deoarece Rn este epica rezulta ca RnRTn este nesingulara si din a doua

egalitate din (60) rezulta ca

A = TAS (62)

unde

S = RnRTn (RnR

Tn )

−1 ∈ Rn×n.


Din (59) rezulta ca CCA...

[Rn AnB

]=

C

CA...

[Rn AnB

]

de unde CRn = CRn sau incaC = CS. (63)

Din (61), (62) si (63) rezulta ca cele doua realizari sunt echivalente pe stare dacaaratam ca S = T−1. Intr–adevar,

TS = (QTnQn)

−1QTnQnRnR

Tn (RnR

Tn )

−1 = (QTnQn)

−1QTnQnRnR

Tn (RnR

Tn )

−1 = I.

Teorema 33. Fie µ si ν cei mai mici intregi pentru care rankHµ,ν =rankHµ+i,ν+j. Atunci ν = µ = n, unde n este dimensiunea realizarii mini-male.


Demonstratie. Rezulta automat din (56).

Observatie: Pentru orice sistem descris de matrice de transfer rationala proprieT (s) putem calcula coeficientii Markov (unici) Γi pe baza descompunerii (52).Mai mult, daca stim o realizare (A,B,C,D) a sistemului dinamic cu matricea detransfer T (s), atunci coeficientii Markov se pot calcula pe baza expresiilor explicite(54). Mai mult, coeficientii Markov determina unic sirul dublu indexat de matriciHankel Hij care au rang finit egal cu n, pentru i, j ≥ n, unde n este dimensiuneaunei realizari minimale.

Problema inversa (fundamentala): Presupunand acum ca avem un sir de coeficientiMarkov Γi ∈ Rp×m, i ≥ 0, se pune problema fireasca daca exista intotdeauna unsistem dinamic care are acesti coeficienti Markov ? Mai exact, seria din membruldrept din (52) converge intotdeauna la o rationala proprie ce este matricea detransfer a unui sistem (A,B,C,D) ? Sau, echivalent, exista intotdeauna matricile(A,B,C,D) de dimensiuni potrivite a.i. sa aibe loc relatiile (54) ?

Raspuns: NU (in general)! Rezultatul urmator da un raspuns complet acestei


probleme.Teorema 34. Fie un sir de matrici reale Γi ∈ Rp×m, i ≥ 0, pentru care existaj ≥ 1 a.i. Γj = 0. Atunci exista o p×m matrice rationala proprie T (s) ai careicoeficienti Markov sunt exact elementele sirului Γi daca si numai daca existaun intreg n ≥ 1 a.i.

n = rankHn+i,n+j, ∀i, j ≥ 0. (64)

In cazul in care (64) are loc, intregul n ≥ 1 se numeste gradul McMillan alrationalei T (s).

Observatie (fundamentala): Gradul McMillan al unei rationale proprii T (s)coincide cu dimensiunea unei realizari minimale.Corolarul 35. Functia f : N → Rp×m cu f(i) = Γi, i ≥ 0, este z–transformabila(are transformata z) si transformata z este o matrice rationala proprie daca sinumai daca este indeplinita conditia (64).


Procedura de obtinere a unei realizari minimale pentru omatrice rationala proprie

T (s) =

[rij(s)

pij(s)

]1 ≤ i ≤ p1 ≤ j ≤ m

, grad(pij) ≥ grad(rij), ∀i, j.

Pasul 0: Se pune D := T (∞) si se aduce matricea rationala (strict proprie)

T (s) := T (s)−D la forma

T (s) =K0 +K1s+ . . .+Kk−1s

k−1

γ0 + γ1s+ . . .+ γk−1sk−1 + sk(65)

unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun

(monic) al numitorilor tuturor elementelor rationalei T (s) iar Ki, i = 0, . . . , k− 1,sunt p×m matrici constante.


Pasul 1: Se scrie realizarea standard controlabila

A =

Om Im

. . .Im

−γ0Im −γ1Im . . . −γk−1Im

, B =

Om...

Om

Im

, C =[K0 K1 . . . Kk−1

],

(66)in care perechea (A,B) este automat controlabila.Pasul 2: Se aplica teorema de descompunere observabila perechii (C,A) si seobtine

A = TAT−1 =

[A1 A3

O A2

]}n− µ}µ︸︷︷︸︸︷︷︸

n− µ µ

,

B = TB =

[B1

B2

]}n− µ}µ , C = CT−1 =

[O C2

],︸︷︷︸︸︷︷︸

n− µ µ

in care perechea (C2, A2) este observabila.


Pasul 3: Deoarece perechea (A,B) este controlabila, rezulta automat ca

perechile (A, B) si (A2, B2) sunt deasemenea controlabile. Prin urmare sistemul(A2, B2, C2, D) care este echivalent intrare–iesire cu sistemul original (A,B,C,D)este controlabil, observabil si deci minimal. Prin urmare (A2, B2, C2, D) este orealizare minimala pentru T (s) si

T (s) = C2(sI −A2)−1B2 +D.

Observatii: a) Din punct de vedere procedural, algoritmul de calcul al realizariiminimale urmeaza exact pasii de mai sus cu observatia ca transformarea T de lapasul 2 se alege intotdeauna ortogonala T−1 = TT .b) Pentru obtinerea unei realizari minimale se poate proceda dual, calculand laPasul 1 o realizare standard observabila (51) si facand la Pasul 2 o descompunerecontrolabila (25)–(26).


5. Conexiunile Sistemelor Dinamice pe Stare si Operatii cuSisteme

Consideram cateva posibile conexiuni standard ale sistemelor dinamice descrise prinintermediul realizarilor de stare si ne punem problema sa gasim o realizare de starepentru sistemul echivalent rezultant. In particular, vom considera urmatoareletipuri de conexiuni: serie, paralel, bucla cu reactie inversa, transformare liniarfractionara si produs Redheffer.

Intocmai ca in cazul sistemelor cu o intrare si o iesire (SISO) anumite conexiunipot sa nu fie definite (in sens general sau in sens strict) – cu semnificatia casistemul rezultant nu are matrice de transfer (vectorul marimilor de iesire nu esteunic definit pentru un vector dat de marimi de intrare) sau matricea de transferrezultanta nu este proprie (sistemul rezultant nu are o realizare standard de stare).Prin urmare vom spune ca o anumita conexiune a doua sisteme pe stare estebine definita daca sistemul rezultant este deasemenea un sistem pe spatiul starilor.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 96 Conexiuni si operatii

Buna definire a conexiunii implica deci ca sistemul rezultant are o matrice detransfer rationala care este proprie.

Ca un exemplu relevant pentru discutia de mai sus sa consideram inversul unuisistem (A,B,C,D) – sistemul care are intrarile si iesirile inversate. Inversul existadaca si numai daca matricea D este inversabila iar o realizare a inversului este data

xI(t) = (A−BD−1C)xI(t) + BD−1uI(t),yI(t) = −D−1CxI(t) + D−1uI(t),

(67)

(uI(t) = y(t), yI(t) = u(t)) iar matricea de transfer este

T−1(s) =

[AI BI

CI DI

]=

[A−BD−1C BD−1

−D−1C D−1

]. (68)

Observatii: • Un sistem este inversabil daca si numai daca are acelasi numar deintrari si iesiri (p = m).• Ipoteza de inversabilitatea a lui D nu este necesara pentru existenta inversei


matricii de transfer T (vazuta ca matrice rationala) si este facuta doar pentru aasigura ca T−1(s) este proprie si deci este matricea de transfer a unui sistem pespatiul starilor (AI, BI, CI, DI).• Daca sistemul original este controlabil/observabil/minimal atunci realizareainversului (68) este automat controlabila/observabila/minimala. – Exercitiu!

Conexiunea paralel

Fie doua sistemex1(t) = A1x1(t) +B1u1(t),y1(t) = C1x1(t) +D1u1(t),

(69)

six2(t) = A2x2(t) +B2u2(t),y2(t) = C2x2(t) +D2u2(t),

(70)

avand matricile de transfer

T1 =

[A1 B1

C1 D1

], T2 =

[A2 B2

C2 D2

], (71)


respectiv. Daca cele doua sisteme au acelasi numar de intrari si iesiri (m1 = m2,p1 = p2), atunci se defineste conexiunea paralel a lui T1 cu T2 ca fiind sistemul careare intrarea u obtinuta punand u1 ≡ u2 = u si iesirea y := y1 + y2. Conexiuneaparalel este intotdeauna bine definita, matricea de transfer a sistemului rezultanteste

T (s) := T1(s) + T2(s), (72)

avand o realizare data de

T (s) =

A1 O B1

O A2 B2

C1 C2 D1 +D2

. (73)

Conexiunea serie

Fie doua sisteme (69) si (70), avand matricile de transfer date in (71). Dacanumarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului


T2 atunci se defineste conexiunea serie a lui T1 cu T2 (in aceasta ordine) cafiind sistemul cu intrarea u := u1 si iesirea y := y2, obtinut punand u2 ≡ y1.Conexiunea serie este intotdeauna bine definita, matricea de transfer a sistemuluirezultant este

T (s) := T2(s)T1(s), (74)

(observati ordinea !) iar o realizare pentru sistemul rezultant este data de

T (s) =

A2 B2C1 B2D1

O A1 B1

C2 D2C1 D2D1

. (75)

Conexiunea in reactie inversa

Fie doua sisteme (69) si (70), avand matricile de transfer date in (71). Dacanumarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului T2

si numarul de iesiri ale sistemului T2 este egal cu numarul de intrari ale sistemului


T1 (p1 = m2, p2 = m1) atunci se defineste conexiunea in reactie inversa a lui T1

cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u si iesirea y := y1, obtinutpunand u1 ≡ u + y2 si u2 ≡ y1. Conexiunea in reactie inversa este intotdeaunabine definita daca si numai daca matricea[

I D1

D2 I

](76)

este nesingulara. In acest caz functia de transfer a sistemului echivalent este

T (s) := T1(s)(I − T2(s)T1(s))−1, (77)

iar o realizare pentru sistemul rezultant este

T (s) =

A1 +B1D2S

−1C1 B1S−1C2 B1S

−1

B2S−1C1 A2 +B2D1S

−1C2 B2D1S−1

S−1C1 S−1D1C2 D1S−1

, (78)


unde S := I −D1D2 si S := I −D2D1 care sunt ambele inversabile din ipotezade nesingularitate a matricii (76).Exercitiu: Ce se poate spune despre controlabilitatea/observabilitatea/minimalitateasistemului echivalent paralel/serie/reactie inversa daca stim ca sistemele compo-nente sunt controlabile/observabile/minimale ?

Observatie: Pentru conexiunile paralel/serie/reactie inversa nu este necesar caspatiul starilor sistemelor componente sa fie de dimensiune egala.

Transformare liniar fractionara (TLF)

Aceste conexiuni pot fi privite ca o extensie la clasa sistemelor (sau mai precis laclasa functiilor matriceale rationale) a transformari liniar fractionare (sau Moebius)din cazul scalar

f(λ) =a+ bλ

c+ dλ,

unde a, b, c, d sunt scalari.


Fie doua sisteme date de

x = Ax+B1u1 +B2u2,y1 = C1x+D11u1 +D12u2,y2 = C2x+D21u1 +D22u2,

(79)

sixc = Acxc +Bcuc,yc = Ccxc +Dcuc,

(80)

avand matricile de transfer

T (s) =

[T11(s) T12(s)T21(s) T22(s)

]=

A B1 B2

C1 D11 D12

C2 D21 D22

(81)

si

Tc(s) =

[Ac Bc

Cc Dc

]. (82)


Un sistem de tipul (81) se numeste sistem generalizat si are intrarile si iesirilepartitionate in doua clase avand anumite semnificatii in controlul automat. DacaT22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p2,pc = m2) atunci de defineste transformarea liniar fractionara inferioara (TLFI) alui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesireay := y1 obtinut punand u2 ≡ yc si uc ≡ y2. Conexiunea este bine definita daca sinumai daca matricea

[I D22

Dc I

](83)

este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalenteste

TR = TLFI(T, Tc) := T11 + T12Tc(I − T22Tc)−1T21, (84)


si are o realizare data de

TR(s) =

A+B2S

−1DcC2 B2S−1Cc B1 +B2S

−1DcD21

BcS−1C2 Ac +BcS

−1D22Cc BcS−1D21

C1 +D12DcS−1C2 D12S

−1Cc D11 +D12DcS−1D21

,

(85)

unde S := I −D22Dc si S := I −DKD22 care sunt ambele inversabile din ipotezade inversabilitate asupra matricii (83). In particular avem DcS

−1 = S−1Dc si

S−1D22 = D22S−1 asa cum rezulta din identitatea matriciala U(I − V U)−1 =

(I−UV )−1U care are loc pentru oricare matrici U si V de dimensiuni compatibile.

Consideram din nou doua sisteme (79) si (80) avand matricile de transfer (81)si (82). Daca T11 are numarul de intrari/iesiri egal cu numarul de iesiri/intrariale lui Tc (mc = p1, pc = m1) atunci se defineste transformarea liniar fractionarasuperioara (TLFS) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrareau := u2 si iesirea y := y2 obtinut punand u1 ≡ yc si uc ≡ y1. Conexiunea este


bine definita daca si numai daca matricea[I D11

Dc I

](86)

este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalenteste

TR = TLFS(T, Tc) := T22 + T21Tc(I − T11Tc)−1T12, (87)

si are o realizare data de

TR =

A+B1U

−1DcC1 B1U−1Cc B2 +B1U

−1DcD12

BcU−1C1 Ac +BcU

−1D11Cc BcU−1D12

C2 +D21DcU−1C1 D21U

−1Cc D22 +D21DcU−1D12

,

(88)

unde am notat U := I −D11Dc si U := I −DcD11 care sunt ambele inversabileintrucat matricea (86) este inversabila. Avem deasemenea ca DcU

−1 = U−1Dc si

U−1D11 = D11U−1.


Produs Redheffer

Aceasta conexiune este o extensie a transformarii liniar fractionare. Consideramdoua sisteme generalizate (79) si

xc = Acxc +Bc1uc1 +Bc2uc2,yc1 = Cc1xc +Dc11uc1 +Dc12uc2,yc2 = Cc2xc +Dc21uc1 +Dc22uc2,

(89)

avand matricile de transfer date de (81) si respectiv

Tc =

[Tc11 Tc12

Tc21 Tc22

]=

Ac Bc1 Bc2

Cc1 Dc11 Dc12

Cc2 Dc21 Dc22

. (90)

Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc11

(mc1 = p2, pc1 = m2) atunci se defineste produsul Redheffer al lui T cu Tc (in


aceasta ordine) ca fiind sistemul cu intrarea u :=

[u1

uc2

]si iesirea y :=

[y1yc2

]obtinut punand u2 ≡ yc1 si uc1 ≡ y2. Conexiunea este bine definita daca si numai

daca

[I D22

Dc11 I

]este inversabila. In acest caz obtinem sistemul generalizat

TR =

T ⊗ Tc :=

[T11 + T12Tc11(I − Tc22Tc11)

−1T21 T12(I − Tc11T22)−1Tc12

Tc21(I − T22Tc11)−1T21 Tc22 + Tc21T22(I − Tc11T22)

−1Tc12

],

(91)


avand o realizare data de

TR =

A+B2S

−1Dc11C2 B2S−1Cc1 B1 +B2S

−1Dc11D21

Bc1S−1C2 Ac +Bc1S

−1D22Cc1 Bc1S−1D21

C1 +D12Dc11S−1C2 D12S

−1Cc1 D11 +D12Dc11S−1D21

Dc21S−1C2 Cc2 +Dc21S

−1D22Cc1 Dc21S−1D21

B2S−1Dc12

Bc2 +Bc1S−1D22Dc12

D12S−1Dc12

Dc22 +Dc21S−1D22Dc12

(92)

unde s–a notat S := I−D22Dc11 si S := I−Dc11D22 care sunt ambele inversabile.

Observatie: Daca in (81) avem T22(∞) = D22 = 0 atunci TLF si produsulRedheffer ale lui T cu Tc sunt automat bine definite.


6. Elemente Structurale ale Matricilor Rationale

Anumite elemente structurale ale matricilor rationale joaca un rol aparte in teoriacontrolului sistemelor dinamice pe spatiul starilor: poli, zerouri, forma SmithMcMillan, directiile de poli/zerouri, indicii singulari stanga si dreapta.

Conceptele de pol si zerou sunt considerabil mai dificile decat in cazul scalar inprincipal datorita posibilitatii ca o matrice rationala sa aibe pol si zerou in acelasipunct so ∈ C, cat si datorita posibilitatii existentei polilor si zerourilor la infinit(un concept relativ greu de explicitat in cazul multivariabil).

In cazul sistemic avem doua notiuni de poli: poli ai matricii de transfer (vazutaca matrice rationala) si poli ai sistemului pe spatiul starilor definiti ca fiind valorileproprii ale matricii A. Mai precis, so ∈ C este pol al matricii de transfer rationaleT (s) daca este pol cel putin al unui element al sau considerat ca rationalaireductibila. Polii matricii de transfer coincid cu polii sistemului daca si numaidaca realizarea corespunzatoare este minimala.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 110 Elemente Structurale ale Rationalelor

In cazul sistemic exista si doua notiuni de zerouri: zerouri de transmisie si zerouriinvariante. Notiunea de zerou de transmisie se introduce pe baza matricii detransfer rationale iar cea de zerou invariant pe baza unei matrici polinomialeconstruite pe baza unei realizari de stare (A,B,C,D).

Pentru a intelege intuitiv notiunea de zerou sa presupunem ca so ∈ C nu este polal rationalei. Atunci s0 se numeste zerou al rationalei T (s) daca si numai

rankT (so) < rank nT (s)

unde prin rank nT (s) intelegem rangul normal al rationalei, i.e., rangul pentruaproape toti s ∈ C. In termeni sistemici, cand T (s) are semnficatia de matricede transfer a unui sistem, zerourile ei se mai numesc zerouri de transmisie alesistemului.

Pentru a introduce notiunea de zerou invariant al unui sistem de tipul (A,B,C,D)


sa presupunem conditii initiale nule. Atunci avem in transformate Laplace

(sI −A)x−Bu = 0,Cx+Du = y

sau echivalent [sI −A −B

C D

] [xu

]=

[0y

].

Matricea polinomiala (de grad 1)

S(s) :=

[sI −A −B

C D

]∈ R[s](n+p)×(n+m) (93)

se numeste matricea sistem (sau de transmisie) si joaca un rol central in studiulsistemelor dinamice liniare atat din punct de vedere teoretic cat si procedural.s0 ∈ C se numeste zerou invariant al sistemului daca

rankS(s0) < rank nS(s) =: r.


Rangul normal este egal cu dimensiunea maxima a unui minor al lui S(s) carenu are determinantul identic nul. Fie χ(s) cel mai mare divizor comun altuturor determinantilor minorilor de rang (avand dimensiunea egala cu rangulnormal). Atunci zerourile invariante ale sistemului (A,B,C,D) sunt exact zerourilepolinomului χ(s).

Din identitatea [sI −A −B

C D

]=[

I OC(sI −A)−1 I

] [sI −A O

O T (s)

] [I −(sI −A)−1BO I

]se observa ca daca s0 ∈ Λ(A) atunci so este zerou invariant daca si numai dacaeste zerou de transmisie.

Problemele majore apar insa atunci cand exista zerouri comune cu poli. Pentru aintelege riguros aceste concepte avem nevoie de o teorie mai sofisticata a formelorcanonice pentru matrici rationale si matrici polinomiale de gradul 1 (numitefascicole matriciale).


Forma Smith–McMillan a rationalei T (s) – o forma canonica sub transformariunimodulare –

Teorema 36 (Forma Smith–McMillan). Fie T (s) o p ×m matrice rationala cucoeficienti in R avand rangul normal r. Atunci exista o p × p matrice polino-miala U(s) si o m × m matrice polinomiala V (s), ambele cu coeficienti in Rsi determinant constant nenul (independent de s), care aduce T (s) la formaSmith–McMillan

S(s) = U(s)T (s)V (s), (94)

unde

S(s) := diag

{ϵ1(s)

η1(s),ϵ2(s)

η2(s), . . . ,

ϵr(s)

ηr(s), 0, . . . , 0

}, (95)

polinoamele ϵi(s), ηi(s) sunt monice (au coeficientul termenului de grad maximegal cu 1), sunt doua cate doua coprime pentru i = 1, . . . , r, si satisfac propri-etatile de divizibilitate

ϵi(s) | ϵi+1(s),ηi+1(s) | ηi(s),

i = 1, . . . , r − 1. (96)


Mai mult, polinoamele ϵi(s) si ηi(s) sunt unic definite de T (s) si se numescdivizori elementari ai lui T (s).

Definimz(s) := ϵ1(s) · · · ϵr(s),p(s) := η1(s) · · · ηr(s).

(97)

Atunci cele nz (np) radacini ale lui z(s) (p(s)) sunt prin definitie zerourile (polii)finiti ai lui T (s).

Ordinul zeroului (polului) s0 al lui T (s) este prin definitie multiplicitatea sa caradacina a polinomului z(s) (p(s)).

Ordinele partiale ale zeroului (polului) s0 al lui T (s) sunt prin definitie mul-tiplicitatile nenule ale lui s0 ca radacina a polinoamelor ϵi(s) (ηi(s)), pentrui = 1, . . . , r.

Spunem ca ∞ este zerou (pol) al lui T (s) daca s = 0 este zerou (pol) al matricii

rationale T (s) = T (1s), si definim ordinele zeroului (polului) s = ∞ al lui T (s) ca

fiind ordinele zeroului (polului) s = 0 al lui T (s).


Notam cu Z(T ) si respectiv P(T ) reuniunea tuturor zerourilor si respectiv tuturorpolilor (incluzand infinitul si repetitii in acord cu ordinele elementelor).

Gradul McMillan al lui T este prin definitie suma tuturor ordinelor polilor (finiti siinfiniti). Deci gradul McMillan al unei matrici rationale este egal cu numarul depoli (socotind ordinele inclusiv ale polilor de la infinit).

Observatie: Daca rationala este proprie atunci nu are poli la infinit si definitiile demai sus se simplifica corespunzator.

Cand suntem interesati de un singur punct s0 se poate folosi o forma Smith–McMillan locala care pune in evidenta numai ordinele zeroului si polului din s0.Teorema 37 (Forma Smith–McMillan locala). Fie T (s) o p×m matrice rationalacu coeficienti in R, avand rangul normal r, si fie s0 ∈ C. Atunci exista o p× pmatrice rationala U(s) si o m×m matrice rationala V (s), ambele nesingularesi fara poli sau zerouri in so, care aduc T (s) la forma Smith–McMillan locala(in jurul lui s0),

Sℓ(s) = U(s)T (s)V (s), (98)


unde

Sℓ(s) := diag{(s− s0)

k1, (s− s0)k2, . . . , (s− s0)

kr}, (99)

si

k1 ≤ k2 ≤ . . . ≤ kr

sunt numere intregi. Mai mult, intregii strict pozitivi (sau strict negativi) kisunt ordinele partiale ale lui s0 ca zerou (pol) al lui T .

Forma Smith–McMillan in jurul lui s = ∞ se obtine din forma Smith–McMillan alui T (1s) in jurul lui s = 0.

Baze minimale pentru spatiile nucleu la stanga si dreapta

Fie T (s) o p×m matrice rationala avand rangul normal r.

Nucleul la dreapta (peste rationale) are dimensiune m− r iar nucleul la stanga aredimensiune p− r. Introducem in continuare notiunile de indici minimali la dreaptasi stanga. Pentru acesta avem nevoie de cateva notiuni de subspatii rationale.


Definim gradul unui vector de polinoame ca fiind cel mai mare grad al elementelorrespectivului vector. Dandu–se un subspatiu in Rm(s) (vectori rationali de dimen-siune m), putem intotdeauna construi o baza polinomiala pentru el. Coloaneleunei matrici polinomiale P(s) formeaza o baza minimala pentru spatiul pe care-lgenereaza daca au loc simultan:

1. P (s) este monica pentru toti s ∈ C finiti;

2. P (s) este redusa pe coloane (sau proprie pe coloane). Mai precis, fie ni gradulcoloanei i a lui P (s) si construim matricea constanta Pn a carei coloana i estecoeficientul vectorial al lui sni in coloana i a lui P(s). Atunci P(s) este de tipcoloana redusa daca Pn este monica.

Echivalent, o baza polinomiala este minimala daca suma tuturor gradelor vectorilorpolinomiali care o formeaza este cat mai mica posibila.

Multimea gradelor vectorilor din orice baza minimala a unui subspatiu este invari-anta in raport cu operatiile unimodulare pe coloane, si aceste grade se numesc


indici minimali (sau indici Kronecker ) ai subspatiului.

Se numesc indici minimali la stanga si dreapta ai unei matrici rationale multimeaindicilor minimali ai subspatiilor nule (nucleu) la stanga si respectiv la dreapta.

Pentru o matrice rationala arbitrara are loc o relatie interesanta intre indiciistructurali. Fie nr si nℓ suma indicilor minimali la dreapta si respectiv la stanga sifie nz si np numarul total de zerouri si respectiv de poli. Atunci are loc relatia

np = nz + nr + nℓ.


7. Fascicole Matriciale si Forme Canonice

Fie M si N doua m× n matrici cu elemente in R. Matricea polinomiala (de grad1) sM −N se numeste fascicol matricial sau pe scurt fascicol.

Ne concentram intai atentia asupra fascicolelor sM − N care sunt regulate, i.e.,care sunt patrate (n× n) si au un determinant neidentic nul det(sM −N) ≡ 0.Un fascicol care nu este regulat se numeste singular. In particular, daca M sau Nsunt inversabile atunci fascicolul sM −N este regulat. In general vom fi interesatide fascicole arbitrare (inclusiv singulare).

Dandu-se un fascicol regulat sM − N , cu M,N ∈ Rn×n, problema de gasire asolutiilor ecuatiei polinomiale

χ(s) := det (sM −N) = 0 (100)

se numeste problema de valori proprii generalizate.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 120 Fascicole matriciale

Deoarece M poate fi singulara, polinomul caracteristic χ(s) are gradul nf ≤ n.

Cele nf radacini ale lui χ(s) se numesc valori proprii generalizate finite alefascicolului sM −N .

s = ∞ este o valoare proprie (generalizata) a lui sM − N daca s = 0 este ovaloare proprie (generalizata) a fascicolului reciproc sN −M . Multiplicitatea n∞a valorii proprii de la infinit este prin definitie multiplicitatea valorii proprii s = 0pentru fascicolul sN −M . Evident avem n∞ = n− nf .

Prin urmare un fascicol matricial regulat de dimensiune n × n are intotdeauna nvalori proprii (finite si infinite) care formeaza spectrul fascicolului notat Λ(M,N).

Pentru o valoare proprie s0 exista intotdeauna un vector nenul x ∈ Cn – numitvector propriu generalizat a.i.{

Nx = s0Mx daca s0 este finita,Mx = 0 daca s0 este infinit.


Forma canonica Weierstrass a unui fascicol regulat

Introducem o relatie de echivalenta pentru fasciole matriciale si studiem intaiproprietatile si consecintele asupra fascicolelor regulate.

Doua fascicole sM −N si sM − N , cu M,N, M, N ∈ Cm×n se numesc (strict)echivalente daca exista doua matrici inversabile Q ∈ Cm×m, Z ∈ Cn×n, a.i.

Q(sM −N)Z = sM − N . (101)

Relatia de echivalenta stricta (101) induce o forma canonica pe multimea fasci-colelor regulate de dimensiune n × n numita forma canonica Weierstrass. Prinurmare, pentru oricare fascicol regulat sM − N , cu M,N ∈ Cn×n, exista douamatrici inversabile Q,Z ∈ Cn×n a.i.

Q(sM −N)Z = sMW −NW


undesMW −NW := diag (sM∞ − In∞, sInf

−Nf), (102)

Nf este in forma canonica Jordan, M∞ este nilpotenta si este in forma canonicaJordan

M∞ := diag (Js∞1 (0), Js∞2 (0), . . . , Js∞h∞

(0)) (103)

si Jsi(0) este un bloc elementar (nilpotent) Jordan de dimensiune si×si cu valoareproprie s = 0.

Observatii: • Valorile proprii generalizate finite ale fascicolului sM −N coincid cuvalorile proprii ale matricii Nf . Prin urmare se poate folosi matricea Nf pentrua defini conceptele de multiplicitate partiala, algebrica si geometrica a unei valoriproprii generalizate finite a lui sM −N .• Similar, se definesc multiplicitatea partiala, algebrica si geometrica a valorii pro-prii generalizate de la infinit ca fiind multiplicitatea corespunzatoare a valorii propriis = 0 a matricii M∞. Prin urmare pentru s = ∞ multiplicitatile partiale sunt s∞i(i = 1, . . . , h∞), multiplicitatea algebrica este n∞ si satisface n∞ =

∑h∞i=1 s

∞i , iar

multiplicitatea geometrica este h∞.


•Multimea valorilor proprii generalizate impreuna cu multiplicitatile partiale deter-mina complet forma canonica Weierstrass a unui fascicol matricial regulat (panala o permutare a blocurilor diagonale).

Daca M este inversabila atunci fascicolul nu are are valori proprii infinite si formacanonica Weierstarss se reduce la forma canonica Jordan a matricii M−1N .


Problema de valori proprii generalizate: cazul general

Extindem in continuare studiul asupra fascicolelor arbitrare (posibil singulare)sM −N de dimensiune m× n cu elemente in R. Un fascicol este numit singulardaca nu este patrat sau daca este patrat dar det(sM − N) ≡ 0. In particular,sM −N are rang constant pentru toti s ∈ C cu exceptia unui numar finit pentrucare are rang strict mai mic.

Observatii: Rangul normal r al fascicolului sM − N este rangul lui sM − Npentru aproape toti s ∈ C. Pentru un fascicol regulat avem m = n = r.Daca νr := n − r > 0 atunci fasciolul are structura singulara la dreapta. Dacaνℓ := m − r > 0 atunci fascicolul are structura singulara la stanga. Un fascicolregulat nu are structura singulara nici la stanga si nici la dreapta.

Polinomul caracteristic χ(s) al fascicolului este cel mai mare divizor comun alpolinoamelor Ri(s), unde {Ri(s)} este multimea tutoror minorilor de dimensiuner.


Problema rezolvarii ecuatiei polinomiale

χ(s) := χ0 + χ1s+ . . .+ χnfsnf = 0,

cu χnf= 0, se numeste problema de valori proprii generalizate pentru fascicolul

sM −N .

Cele nf radacini ale lui χ(s) se numesc valori proprii finite. Spunem ca s = ∞ estevaloare proprie lui sM −N daca s = 0 este valoare proprie a fascicolului reciprocsN −M sau, echivalent, daca rankM < r. Multiplicitatea n∞ a v.p. de la infiniteste prin definitie multiplicitatea v.p. s = 0 a lui sN −M .

Reuniunea (nedisjuncta) a celor nf + n∞ v.p. generalizate (finite si infinite)formeaza spectrul lui sM −N notat Λ(M,N).

Forma canonica Kronecker a unui fascicol general

Relatia de stricta echivalenta induce o forma canonica pe multimea fascicolelor dedimensiune m × n numita forma canonica Kronecker. Mai exact, pentru oricare


fascicol sM −N , cu M,N ∈ Cm×n, exista doua matrici inversabile Q ∈ Cm×m siZ ∈ Cn×n a.i.

Q(sM −N)Z = sMKR −NKR,

unde

sMKR −NKR :=

Lϵ1 . . .Lϵνr

sM∞ − In∞sInf

−Nf

LTη1 . . .

LTηνℓ

, (104)

Nf este o matrice in forma canonica Jordan, M∞ este o matrice nilpotenta in


forma canonica Jordan, si Lk (k ≥ 0) este un k × (k + 1) fascicol bidiagonal

Lk :=

s −1. . . . . .

s −1

.

k poate fi zero corespunzand unei linii sau coloane de zerouri in fascicolul (104).Structura Kronecker este complet determinata de partea regulata si singulara.

Valorile proprii (finite si infinite) ale fascicolului sM − N sunt valorile proprii alefascicolului regulat

s

[M∞ OO Inf

]−

[In∞ OO Nf

]Partea singulara a fascicolului este determinata de structura singulara Kronecker lastanga si dreapta. Blocurile de dimensiune ϵi× (ϵi+1) notate Lϵi, (i = 1, . . . , νr),sunt blocurile elementare Kronecker la dreapta si ϵi ≥ 0 sunt indicii Kronecker ladreapta. Blocurile de dimensiune (ηj + 1) × ηj notate Lηj

T , (j = 1, ..., νℓ), suntblocurile elementare Kronecker la stanga si ηj ≥ 0 sunt indicii Kronecker la stanga.


Din forma canonica Kronecker avem

rank n(sM −N) = nr + n∞ + nf + nℓ, (105)

unde nr :=∑νr

i=1 ϵi si nℓ :=∑νℓ

j=1 ηj. Daca sM −N este regulat atunci nu exista

indici Kronecker (i.e., blocurile Lϵi, LTηj

dispar) si forma canonica Kronecker sereduce la forma canonica Weierstrass.


8. Elemente Structurale ale unei Matrici Rationale inTermenii Realizarilor de Stare

Intre elementele structurale ale matricii de transfer rationale T (s) a unui sistemdinamic si formele canonice ale fasciolelor

sI −A,

[sI −A −B

C D

]asociate unei realizari arbitrare – numite fascicolul de poli si fascicolul de zerouri(sau matricea de transmisie) – exista o legatura stransa.Teorema 38. Fie T (s) o p×m matrice rationala proprie avand gradul McMillann si rangul normal r. Fie

T =

[A BC D

](106)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 130

o realizare de dimensiune k cu coeficienti in R si fie

sI −A, sET −AT :=

[sI −A −B−C −D

]fasciolele de poli si respectiv de zerouri asociate acestei realizari.

1. Pentru orice realizare (106) avem:

(a) Rangul normal: Rangurile normale ale lui T (s) si sET −AT satisfac

rank nT (s) = rank n(sET −AT )− k.

(b) Poli: Reuniunea polilor P(T ) este inclusa Λ(A),

P(T ) ⊂ Λ(A).


(c) Zerouri: Reuniunea zerourilor de transmisie Z(T ) (finite si infinite) alelui T este inclusa in Λ(ET , AT ),

Z(T ) ⊂ Λ(ET , AT ).

2. Pentru o realizare minimala (106) avem in plus:

(a) Poli: Polii lui T (s) coincid cu valorile proprii ale lui A. Ordinele partialeale polilor lui T (s) sunt egale cu multiplicitatile partiale ale v.p. ale lui A.

(b) Zerouri finite : Zerourile finite (de transmisie) ale lui T coincid cu v. p.finite ale lui sET −AT . Ordinele partiale ale zerourilor finite ale lui T (s)sunt egale cu multiplicitatile partiale ale v.p. finite ale lui sET −AT .

(c) Zerouri infinite: Ordinele partiale ale zerourilor infinite (de transmisie)ale lui T sunt egale cu multiplicitatile partiale ale v.p. infinite a lui sET −AT minus 1.


(d) Indici minimali la stanga. Indicii minimali la stanga ai lui T sunt egalicu indicii Kronecker la stanga ai lui sET −AT .

(e) Indici minimali la dreapta. Indicii minimali la dreapta ai lui T sunt egalicu indicii Kronecker la dreapta ai lui sET −AT .


CAPITOLUL 4: SINTEZA ELEMENTARA

1. Compensatoare Dinamice : Problematica

2. Lege de Comanda, Stabilizabilitate, Alocabilitate

3. Estimatori de Stare

4. Estimatori de Tip 1

5. Compensatorul Kalman

6. Estimatori de Stare de Ordin Redus (Tip 2)

7. Reglarea Sistemelor Dinamice

CAPITOLUL 4: SINTEZA ELEMENTARA 134 SINTEZA ELEMENTARA

1. Compensatoare Dinamice : Problematica

Consideram un sistem liniar{x(t) = Ax(t) +Bu(t), x(0) = xo

y(t) = Cx(t) +Du(t)(107)

cu x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp.

Problema sintezei (naturala): Cum putem sa modificam dinamica acestui sistemastfel incat sa satisfaca anumite cerinte ? Cerintele elementare discutate si in cazulsistemelor SISO sunt legate de stabilitate si comporatarea sistemului la diversesemnale de referinta/perturbatii.

Raspuns: Cerintele de proiectare se pot realiza prin cuplarea unui nou sistemdinamic (de preferinta din aceeasi clasa de modele) astfel incat sistemul rezultantsa se comporte in modul dorit.

CAPITOLUL 4: SINTEZA ELEMENTARA 135 Compensatoare Dinamice: Problematica

Asa cum am vazut in cazul sistemelor SISO, conexiunile serie si paralel nu potasigura in general nici macar cerinta minimala de stabilitate (interna) si acest fapteste specific si sistemelor dinamice (Ex: Aratati acest lucru prin analogie cu cazulSISO sau direct pe realizarile de stare ale conexiunilor serie/paralel). Prin urmarene indreptam atentia din nou asupra conexiunii in bucla de reactie negativa.

In conjunctie cu sistemul (107) consideram sistemul dinamic pe spatiul starilor(numit compensator dinamic sau regulator){

xc(t) = Acxc(t) +Bcuc(t), xc(0) = xco

yc(t) = Ccxc(t) +Dcuc(t),(108)

unde xc(t) ∈ Rnc, uc(t) ∈ Rp, yc(t) ∈ Rm, cuplat in reactie inversa cu (107) a. i.

u ≡ yc + uR, yR ≡ y ≡ uc

unde uR este intrarea (semnal extern) si yR este iesirea sistemului rezultant.


Pentru simplificare presupunem S := Ip − DDc = I, S = Im − DcD = I (deexemplu D = 0 sau Dc = 0). Atunci ecuatiile dinamice ale sistemului echivalentsunt

˙[xxc

]=

[A+BDcC BCc

BcC Ac +BcDCc

] [xxc

]+

[B

BcD

]uR

yR =[C DCc

] [ xxc

]+DuR.

(109)

Notand

xR :=

[xxc

], AR :=

[A+BDcC BCc

BcC Ac +BcDCc

], BR :=

[B

BcD

],

CR :=[C DCc

], DR := D


obtinem echivalent xR(t) = ARxR(t) +BRuR(t), xR(0) =

[xo

xco

]yR(t) = CRxR(t) +DRuR(t).

(110)

Se formuleaza urmatoarele probleme fundamentale:

1. Problema stabilizarii: Pentru sistemul original (A,B,C,D) sa se gaseasca unregulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in buclainchisa sa fie intern asimptotic stabil (Λ(AR) ⊂ C−).

2. Problema alocarii: Pentru sistemul original (A,B,C,D) sa se gaseasca unregulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in buclainchisa sa aibe o dinamica impusa (mai precis valorile proprii ale sistemului inbucla inchisa sa coincida cu multimea Λ0 de n + nc valori complexe date, i.e.,Λ(AR) = Λ0.


Observatii: a) Ambele probleme impun conditii numai asupra matricii AR.b) In ambele probleme trebuie implicit determinat si nc (dimensiunea compen-satorului) fiind de dorit ca aceasta sa fie cat mai mica. Problemele de stabi-lizare/alocare in care se impune conditia suplimentara de minimalitate a lui nc suntprobleme structurale in general foarte dificile.c) Multimea Λ0 se ia in general simetrica, i.e. daca s ∈ Λ0 atunci si s ∈ Λ0,regulatorul rezultand automat cu coeficienti reali. Λ0 se da in general ca cerinta deproiectare asigurand automat o anumita viteza de raspuns, timp tranzitoriu, etc.d) Spre deosebire de problema alocarii, problema stabilizarii nu pretinde spectrufix ci doar locatia acestuia in C−.

In mod traditional au existat cateva abordari ale acestei probleme:

• Prin extensie dinamica: Problema se reduce simplu la o problema algebricade alocare de poli ce insa s-a dovedit a fi foarte dificil de rezolvat in conditiigenerale.

• Principiul separatiei: S–a pus in evidenta un principiu fundamental in teoria


sistemelor liniare numit principiul separatiei si care reduce problema originala ladoua probleme algebrice de alocare ce se rezolva independent.

• Parametrizarea lui Youla: cea mai completa solutie disponibila (foloseste implicitprincipiul separatiei) necesitand insa dezvoltarea teoriei factorizarilor de matricirationale peste S (relativ sofisticata) – solutia este formal identica cu cazulSISO.

Extensie dinamica

Consideram pentru simplitateD = 0. Metoda se bazeaza pe observatia ca matriceade stare AR a sistemului rezultant se poate scrie succesiv

AR :=

[A+BDcC BCc

BcC Ac

]=

[A OO O

]+

[B OO Inc

] [Dc Cc

Bc Ac

] [C OO Inc

]

= Ae +BeKCe (111)


unde

Ae :=

[A OO O

], Be :=

[B OO Inc

], Ce :=

[C OO Inc

],K :=

[Dc Cc

Bc Ac

].

(112)Deci problema originala de stabilizare/alocare dinamica prin gasirea compensatoru-lui (Ac, Bc, Cc, Dc) s–a redus la problema echivalenta de gasire a matricii constanteK astfel incat spectrul matricii (111) sa fie in C−. Aceasta din urma problema estein fapt o problema de gasire a unei reactii constante dupa iesire (reactie inversa cucompensator constant) pentru sistemul (Ae, Be, Ce).

Sistemul extins (Ae, Be, Ce) se obtine prin adaugarea la sistemul initial (A,B,C,D)a sistemului

xa(t) = ua(t),ya(t) = xa(t),


unde xa(t), ua(t), ya(t) ∈ Rnc. Obtinem astfel ecuatiile dinamice{xe(t) = Aexe(t) +Beue(t),ye(t) = Cexe(t),

xe(t) :=

[x(t)xa(t)

], ue(t) :=

[u(t)ua(t)

], ye(t) :=

[y(t)ya(t)

]sunt starea, intrarea si respectiv iesirea extinsa.

Daca conectam un compensator constant in reactie inversa cu sistemul extinsobtinem ca matricea de stare a sistemului in bucla inchisa este (111). Deciproblema originala de gasire a unui compensator (Ac, Bc, Cc, Dc) s-a redus laproblema de gasire a unei reactii cst. K (112) pentru sistemul extins (Ae, Be, Ce).

Cu toate ca aceasta problema pare mai simpla decat cea originala, solutionarea eieste foarte dificila intrucat nu este cunoscuta dimensiunea nc. Chiar cu nc impus,problema se reduce la rezolvarea unei probleme de optimizare neconvexe (dificile!).


Principiul separatiei

Un compensator dinamic se poate obtine rezolvand independent problemele:

• Constructia unei legi de reactie dupa stare F ∈ Rm×n care aloca sau stabilizeaza(face ca matricea A+BF sa aibe spectrul dorit sau sa fie asimptotic stabila).

• Constructia unui estimator de stare (prelucreaza semnalele exogene – marimilede intrare u si de iesire y – si genereaza o estimare a marimii de stare x).

In final, regulatorul (de tip Kalman) se obtine luand reactia F dupa starea estimata.

Problema de alocare (cu reactie dinamica dupa iesire) are solutie daca si numaidaca perechea (A,B) este controlabila si perechea (C,A) este observabila.

Problema de stabilizare (cu reactie dinamica dupa iesire) are solutie daca si numaidaca perechea (A,B) este stabilizabila si perechea (C,A) este detectabila.


2. Lege de Comanda, Alocabilitate, Stabilizabilitate

Definitia 39. • Pentru un sistem (A,B,C,D) dependenta

u = Fx+Gv (113)

se numeste lege de comanda prin reactie dupa stare, unde F ∈ Rm×n, G ∈Rm×m, F se numeste matricea de reactie si v este noua marime de intrare.(FIG)• Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m se numeste stabilizabila daca existao matrice de reactie dupa stare F ∈ Rm×n a.i.

Λ(A+BF ) ⊂ C−.

• Perechea (C,A), C ∈ Rp×n, A ∈ Rn×n se numeste detectabila daca exista omatrice de reactie dupa stare K ∈ Rn×p a.i.

Λ(A+KC) ⊂ C−.

CAPITOLUL 4: SINTEZA ELEMENTARA 144 Lege de Comanda, Alocabilitate, Stabilizabilitate

• Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m, se numeste alocabila daca oricarear fi multimea simetrica Λ0 de n numere complexe (orice s ∈ Λ0 ⇒ s ∈ Λ0),exista o matrice de reactie dupa stare F ∈ Rm×n a.i.

Λ(A+BF ) = Λ0.

Proprietatile de stabilizabilitate si detectabilitate sunt duale.

Considerand sistemul dinamic{x(t) = Ax(t) +Bu(t), x(0) = xo

y(t) = Cx(t) +Du(t)(114)

legea de comanda dupa stare implica accesul (din punct de vedere tehnic) la stare,i.e., cunoasterea marimii de stare ! Dupa implementarea comenzii (113) sistemul


in bucla inchisa devine{x(t) = (A+BF )x(t) +BGv(t), x(0) = xo

y(t) = (C +DF )x(t) +DGv(t)(115)

avand noua intrare v si iesirea y.

Exercitiu: Explicitati in domeniul timp si al transformatelor Laplace traiectoria,iesirea si legea de comanda pentru sistemul (115). Scrieti o realizare de stare pentruacest sistem si precizati cum sunt influentate controlabilitatea/ observabilitatea/minimalitatea/ stabilizabilitatea/ detectabilitatea/ polii/ zerourile printr–o lege decomanda cu reactie dupa stare.Teorema 40. Fie A ∈ Rn×n, B ∈ Rn×m, F ∈ Rm×n, G ∈ Rm×m nesingulara sifie AF := A+BF .a) Perechea (A,B) este controlabila daca si numai daca perechea (AF , BG) estecontrolabila.b) Subspatiile controlabile in k pasi ale perechii (A,B) si perechii (AF , BG)


coincid, i.e.,Rk(A,B) = Rk(AF , BG). (116)

Demonstratie. a) Avem succesiv

rank[sI −A−BF BG

]= rank

[sI −A B

] [ I O−F G

]= rank

[sI −A B

]si concluzia rezulta folosind criteriul PBH de controlabilitate.b) Demonstram prin inductie. Pentru k = 0 avem prin definitie

R0(A,B) = R0(AF , BG) = {0}

iar pentru k = 1 avem

R1(A,B) = ImB = ImBG = R1(AF , BG).


Presupunem acum (116) adevarata. Atunci pentru k + 1 avem

Rk+1(AF , BG) = ImBG+AFRk(AF , BG)

= ImB +AFRk(A,B) = ImB +ARk(A,B) = Rk+1(A,B).

Solutia problemei alocariiTeorema 41. Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca sinumai daca este controlabila.

Demonstratia acestui rezultat este relativ complicata si o vom face in cateva etapeformulate ca rezultate separate:• Demonstram suficienta pentru m = 1 (o intrare);• Aratam ca problema cu m > 1 se poate reduce printr-o (pre)reactie dupa stareF la problema cu m = 1;• Demonstram teorema pentru m general.


Teorema 42 (Cazul m=1). Perechea (A, b), A ∈ Rn×n, b ∈ Rn×1 este alocabiladaca este controlabila.

Demonstratie. Fie Λ0 un set simetric de n numere si ∈ C, i = 1, 2, . . . , n. Aratamca exista f ∈ Rn×1 a.i.

Λ(A+ bfT ) = Λ0.

Demonstratia este constructiva (furnizeaza reactia care aloca). Deoarece (A, b)este controlabila, matricea de controlabilitate

R =[b Ab A2b . . . An−1b

]are dimensiune n× n si rang n si deci este inversabila. Atunci ecuatia

qTR = eTn (117)

are solutie unica qT = eTnR−1 ∈ R1×n, unde eTn =

[0 . . . 0 1

](qT este

ultima linie a lui R−1). Fie Λ0 un set simetric fixat de n numere complexe si,


i = 1, 2, . . . , n si fie

χ(s) = Πni=1(s− si) = sn + αn−1s

n−1 + . . .+ α0 (118)

polinomul avand radacinile date de Λ0. Aratam ca exista un f a.i. polinomulcaracteristic a lui A+ bfT sa coincida cu χ(s) ceea ce este echivalent cu a spuneca matricea A+ bfT are spectrul Λ0. Pentru aceasta este suficient sa aratam ca

χ(A+ bfT ) = 0

pentru un f potrivit ales. Scriind (117) explicit obtinem

qT b = 0qTAb = 0...qTAn−2b = 0qTAn−1b = 1


care se pot rescrie pentru orice f ∈ Rn sub forma

qT = qT

qT (A+ bfT ) = qTAqT (A+ bfT )2 = qTA2

...qT (A+ bfT )n−1 = qTAn−1

qTAnb = qTAn + qTAn−1bfT = qTAn + fT .

(119)

Inmultind succesiv ecuatiile cu α0, α1, . . . αn−1 si 1, adunandu-le membru cumembru si folosind (118) rezulta

qTχ(A+ bfT ) = qTχ(A) + fT . (120)

AlegandfT := −qTχ(A) (121)

rezulta automat caqTχ(A+ bfT ) = 0. (122)


Folosind (119), obtinem prin inmultire succesiva cu A, A2, . . ., An−1 ca

Tχ(A+ bfT ) = 0, TR =

0 0 . . . 0 10 0 . . . 1 0... ... ... ... ...0 1 . . . 0 01 0 . . . 0 0

, T :=

qT

qTA...qTAn−1

.

Deci T este inversabila si prin urmare χ(A + bfT ) = 0 pentru f dat de (121),q.e.d.

Dam in continuare un rezultat care permite reducerea problemei generale de alocarecu m > 1 la cazul m = 1.Teorema 43. Daca perechea (A,B) este controlabila atunci pentru orice b ∈Rn, b = 0, exista o matrice de reactie F astfel incat perechea (A + BF, b) estecontrolabila.


Demonstratie. Fie b = 0 fixat. Definim recurent n vectori

xk+1 = Axk +Buk, k = 1, 2, . . . , n− 1, x1 = b (123)

unde uk ∈ Rm.

Aratam ca putem intotdeauna alege vectorii uk (in numar de n− 1) a. i. vectoriix1, . . . , xn sa fie liniar independenti. Presupunem prin reducere la absurd ca amconstruit vectorii liniar independenti x1, . . . , xk (k < n) si oricare ar fi uk ∈ Rm

avem ca xk+1 este liniar dependent de precedentii, i.e.,

xk+1 = Axk +Buk ∈ Sk := Im[x1 x2 . . . , xk

], ∀uk ∈ Rm. (124)

Din (124) rezulta automat ca

Axk ∈ Sk, ImB ∈ Sk.


Avem deasemenea

ASk = Im[Ax1 Ax2 . . . Axk

]

= Im[x2 −Bu1 x3 −Bu2 . . . xk+1 −Buk

]⊂ Sk

ceea ce inseamna ca Sk este A–invariant si contine ImB. Deoarece perechea(A,B) este controlabila avem ca R = Rn si deci

Rn = R ⊂ Sk

ceea ce implica automat k = n obtinand astfel o contradictie.

Consideram acum ecuatia

F[x1 x2 . . . xn

]=

[u1 u2 . . . , un−1 0

](125)


care are o solutie unica F . Daca premultiplicam ecuatia de mai sus cu B obtinem

Bui = BFxi, i = 1, 2, . . . , n− 1

care inlocuite in (123) genereaza

xk+1 = (A+BF )xk, k = 1, 2, . . . , n− 1, x1 = b

sau incaxk = Ak−1

F b, k = 1, 2, . . . , n.

Deoarece xk sunt liniar independenti rezulta ca matricea[b AF b . . . An−1

F b]

este inversabila si deci perechea (AF , b) cu F dat de (125) este controlabila.

Teorema 44. Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca sinumai daca este controlabila.


Demonstratie. Suficienta: Deoarece perechea (A,B) este controlabila inseamnaca B = 0 si deci exista g ∈ Rm a.i. b = Bg = 0. Din Teorema 42 rezulta atuncica exista F a.i. perechea (AF , b) sa fie controlabila, unde AF := A + BF . Dinteorema 42 rezulta ca pentru orice Λ0 set simetric de n numere exista f ∈ Rm a.i.

Λ(AF + bfT ) = Λ0.

Prin urmare punand

F := F + gfT (126)

rezulta ca

Λ(A+BF ) = Λ(A+B(F + gfT )) = Λ(AF + bfT ) = Λ0

de unde concluzia ca perechea (A,B) este alocabila si reactia care aloca este datade (126).Necesitatea: Pp prin absurd ca perechea (A,B) este alocabila dar nu este


controlabila. Atunci aplicand teorema de descompunere controlabila obtinem innoul sistem de coordonate

T (A+BF )T−1 = A+ BF =

[A1 A3

O A2

]+

[B1

O

] [F1 F2

]

=

[A1 +B1F1 A3 +B1F2

O A2

](127)

unde am notat F := FT−1. De aici rezulta ca

Λ(A+BF ) = Λ(A+ BF ) = Λ(A1 +B1F1) ∪ Λ(A2)

si deci Λ(A2) ⊂ Λ(A+ BF ) oricare ar fi reactia F ceea ce contrazice ipoteza dealocabilitate a perechii (A,B).

Observatii: a) Relatia (127) evidentiaza ca orice pereche (A,B) are o subperechecare poate fi alocata (parte din spectru poate fi alocat) – aceasta coincide cu


partea controlabila – si o parte nealocabila, i.e. anumiti poli ficsi dati de Λ(A2).Acesti poli sunt invarianti in raport cu orice reactie dupa stare.b) Teorema de mai sus arata ca proprietatea ”benefica” fundamentala a uneiperechi controlabile (A,B) este ca dinamica sistemului (determinata de v.p. alematricii de stare) poate fi modificata in mod arbitrar printr–o reactie dupa stare.c) Alocarea se poate extinde si asupra vectorilor proprii (simultan cu valorile proprii)cu anumite precautii privitoare la alegerea acestora.d) Demonstratia teoremelor de mai sus este constructiva rezultand proceduri deobtinere a reactiei care aloca. Aceaste metode au insa numeroase dezavantaje dpdvnumeric si de aceea s-au dezvoltat alte proceduri numeric stabile de constructie areactiei F (algoritm de tip Schur, alocare cu norma minima, etc).e) Alocabilitatea nu implica in general faptul ca matricea A + BF are oriceelemente prescrise ci doar orice spectru prescris !

Procedura de Alocare: Cazul m = 1

Pasul 0: Dandu–se perechea controlabila (A, b), A ∈ Rn×n, b ∈ Rn, si un set


simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul

χ(s) = Πni=1(s− si) = α0 + α1s+ α2s

2 + . . .+ αn−1sn−1 + sn

cu α0, α1, . . . , αn−1 ∈ R.

Pasul 1: Se construieste matricea de controlabilitate

R =[b Ab . . . An−1b

]care este automat patrata si nesingulara.


Pasul 2: Se rezolva ecuatia

RTq = en =

00...01

in necunoscuta q ∈ Rn.

Pasul 3: Se calculeaza

fT = −qTχ(A).

Pentru a explicita procedura pentru cazul multivariabil avem nevoie de un rezultatauxiliar.


Propozitia 45. Fie (A,B) controlabila, A ∈ Rn×n, B ∈ Rn×m. Controlabili-tatea perechii (A + BF, b) este generica in raport cu F ∈ Rm×n si b := Bg,0 = g ∈ Rm. Mai exact, alegand aleator perechea (F, g) perechea (AF , b) este(generic) controlabila.

Demonstratie. Demonstratia este lasata ca exercitiu fiind asemanatoare cu demon-strarea genericitatii controlabilitatii unei perechi de matrici alese arbitrar.

Procedura de Alocare: Cazul General

Pasul 0: Dandu–se perechea controlabila (A,B), A ∈ Rn×n, B ∈ Rn×m, si unset simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul

χ(s) = Πni=1(s− si) = α0 + α1s+ α2s

2 + . . .+ αn−1sn−1 + sn

cu α0, α1, . . . , αn−1 ∈ R.


Pasul 1: Se aleg F ∈ Rm×n si g ∈ Rm aleator si se construiesc matricile

AF := A+BF , b = Bg.

Pasul 2: Se aplica procedura de alocare (cu m = 1) perechii (AF , b) sipolinomului χ(s) obtinandu-se reactia f ∈ Rm.

Pasul 3: Calculam reactia finala sub forma

F = F + gfT .

Propozitia 46 (Criteriul Hautus de Stabilizabilitate/Detectabilitate). •Perechea (A,B), A ∈ Rn×n, B ∈ Rn×m este stabilizabila daca si numai daca

rank[sI −A B

]= n, ∀s ∈ C+ ∪ C0. (128)


• Perechea (C,A), C ∈ Rp×n, A ∈ Rn×n este detectabila daca si numai daca

rank

[sI −A

C

]= n, ∀s ∈ C+ ∪ C0. (129)

Demonstratie. Exercitiu ! Indicatie: Se foloseste teorema de descompunerecontrolabila punandu-se in evidenta polii ficsi.


3. Estimatori de Stare

Asa cum am vazut, legea de comanda cu reactie dupa stare poate asigura inmod satisfacator cerintele fundamentale ale sintezei sistemelor de stabilizare sialocare cu conditia ca starea sa fie disponibila pentru masura (sa fie accesibiladpdv tehnic). Din pacate acest lucru nu este in general posibil si atunci ne punemproblema estimarii cat mai exacte a starii unui sistem dinamic prin constructiaunui nou sistem care sa citeasca marimile accesibile sau masurabile (intrarea u siiesirea y) si care sa genereaze la iesire o estimare a starii x. Un astfel de sistem senumeste estimator de stare (FIG).Problema: Dandu–se un sistem

{x(t) = Ax(t) +Bu(t), x(0) = xo

y(t) = Cx(t) +Du(t),(130)

CAPITOLUL 4: SINTEZA ELEMENTARA 164 Estimatori de Stare

dorim sa construim un nou sistem{w(t) = Jw(t) +Hy(t) +Mu(t),x(t) = Kw(t) +Ny(t) + Pu(t)

(131)

(care are deci ca intrari intrarea u si iesirea y, are ca iesiri starea estimata x, simarimea de stare w) care sa indeplineasca simultan urmatoarele doua conditii:

1. Sa fie intern asimptotic stabil, i.e., matricea de stare J sa satisfaca

Λ(J) ⊂ C−.

2. limt→∞(x(t)−x(t)) = 0, i.e., iesirea x(t) (numita estimatia starii) sa aproximezeasimptotic starea sistemului original x(t).


Observatii: a) Ideal ar fi x(t) = x(t), ∀t. Acest lucru nu este insa in general posibil(explicati de ce !) si atunci aceasta cerinta se relaxeaza la cea asimptotica.b) Cerinta de stabilitate interna este esentiala pentru constructia estimatorului(explicati de ce!).

Pentru a solutiona problema punem in evidenta ”fidelitatea” cu care starea esti-matorului (131) urmareste starea sistemului original, i.e. evaluam

w − V x

unde V este o matrice ce ”adapteaza” dimensiunile eventual diferite ale lui x si w.Folosind (130) si (131) avem succesiv

w − V x = Jw +Hy +Mu− V Ax− V Bu,

(w − V x)′= J(w − V x) + JV x+HCx+HDu− V Ax+ (M − V B)u,


(w − V x)′= J(w − V x) + (JV +HC − V A)x+ (M − V B +HD)u. (132)

Calculam succesiv

x− x = Kw +Ny + Pu− x = K(w − V x) +KV x+NCx+NDu− x+ Pu

x− x = K(w − V x) + (KV +NC − I)x+ (P +ND)u (133)

Combinand (132) cu (133) obtinem{(w − V x)

′= J(w − V x) + (JV +HC − V A)x+ (M − V B +HD)u,

x− x = K(w − V x) + (KV +NC − I)x+ (P +ND)u.

Pentru ca starea estimatorului sa urmareasca asimptotic starea sistemului original(conditia 2) trebuie ca iesirea sistemului dinamic de mai sus sa tinda asimptotic lazero (indiferent de initializari si de semnalele de intrare x si u). Acest lucru esteposibil daca satisfacem simultan urmatoarele conditii:


a) J asimptotic stabila;b) JV +HC − V A = 0;c) M − V B +HD = 0;d) KV +NC − I = 0;e) P +ND = 0.Daca aceste conditii sunt simultan satisfacute obtinem comportarea dinamica{

(w − V x)′

= J(w − V x),x− x = K(w − V x).

Obtinem deci

limt→∞

(w(t)− V x(t)) = 0, limt→∞

(x(t)− x(t)) = 0

indiferent de initializarea sistemului sau estimatorului !

Problema de constructie a estimatorului asimptotic stabil s–a redus la problema


algebrica de satisfacere simultana a conditiilor a) – e): avem 5 conditii (4 ecuatiialgebrice si o locatie de spectru) si 7 necunoscute.

Evident c) si e) se pot satisface automat alegand M := V B−HD si P := −ND.Raman in continuare mai multe grade de libertate in satisfacerea restului de conditii

Λ(J) ⊂ C−,JV +HC − V A = 0,KV +NC − I = 0,

functie de care se deosebesc mai multe tipuri de estimatori.


4. Estimatori de Tip 1: N = 0

Conditia este echivalenta cu a a spune ca estimatorul nu are transfer direct I/O,i.e., matricea sa “D” este zero. In acest caz obtinem

JV +HC − V A = 0,KV = I

si putem alege K = I, V = I, ramand de satisfacut doar conditia

J = A−HC, Λ(J) ⊂ C−.

Aceasta conditie se poate satisface automat daca perechea (C,A) este detectabila,caz in care alegem −H egal cu reactia care stabilizeaza (problema de stabilizarepentru perechea (AT , CT )). Mai mult, daca perechea (C,A) este observabila,atunci spectrul matricii de stare J a estimatorului poate fi alocat arbitrar.

CAPITOLUL 4: SINTEZA ELEMENTARA 170 Estimatori de Tip 1

In concluzie am obtinut pentru un estimator de tipul 1 urmatoarea constructie:


Pasul 1: Se foloseste procedura de alocare pentru perechea (AT , CT ) si se

determina o matrice F a.i. (AT ) + (CT )F sa aibe spectrul dorit (un anumitspectru impus sau doar localizat in C− in functie de cerinta de proiectare).Pasul 2: Se calculeaza estimatorul cu parametrii

H = −FT , J = A−HC, K = V = I, M = B −HD, P = 0,

rezultand{w(t) = (A−HC)w(t) +Bu(t)−HDu(t) +Hy(t),x(t) = w(t),

(134)

sau, sub forma echivalenta,

˙x = Ax+Bu+ L(Cx+Du− y) (135)

in care este cunoscut sub numele de estimator Luenberger (am notat L := −H).


Observatii: a) Pentru a construi un estimator Luenberger avem nevoie doar saspecificam spectrul estimatorului Λ0 si sa construim reactia L care aloca respectiviipoli pentru estimator Λ(A + LC) = Λ0. Pentru ca estimatorul sa rezulte cucoeficienti reali, spectrul se alege intotdeauna simetric.b) Daca perechea (C,A) este observabila atunci spectrul matricii de stare aestimatorului poate fi alocat arbitrar si deci este posibil ca estimatorul sa furnizezeo estimatie cat de precisa a starii intr-un timp oricat de scurt !c) Din (135) observam ca estimatorul “copiaza” dinamica sistemului original +termen proportional cu “inovatia” Cx+Du− y care de fapt masoara “calitatea”estimarii ! Pentru o estimare perfecta avem x(t) = x(t) si deci inovatia este zerodeoarece

Cx+Du− y = Cx− Cx = 0.

d) Daca facem o transformare de similaritate asupra sistemului original estimatorulLuenberger se modifica corespunzator (Ex: aratati cum ! )e) Pentru a construi estimatorul Luenberger singura conditie pe care am impus-osistemului intitial este cea de detectabilitate (sau respectiv de observabilitate)asupra perechii (C,A). Conditia este nu numai suficienta pentru constructia unui


estimator Luenberger ci si necesara asa cum vom vedea in continuare. Mai mult,conditia este necesara pentru existenta unui estimator general de tipul (131).f) Estimatorul de tipul 1 (Luenberger) are dimensiunea n si de aceea se mainumeste de ordin integ. Asa cum vom vedea, in anumite situatii se pot construiestimatori de ordin mai mic.Teorema 47. Fie sistemul (A,B,C,D) descris de (130). Atunci exista un esti-mator (131) daca si numai daca perechea (C,A) este detectabila. Daca (C,A)este detectabila atunci un estimator (de tip 1 sau Luenberger) este dat de ecu-atille {

w = (A+ LC)w +Bu+ LDu− Ly,x(t) = w(t)

(136)

unde L este orice matrice a.i. Λ(A+ LC) ⊂ C−.

Demonstratie. Partea de suficienta am aratat-o deja. Demonstram necesitateaprin reducere la absurd. Presupunem ca perechea (C,A) nu este detectabila sifara a restrange generalitatea presupunem deasemenea ca perechea (C,A) este in


forma de descompunere observabila

A =

[A1 A3

O A2

], C =

[O C2

]unde Λ(A1) ⊂ C− (aceasta rezulta automat din testul PBH aplicat perechii

nedetectabile (C,A)). Fie s+ ∈ C− o valoare proprie si x+ un vector propriucorespunzator ale lui A1. Luam starea initiala x0 a sistemului (A,B,C,D) deforma

xo =

[x+

O

].

Evident xo apartine subspatiului neobservabil al perechii (C,A), i.e., x0 ∈ N (C,A).Deasemenea luam w(0) = 0 si u(t) ≡ 0. Atunci ecuatiile pentru x si estimatorul(131) sunt

x = Ax,w = Jw +HCx,x = Kw +NCx.


Deoarece x0 ∈ N (C,A) rezulta ca iesirea sistemului (A,B,C,D) este identic nula

y(t) = Cx(t) = CeAtx0 = 0,∀t ≥ 0,

si deasemeneaw(t) = 0, x(t) = 0, ∀t.

Pe de–alta parte, avem

x(t) = eAtx0 = es+tx0 → 0

si deci x(t) − x(t) → 0 pentru comanda u ≡ 0, starea initiala a estimatoruluiw(0) = 0 si x0 aleasa ca mai sus ceea ce contrazice ipoteza ca (131) este unestimator pentru sistemul (A,B,C,D).

Observatii: a) Dimensiunea unui estimator de tip Luenberger (de tip 1) este egalacu n (dimensiunea spatiului starilor sistemului orginal (A,B,C,D)). Asa cum vomvedea mai tarziu, in anumite situatii se pot construi estimatoare de dimensiune mai


mica si se poate formula problema de constructie a unui estimator de dimensiuneminimala (legata de teoria estimatoarelor de tipul 2).b) Am vazut ca un sistem poate fi stabilizat/alocat cu o reactie constanta dupastare. Deoarece starea nu este in general cunoscuta am construit mai sus un sistem(numit estimator) care estimeaza asimptotic starea sistemului pe baza informatiilorfurnizate de semnalele de intrare u si de iesire y. Intrebarea naturala este dacaputem stabiliza/aloca sistemul original prin implementarea reactiei constante dupastarea estimata x (in locul starii reale x care nu este accesibila) ? Raspunsul estepozitiv obtinandu-se compensatorul Kalman.


5. Compensatorul Kalman

Fie (A,B,C,D) un sistem dinamic si presupunem pentru problema de stabilizarecu reactie dinamica dupa iesire ca (A,B) este stabilizabila si (C,A) este detectabilaiar pentru problema cu alocare dinamica dupa iesire ca (A,B) este controlabila si(C,A) este observabila.

Consideram un compensator cu reactie constanta F dupa starea estimata de catreun estimator Luenberger descris de ecuatiile (136). Obtinem atunci ecuatiiledinamice ale compensatorului – numit compensator Kalman –{

˙x = (A+ LC)x+Bu+ LDu− Ly,u = Fx,

(137)

sau inca {˙x = (A+ LC +BF + LDF )x− Ly,u = Fx,

(138)

CAPITOLUL 4: SINTEZA ELEMENTARA 178 Compensatorul Kalman

avand matricea de transfer

K(s) :=

[AK BK

CK DK

]=

[A+ LC +BF + LDF −L

F O

], u = Ky.

Matricile F si L se aleg a.i. A + BF si A + LC sa fie asimptotic stabile (sieventual cu spectru impus).

Conectand compensatorul Kalman in reactie inversa cu sistemul original obtinempentru matricea de stare a sistemului rezultant in bucla inchisa

AR =

[A BF

−LC A+BF + LC

].

Aplicand transformarea de similaritate

T :=

[I O−I I

]CAPITOLUL 4: SINTEZA ELEMENTARA 179 Compensatorul Kalman

asupra lui AR obtinem

TART−1 =

[A+BF BF

O A+ LC

]ceea ce arata ca dinamica (polii) sistemului in bucla inchisa satisfac

Λ(AR) = Λ(A+BF ) ∪ Λ(A+ LC)

si deci sistemul in bucla inchisa este intern asimptotic stabil (si eventual aredinamica prescrisa).

Observatii: a) Polii sistemului in bucla inchisa sunt dati de reuniunea polilor alocatiai lui A+BF prin reactia dupa stare F cu polii alocati de estimator Λ(A+ LC)prin reactia L. Cele doua alocari se pot face independent, punandu-se astfel inevidenta celebrul principiu al separatiei.b) Un sistem este stabilizabil/alocabil prin reactie (dinamica) dupa iesire daca


perechea (A,B) este stabilizabila/controlabila si perechea (C,A) este de-tectabila/observabila. Aceste conditii sunt nu numai suficiente ci si necesareasa cum reiese din urmatoarea teorema.Teorema 48. Un sistem (A,B,C,D) este stabilizabil/alocabil prin reac-tie dinamica dupa iesire daca si numai daca perechea (A,B) este stabiliz-abila/controlabila si perechea (C,A) este detectabila/observabila.

Demonstratie. Suficienta a fost demonstrata constructiv mai sus. Ramane saaratam necesitatea (Exercitiu !). Indicatie: Pp prin reducere la absurd ca nueste adevarat si puneti in evidenta printr-o descompunere controlabila/observabilaanumiti poli ficsi ai sistemului rezultant (ce nu pot fi modificati indiferent dereactia dupa stare.


6. Estimatori de Stare de Ordin Redus (Tip 2)

Fie un sistem (A,B,C,D) cu m intrari, p iesiri si ordinul n (dimensiunea spatiuluistarilor). Daca dorim estimarea starii acestui sistem nu este nevoie sa construim unestimator care sa estimeze direct toate cele n stari intrucat o parte dintre acestearezulta automat pe baza iesirilor. Intr–adevar, sa presupunem ca C are rangul egalcu numarul de iesiri p. Atunci cunoscand iesirea y(t) si estimand numai n− p starirezulta ca celelate p stari se pot calcula din ecuatiile corespunzatoare ale iesirii.Un astfel de estimator de ordin redus se numeste estimator de tipul 2.

Pentru constructia estimatorului de tipul 2 facem ipotezele:i) Matricea C este epica, i.e., rankC = p;ii) Matricea C are forma

C =[O Ip

]. (139)

Observatii: a) Ipoteza i) nu constituie o restrictie majora intrucat o putem asigurain etapa de modelare printr-o alegere judicioasa a iesirilor sistemului. In cazul in

CAPITOLUL 4: SINTEZA ELEMENTARA 182 Estimatori de Ordin Redus

care prin modelare nu s-a asigurat indeplinirea ei se poate face o schimbare devariabile in spatiul marimilor de iesire punandu–se in evidenta anumite iesiri identiczero sau redundante ce pot fi eliminate ramanand o matrice C ce satisface ipoteza.b) Ipoteza ii) se poate asigura printr–o simpla transformare de coordonate inspatiul starilor (presupunand evident ipoteza i) adevarata) !c) Rationand prin dualitate, in anumite circumstante matricea intrarilor B se poate

presupune monica si de forma

[ImO

].

d) Ipotezele i) si ii) implica ca

y = Cx+Du =[O Ip

] [ x1

x2

]+Du = x2 +Du

deci starile x2 – in numar de p – sunt automat cunoscute (prin cunoastereaintrarilor si iesirilor) si raman de estimat starile x1 – in numar de n− p.

Asa cum am vazut, pentru constructia unui estimator general (131) trebuie sa


satisfacem relatiileΛ(J) ⊂ C−,

JV +HC − V A = 0,KV +NC − I = 0,

(celelalte relatii fiind automat satisfacute prin alegerea lui P si M). Pentru aexplicita aceste relatii, partitionam matricile A, B, V , K, N conform cu C in(139),

A =

[A1 A3

A2 A4

], B =

[B1

B2

], V =

[V1 V2

],K =

[K1

K2

], N =

[N1

N2

]si obtinem

V1A1 + V2A2 = JV1, V1A3 + V2A4 = JV2 +H,{K1V1 = I, K1V2 +N1 = 0,K2V1 = 0, K2V2 +N2 = I.

Alegem K1 := V1 := I si rezulta automat K2 = 0, N2 = I, N1 = −V2 ceea ce


determina complet matricile K si N , ramanand de satisfacut doar conditiile

A1 + V2A2 = J, Λ(J) ⊂ C−, H = A3 + V2A4 − (A1 + V2A2)V2. (140)

Daca perechea (A1, A2) este detectabila (observabila) atunci putem alege automatV2 := L unde L este reactia care aloca Λ(A1 + LA2) ⊂ C− iar H se defineste pebaza ultimei ecuatii din (140).

Ramane sa aratam ca perechea (A1, A2) este detectabila daca sunt indepliniteconditiile de existenta ale unui estimator general, i.e. perechea (C,A) estedetectabila. Formulam acest rezultat sub forma unei propozitii de sine statatoare.Teorema 49. Fie un sistem (A,B,C,D) avand matricea C epica.i) Exista o transformare de coordonate a.i.

TAT−1 =

[A1 A3

A2 A4

]}n− p}p︸︷︷︸︸︷︷︸

n− p p

,


TB =

[B1

B2

]}n− p}p , CT−1 =

[O Ip

],︸︷︷︸︸︷︷︸

n− p p

(141)

ii) Perechea (A2, A1) este detectabila (observabila) daca si numai daca perechea(C,A) este detectabila (observabila).

Demonstratie. i) Intrucat C este epica de dimensiune p × n, exista o matrice Cde dimensiune (n− p)× n a. i. matricea

T :=

[CC

]

sa fie inversabila. Avem evident[CC

]T−1 =

[In−p OO Ip

]CAPITOLUL 4: SINTEZA ELEMENTARA 186 Estimatori de Ordin Redus

de unde concluzionam ca CT−1 are forma din (141).ii) Avem succesiv

rank

[sI −A

C

]= rank

[T (sI −A)T−1

CT−1

]= rank

sI −A1 −A3

−A2 sI −A4

O Ip

= p+ rank

[sI −A1

A2

], ∀s ∈ C

de unde concluzia rezulta direct din criteriul Hautus de detectabilitate (observabil-itate).

In concluzie am obtinut pentru un estimator de tipul 2 urmatoarea constructie:Pasul 0: Dandu-se sistemul (A,B,C,D) cu perechea (C,A) detectabila (observ-abila) si matricea C epica, se gaseste cf. Teoremei 49 o transformare de similaritate


T a.i. in noul sistem de coordonate sa avem (refolosind notatiile)

A =

[A1 A3

A2 A4

]}n− p}p︸︷︷︸︸︷︷︸

n− p p

, (142)

B =

[B1

B2

]}n− p}p , C =

[O Ip

],︸︷︷︸︸︷︷︸

n− p p

in care perechea (A2, A1) este detectabila (observabila).Pasul 1: Se foloseste procedura de alocare pentru perechea (A2, A1) si se determinao matrice V2 a.i. A1 + V2A2 sa aibe spectrul dorit (un anumit spectru impus saudoar localizat in C− in functie de cerinta de proiectare).Pasul 2: Se calculeaza estimatorul cu parametrii

J = A1 + V2A2, H = A3 + V2A4 −A1V2 − V2A2V2, M = B1 + V2B2 −HD,


K =

[In−p

O

], N =

[−V2

Ip

], V =

[In−p V2

], P =

[V2D−D

]rezultand w(t) = (A1 + V2A2)w(t) +Hy(t) + (B1 + V2B2 −HD)u(t),

x(t) =

[x1(t)x2(t)

]=

[In−p

O

]w(t) +

[−V2

Ip

]y(t) +

[V2D−D

]u(t).

(143)Pasul 3: Se “reverseaza” corespunzator transformarea de similaritate asupraestimatorului, obtinandu-se in final un estimator de tip 2 pentru sistemul original.Observatii: a) Estimatorul de tip 2 obtinut are ordinul egal cu n− p (dimensiuneaspatiului starii w(t)).b) Ecuatia iesirii pentru estimatorul de tip 2 (143) contine o parte de dimensiunen− p ce este estimata prin intermediul dinamicii w(t) de forma

x1(t) = w(t)− V2y(t) + V2Du(t)


si o parte ce este deja cunoscuta de dimensiune p (nu se estimeaza prin intermediuldinamicii) de forma

x2(t) = y(t)−Du(t).

De obicei in ecuatiile dinamice ale estimatorului de tip 2 se pastreaza numai primaparte (x1(t)).c) Din cele de mai sus rezulta ca in ipoteza (C,A) detectabila si C epicaputem intotdeauna construi un estimator de ordin n − p (dimensiunea matriciiJ). Problema naturala care se pune este daca pe baza acestui estimator putemconstrui in continuare un compensator care stabilizeaza intern – exact cum amfacut in cazul estimatorului de tip 1 obtinand compensatorul Kalman.

Interpretarea Estimatorului de Tip 2 (Ordin Redus)

Estimatorul de tip 2 poate fi obtinut si prin scrierea directa a unui estimator detip 1 pentru partea starii ce trebuie efectiv estimata. Intr–adevar, cu notatiile dejaintroduse avem ca sistemul original este descris de ecuatiile (pentru simplificarea


calculelor facem ipoteza D = 0)

x1 = A1x1 +A3x2 +B1u,x2 = A2x1 +A4x2 +B2u,y = x2

(144)

si inlocuind ultima ecuatie in precedentele doua avem

x1 = A1x1 +A3y +B1u,x2 = y = A2x1 +A4y +B2u,

sau inca

x1 = A1x1 +A3y +B1u,y −A4y −B2u = A2x1,

(145)

care este un sistem cu dinamica x1 ce se doreste estimata si intrarile u si y.


Reamintim ca un estimator de tip 1 se poate pune sub forma

˙x = Ax+Bu+L(Cx+Du−y) = Ax+Bu+L×“EROAREA DE ESTIMARE”.(146)

Scriind un astfel de estimator pentru sistemul (145) obtinem

˙x1 = A1x1 +A3y +B1u+ L(A2x1 − y +A4y +B2u). (147)

Eliminam y facand schimbarea de variabile x1 = w − Ly si notam V2 := L.Obtinem echivalent

w−V2y = A1(w−V y)+A3y+B1u+V2(A2(w−V2y)− y+A4y+B2u) (148)

sau inca

w = (A1 + V2A2)w+ (−A1V2 +A3 − V2A2V2 + V2A4)y+ (B1 + V2B2)u. (149)


Din ultima ecuatie din (144) obtinem[x1

x2

]=

[In−p

O

]w +

[−V2

Ip

]y. (150)

Comparand ecuatille (149), (150) cu ecuatille (143) observam ca acestea coincidin ipoteza facuta D = 0. In consecinta am reobtinut expresia estimatorului de tip2 scriind un estimator de tip 1 pentru susbsisemul cu dinamica ce trebuie efectivestimata x1 !Exercitiu: Aratati acelasi lucru fara a face ipoteza D = 0 !

Stabilizarea cu Estimatoare Generale

Am vazut ca daca folosim o schema de compensare cu reactie constanta F dupastarea estimata printr-un estimator de tip 1 se obtine un compensator Kalmancare stabilizeaza intern sistemul si eventual aloca o dinamica dorita. Aratam incontinuare ca o schema similara in care insa estimarea se face cu un estimatorgeneral se poate deasemenea folosi pentru stabilizare/alocare.


In particular, in cazul in care estimarea se face cu un estimator de ordin redus (detipul 2) sistemul rezultant va avea dimensiunea spatiului starilor de dimensiuneredusa (< 2n).

Fie un sistem {x = Ax+Bu,y = Cx+Du,

(151)

si un estimator general descris de ecuatiile

{w = Jw +Hy +Mu,x = Kw +Ny + Pu,

(152)

ce satisface automat conditiile:a) J asimptotic stabila;b) JV +HC − V A = 0;c) M − V B +HD = 0;d) KV +NC − I = 0;


e) P +ND = 0.

Consideram o schema de compensare cu reactie constanta F dupa starea estimatax, i.e.,

u = Fx. (153)

Studiem comportarea dinamica in bucla inchisa a sistemului descris de (151), (152)si (153). Evaluam intai

Ny + Pu = NCx+NDu−NDu = NCx, (154)

unde am folosit proprietatea e). Avem succesiv

x = Ax+Bu = Ax+BFx = Ax+BF (Kw +Ny + Pu)= Ax+BFKw +BFNCx = (A+BFNC)x+BFKw

(155)


in care am folosit (154). Pentru dinamica w obtinem

w = Jw +Hy +Mu = Jw +HCx+HDu+MF (Kw +NCx)= (HC +MFNC)x+ (J +MFK)w +HDu

(156)

in care am folosit succesiv (153) si (154). Evaluam separat

HDu = HDFx = HDF (Kw +NCx) = HDFNCx+HDFKw

pe care il inlocuim in (156) obtinand

w = (HC +MFNC +HDFNC)x+ (J +MFK +HDFK)w. (157)

Din (155) si (157) avem ca dinamica sistemului rezultant este data de

˙[xw

]=

[A+BFNC BFK

HC + (M +HD)FNC J + (M +HD)FK

] [xw

]CAPITOLUL 4: SINTEZA ELEMENTARA 196 Estimatori de Ordin Redus

si deci matricea de stare a sistemului rezultant este

AR =

[A+BFNC BFK

HC + V BFNC J + V BFK

]in care am folosit proprietatea c). Pentru a pune in evidenta spectrul acesteimatrici facem o transformare de coordonate

T =

[I O

−V I

]si obtinem

TART−1 =

[A+BFNC +BFKV BFK−V A+HC + JV J

]=

[A+BF BFK

O J

],

unde pentru ultima egalitate am folosit proprietatile d) si b). Din relatia de maisus concluzionam ca

Λ(AR) = Λ(A+BF ) ∪ Λ(J)


si deci Λ(AR) ⊂ C− daca alegem F a.i. Λ(A+BF ) ⊂ C−.Observatii: a) Daca (A,B) controlabila atunci putem aloca orice spectru pentruA + BF si daca (C,A) observabila atunci putem aloca orice spectru pentruestimator Λ(J) rezultand ca putem aloca orice dinamica pentru sistemul rezultantin bucla inchisa.b) Ordinul sistemului rezultant este n+ ne unde ne este ordinul estimatorului.


7. Reglarea Sistemelor Dinamice

Problematica, Ipoteze

In aceasta sectiune abordam problema reglarii sistemelor dinamice. Problemaclasica de reglare intern stabila consta in gasirea unui regulator care sa realizezesimultan urmatoarele deziderate asupra sistemului rezultant in bucla inchisa:

(S) Sa fie intern asimptotic stabil;

(Re) Sa urmareasca (macar) asimptotic anumite semnale (sau clase de semnale)prescrise numite referinte r;

(Rj) Sa rejecteze (macar) asimptotic anumite perturbatii d sau zgomote w; (FIG).

Solutia generala a problemei de reglare intern stabila are o serie de inconvenientemajore:

CAPITOLUL 4: SINTEZA ELEMENTARA 199 Reglarea Sistemelor Dinamice

(i) Este foarte complicata;

(ii) Este bazata pe geometria interna a sistemului original si pe o serie de descom-puneri structurale sofisticate in spatiul starilor;

(iii) Conditiile de solvabilitate sunt in general greu de verificat dpdv procedural;

(iv) Solutia generala este complet nerobusta in raport cu perturbatiile paramet-rice sau structurale ale modelului (A,B,C,D) limitand major aplicabilitateametodelor la cazul sistemelor cu dimensiuni medii sau relativ mari.

In continuare vom prezenta solutia in anumite cazuri particulare insa de mareinteres practic in care neajunsurile de mai sus sunt partial eliminate prin ipotezelefacute. Ne restrangem la prezentarea unei solutii in caz particular deoarece:

• Efortul de a prezenta/intelege solutia completa (in intreaga ei complexitate) nuse justifica in general in raport cu clasa aplicatiilor concrete ”real–life”;


• Solutia generala este nerobusta;

• Exista abordari alternative bazate pe teoria sistemelor robuste ce furnizeazasolutii mult mai fezabile;

Ipotezele pe care le facem sunt:

(I1) d = 0 (nu apar perturbatii);

(I2) w = 0 (nu apar zgomote);

(I3) D = 0 (ipoteza facuta ptr. simplificarea calculelor);

(I4) r(t) = 1(t) (referintele sunt semnale de tip treapta).

Conditiile de reglare asimpotic stabila


Incepem prin a explicita conditiile pe care trebuie sa le indeplineasca sistemul inbucla inchisa pentru a realiza dezideratele (S) si (Re) sub ipotezele (I1)-(I3). Infinal, vom introduce principiul modelului intern pentru sistemele descrise pe spatiulstarilor si vom particulariza constructia efectiva a unui regulator in ipoteza (I4) –care realizeaza urmarirea asimptotica a unor referinte de tip treapta –.

PROBLEMA: Dandu–se sistemul dinamic

x = Ax+Buy = Cx

(158)

avand m intrari, p iesiri si dimensiunea spatiului starilor n, si vectorul de semnalede referinta r(t) ∈ Rp, se cere un sistem dinamic (regulator)

xK = AKxK +BKϵu = CKxK +DKϵ,

(159)

in care ϵ = r − y, astfel incat sa aibe loc:


(S) Sistemul in bucla inchisa sa fie intern asimptotic stabil;

(Re) Iesirile y sa urmareasca asimptotic referintele r(t), i.e.,

limt→∞

ϵ(t) = 0.

Clasa semnalelor referinta se considera de tip persistent generate de un generatorliniar de semnal (de tipul celor introduse la studiul regimului permanent/tranzitoriu)

xr = Arxr xr(0) = xro, Λ(Ar) ⊂ C− ∪ C0

r = Crxr.(160)

Referintele vor avea atunci expresia

r(t) = CreArtxro.


Eliminand succesiv semnalele din bucla si tinand cont ca ϵ = r − y = r − Cxobtinem

xK = AKxK +BKr −BKCxu = CKxK +DKr −DKCx.

(161)

Inlocuind ultima ecuatie in x = Ax+Bu obtinem succesiv

x = Ax+B(CKxK +DKr −DKCx) = (A−BDKC)x+BCKxK +BDKr

si deci pentru sistemul in bucla inchisa obtinem ecuatiile dinamice

˙[xxK

]=

[A−BDKC BCK

−BKC AK

] [xxK

]+

[BDK

BK

]r

ϵ =[−C O

] [ xxK

]+ Ipr

y =[C O

] [ xxK

] (162)


sau

xR = ARxR +BRrϵ = CRxR +DRr,

(163)

unde

AR =

[A−BDKC BCK

−BKC AK

], BR =

[BDK

BK

], CR =

[−C O

], DR = Ip, xR =

[xxK

].

(164)Conditia (S) de stabilitate interna devine atunci

Λ(AR) ⊂ C−

si explicitam in continuare conditia de reglare (Re). Combinand ecuatiile sistemuluiin bucla inchisa (163) cu cele ale generatorului de semnale de referinta (160)


obtinem

˙[xR

xr

]=

[AR BRCr

O Ar

] [xR

xr

], xR(0) = xRo, xr(0) = xro,

ϵ =[CR Cr

] [ xR

xr

] (165)

sauxRr = ARrxRr, xRr(0) = xRro,ϵ = CRrxRr

(166)

unde am folosit notatiile

ARr =

[AR BRCr

O Ar

], CRr =

[CR Cr

], xRr =

[xR

xr

], xRro =

[xRo

xro

].

(167)Conditia de reglare (Re)

limt→∞

ϵ(t) = 0, ∀ xRro


devine atunci

limt→∞

CRreARrtxRro = 0, ∀ xRro. (168)

Observatie fundamentala: Aceasta cerinta nu poate fi realizata prin impunereaconditiei ca matricea de stare ARr sa fie intern asimptotic stabila deoarece ARr

contine valori proprii care sunt sigur in C+ ∪ C0 (semnalul r a fost presupuspersistent)! Singura posibilitate pentru a satisface conditia de (Re) ramanesa impunem ca dinamica care nu este stabila sa fie neobservabila in raport cuperechea (CRr, ARr) si acest lucru sa-l satisfacem prin alegerea judicioasa aparametrilor regulatorului ce se regasesc implicit in parametrii sistemului rezultant(AR, BR, CR, DR) ! In consecinta conditia de reglare implica satisfacerea anumitorproprietati structurale relativ sofisticate in spatiul starilor sistemului rezultant !

Pentru a satisface conditia (Re) trebuie sa impunem deci conditia ca subspatiulinvariant asociat dinamicii Ar sa fie neobservabil in perechea (CRr, ARr) explicitatain (167). O baza pentru subspatiul invariant corespunzator lui Ar – notat V+ are


evident expresia

V+ =

⟨[VInr

]⟩unde V este o matrice ce se determina din conditia ca V+ sa fie neobservabil.Facand o completare pana la o transformare inversabila obtinem

S =

[InR

VO Inr

]de unde

S−1ARrS =

[AR ARV +BRCr − V Ar

O CRV + Cr

], CRrS =

[CR CRV + Cr

]iar in noul sistem de coordonate avem

V+ =

⟨[OInr

]⟩.


Din conditia ca V+ este ARr invariant si inclus in KerCRr se obtin conditiile

ARV +BRCr − V Ar = 0, CRV + Cr = 0. (169)

Deci existenta unei matrici V care satisface relatiile (169) este echivalenta cusatisfacerea cerintei de reglare (Re) explicitata sub forma (168).

Observatie: Prima conditie (169) este o ecuatie Sylvester ce are intotdeauna osolutie unica deoarece Λ(AR) ⊂ C− si Λ(Ar) ⊂ C+ ∪ C0 (Explicati acest lucrupe baza conditiilor generale de existenta/unicitate a solutiilor ecuatiilor Sylvester –vezi Appendix).

In concluzie am redus problema originala de reglare intern asimptotic stabila lagasirea unui sistem (AK, BK, CK, DK) a.i. :

(S) Λ(AR) ⊂ C−;

(Re) Solutia unica V a ecuatiei Sylvester ARV + BRCr − V Ar = 0 sa satisfacaCRV + Cr = 0.


Observatie: Tinand cont de expresiile explicite ale matricilor sistemului in buclainchisa (AR, BR, CR, DR) ca functii de parametrii regulatorului (AK, BK, CK, DK)(vezi (164)) este clar ca aceste conditii algebrice nu sunt deloc triviale sau usor deexplicitat intr-o forma procedurala. De aceea ne vom limita la prezentarea cazuluireprezentativ al referintelor de tip treapta.

Reglarea la Referinte Treapta

Fie sistemul (A,B,C,D = 0) avand matricea de transfer T (s) si y = Tu. Facemipotezele ca (A,B) este stabilizabila si (C,A) este detectabila, conditii ce suntnecesare si suficiente pentru existenta unui compensator stabilizator.

Considerand o schema clasica de reglare cu regulatorul K(s) montat pe caleadirecta intre eroare ϵ := r − y si comanda u, i.e., u = Kϵ.

Conform principiului modelului intern, pentru a regla la referinte de tip treaptatrebuie ca modelul referintei M(s) sa fie inclus in matricea de transfer in bucladeschisa, in cazul nostru L(s) := T (s)K(s). Mai exact, cum T (s) este dat,


impunem ca modelul referintei sa fie inclus in

K(s) = K(s)M(s) (170)

unde M(s) este matricea de transfer a modelului referintei. Aceasta conditieasigura automat cerinta de reglare (Re). Daca consideram reglarea la referintatreapta atunci

M(s) =1

sIp.

Pentru a asigura cerinta (S) trebuie ca regulatorul K(s) sa stabilizeze intern T (s)

sau, echivalent, ca K(s) sa stabilizeze intern T (s) = M(s)T (s) (FIG) – K(s)

are o parte fixata R(s) pe care o includem in T (s) –. In consecinta proiectam

un compensator stabilizator K(s) pentru T (s) dupa care regulatorul dorit secalculeaza din (170).

Explicitam in continuare aceste conditii in termenii ecuatiilor dinamice de stare.


FiexM = AMxM +BMϵy = CMxM +DMϵ

(171)

sau incaxM = AMxM +BM(r − Cx)y = CMxM +DM(r − Cx)

(172)

ecuatiile ce descriu dinamica modelului referintei si

x = Ax+Bu,y = Cx,

ecuatiile ce descriu sistemul. O realizare de stare pentru sistemul T cu y = T u seobtine automat inseriind T (s) cu M(s) (semnalul exogen r = 0)

T =

[A B

C D

]=

A O B−BMC AM O

O CM O

. (173)


Deci problema s-a redus la constructia unui compensator pentru T dat de (173).

In cazul particular in care dorim reglarea la referinte de tip treapta avem AM = 0,BM = Ip, CM = Ip, DM = 0 si (173) devine

T =

[A B

C D

]=

A O B−C O OO Ip O

. (174)

Pentru scrierea unui compensator stabilizator pentru T putem aplica schemastandard de scriere a unui compensator Kalman (sau orice schema de stabilizare

cu estimator de stare si reactie dupa starea estimata). Intrucat matricea C esteepica preferam sa scriem un estimator de ordin redus si sa luam o reactie dupastarea estimata obtinand in final un sistem compensator de ordin mai mic decatT (s) (si de acelasi ordin cu T (s)).

Pentru scrierea unui estimator de ordin redus folosim direct formulele (143)


observand in prealabil ca realizarea (174) este in forma (142) si facand identificarile

A =

[A O−C O

]=

[A1 A3

A2 A4

], B =

[BO

]=

[B1

B2

], C =

[O Ip

].

Conditia necesara si suficienta pentru existenta unui estimator este ca perechea(A2, A1) = (−C,A) sa fie detectabila ceea ce este automat asigurat in ipotezele de

lucru ((C,A) este detectabila). Fie L = −L a.i. Λ(A+LC) = Λ(A− LC) ⊂ C−.Obtinem pentru ecuatiile estimatorului de ordin redus

w = (A+ LC)w + (A+ LC)Ly +Bu,

x =

[x1

x2

]=

[In−p

O

]w +

[LIp

]y.

(175)

Un compensator stabilizator se obtine atunci luand o reactie stabilizanta dupa


starea estimata de forma

u =[F F

] [x1

x2

]= F (w + Ly) + F y. (176)

O astfel de reactie stabilizanta exista daca si numai daca perechea (A, B) estestabilizabila. Acest lucru nu este insa automat indeplinit decat daca facem ipotezaca modelul referintei (polii s = 0) nu este simplificat de modelul sistemului T (s) !(Ex: faceti conexiunea cu sistemele SISO – trebuie ca diag {1s} sa apara in fctia detransfer in bucla deschisa si deci nu trebuie sa se simplifice in produsul L = TK–. O conditie suficienta ca sa nu apara aceasta simplificare este ca sistemul T sanu aibe zerouri in s = 0 ceea ce este asigurat de impunerea conditiei

rank

[−A −BC O

]= n+ p. (177)

Intr-adevar, daca (A,B) stabilizabila si are loc (177) atunci (A, B) este stabilizabila(Ex: Demonstrati acest lucru folosind criteriul PBH).


Deci in ipotezele (A,B) stabilizabila, (C,A) detectabila si (177) exista un com-pensator stabilizator care se obtine luand o reactie dupa starea estimata prinintermediul unui estimator de ordin redus pentru sistemul T . Ecuatiile compen-satorului sunt

w = (A+ LC)w + (A+ LC)Ly +Bux1 = w + Lyx2 = y

u = F (w + Ly) + F y

(178)

sau eliminand w prin inlocuire din a doua ecuatie si inlocuind u in prima ecuatieobtinem

˙x1 = (A+ LC +BF )x1 ++BF x2 + Lϵ˙x2 = ϵ

u = Fx1 + F x2

(179)

unde am tinut cont ca y = x2 si ˙x2 = ϵ. Deci un compensator stabilizator pentru


T (s) este dat de

K(s) =

[AK BK

CK DK

]=

A+ LC +BF BF LO O I

F F O

. (180)

A ramas de verificat ca intr–adevar acest compensator (regulator) asigura de faptreglarea. Acest lucru se arata verificand conditiile de reglare (169)

ARV +BRCr − V Ar = 0, CRV + Cr = 0

in care Ar = O, Cr = I. Aceasta este echivalent cu a arata ca solutia ecuatiei

ARV = −BR

verifica CRV = −Ip. Inlocuind expresiile lui AR, BR si CR cu datele obtinute


rezulta dupa partitionarea corespunzatoare a lui V

(ARV =)

A BF BF

−LC A+BF + LC BF−C O O

V1

V2

V3

=

O−L−Ip

(= −BR)

(181)si

(CRV =)[−C O O

] V1

V2

V3

= −Ip. (182)

Inspectand ultima relatie observam ca este identica cu ultima ecuatie din (181) sideci daca V verifica (181) atunci automat verifica si (182). In final, V exista sieste unic intrucat AR este inversabila (Λ(AR) ⊂ C− asa cum rezulta din teoriastabilizarii cu compensatoare de ordin redus).

Procedura de reglare la referinta treapta cu compensare asimptotic intern stabila

– Exercitiu –


TSA Global

Documents

TSA Global