Propriedades de filtros lineares para sistemas …...filtros H2, [1], [35], filtros robustos, veja por exemplo [31], os filtro s de Butterworth, filtros de Chebyshev e filtros

Propriedades de filtros lineares para sistemas lineares com saltos markovianos a tempo discreto

Maria Josiane Ferreira Gomes

Propriedades de filtros lineares para sistemas lineares com saltos markovianos a tempo discreto

Maria Josiane Ferreira Gomes

Orientador: Prof. Dr. Eduardo Fontoura Costa

Tese apresentada ao Instituto de Ciências Matemáticas

e de Computação - ICMC-USP, como parte dos

requisitos para obtenção do título de Doutor em

Ciências - Ciências de Computação e Matemática

Computacional. VERSÃO REVISADA.

USP – São Carlos

Maio de 2015

SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP

Data de Depósito:

Assinatura:________________________

______

Ficha catalográfica elaborada pela Biblioteca Prof. Achille Bassi e Seção Técnica de Informática, ICMC/USP,

com os dados fornecidos pelo(a) autor(a)

FFG633Pp

Ferreira Gomes, Maria Josiane Propriedades de filtros lineares para sistemaslineares com saltos markovianos a tempo discreto /Maria Josiane Ferreira Gomes; orientador Eduardo Fontoura Costa. -- São Carlos, 2015. 71 p.

Tese (Doutorado - Programa de Pós-Graduação emCiências de Computação e Matemática Computacional) -- Instituto de Ciências Matemáticas e de Computação,Universidade de São Paulo, 2015.

1. Sistemas lineares com saltos markovianos. 2.Filtragem Linear. I. Fontoura Costa, Eduardo ,orient. II. Título.

À Gisele A. Bráz de Lima

(in memorian)

”Amigo é coisa pra se guardar

Debaixo de sete chaves,

Dentro do coração ... ”

Milton Nascimento.

Agradecimentos

Expressarei em poucas linhas minha gratidão àqueles que de alguma forma estiveram

presentes e que muito me ajudaram em meu caminho até aqui.

À Deus, pela constante e amorosa presença.

À minha família, que sempre me deu suporte de forma incondicional em todos os aspec-

tos possíveis durante meus estudos.

À Letricia e Luciano, pela lealdade, amizade e atenção.

Ao Prof. Dr. Eduardo Fontoura Costa, pela amizade, competência, seriedade e pela

forma generosa com que compartilhou seus conhecimentos nestes anos de trabalho.

Ao CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico, pelo su-

porte financeiro. Processo no. 142174/2010− 6.

À FAPESP - Fundação de Amparo à Pesquisa do Estado de São Paulo, pelo apoio finan-

ceiro não menos importante. Processo no. 2013/19380− 8.

À todos os professores e funcionários do Instituto de Ciências Matemáticas e de Compu-

tação da Universidade de São Paulo.

Meus sinceros agradecimentos.

iii

Resumo

Este trabalho é dedicado ao estudo do erro de estimação em filtragem linear para

sistemas lineares com parâmentros sujeitos a saltos markovianos a tempo discreto. Indro-

duzimos o conceito de alcançabilidade média para uma classede sistemas. Construímos

um conjunto de matrizes de alcançabilidade e mostramos que oconceito usual de alcan-

çabilidade definido através da positividade do gramiano é caracterizado pela definição por

posto completo destas matrizes. A alcançabilidade média funciona como condição neces-

sária e suficiente para positividade do segundo momento do estado do sistema, resultado

esse que auxilia na caracterização da positividade uniforme da matriz de covariância do

erro de estimação. Abordamos a estabilidade de estimadorescom a interpretação de que

a covariância do erro permanece limitada na presença de errode qualquer magnitude no

modelo do ruído, que é uma característica relevante para aplicações. Apresentamos uma

prova de que filtros markovianos são estáveis sempre que o segundo momento condicio-

nado é positivo. Exemplos numéricos encontram-se inclusos.

Palavras-chave:Sistemas lineares com saltos markovianos, alcançabilidade média, po-

sitividade, filtros lineares, estabilidade de filtros markovianos.

v

Abstract

This work studies linear filtering for discrete-time systems with Markov jump para-

meters. We introduce a notion of average reachability for these systems and present a set

of matrices playing the role of reachability matrices, in the sense that their rank is full if

and only if the system is average reachable. Reachability is also a sufficient condition for

the second moment of the system to be positive. Uniform positiveness of the error cova-

riance matrix is studied for general (possibly non-markovian) linear estimators, relying

on the state second moment positiveness. Stability of linear markovian estimators is also

addressed, allowing to show that markovian estimators are stable whenever the system is

reachable, with the interpretation that the error covariance remains bounded in the pre-

sence of error of any magnitude in the model of the noise, which is a relevant feature for

applications. Numerical examples are included.

Keywords: Linear systens with jumping parameters, average reachability, positivity, li-

near estimators, markovian filters satability.

vii

viii

Sumário

1 Introdução 1

1.1 Terminologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Abordagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Interpretação física e detalhes técnicos . . . . . . . . . . . .. . . . . . . . 5

1.4 Organização do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Notações, definições e resultados preliminares 9

2.1 Notações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.1 Propriedades usuais do valor esperado . . . . . . . . . . . . .. . . 10

2.2 Cadeia de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2.1 Propriedades da cadeia de Markov . . . . . . . . . . . . . . . . . .12

2.3 Sistemas lineares com saltos markovianos . . . . . . . . . . . .. . . . . . 13

2.3.1 Segundo momento dex(k) . . . . . . . . . . . . . . . . . . . . . . 15

2.4 Filtros lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.5 Filtros lineares markovianos . . . . . . . . . . . . . . . . . . . . . .. . . 17

3 M-alcançabilidade e matrizes de M-alcançabilidade 19

3.1 M-alcançabilidade, gramiano e matrizes de M-alcançabilidade . . . . . . . 19

3.1.1 Propriedades doKerRℓ,i(k) . . . . . . . . . . . . . . . . . . . . 22

3.2 O Teorema do posto completo . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4 Positividade do segundo momento 31

4.1 Resultados auxiliares e ordenação de matrizes . . . . . . . . .. . . . . . . 31

ix

Sumário

4.1.1 Matrizes de M-alcançabilidade e segundo momento . . . .. . . . . 32

4.1.2 Ordenação de matrizes . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2 Positividade do processoX(k) . . . . . . . . . . . . . . . . . . . . . . . . 34

5 Positividade do processo de erro do estimador 39

5.1 Positividade do processo Y(k) . . . . . . . . . . . . . . . . . . . . . .. . 39

5.2 M-alcançabilidade e cadeias ergódicas . . . . . . . . . . . . . .. . . . . . 46

5.2.1 Exemplos ilustrativos . . . . . . . . . . . . . . . . . . . . . . . . . 46

6 Estabilidade de filtros lineares markovianos 49

6.1 Exemplos ilustrativos . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 57

7 Conclusão 59

Referências Bibliográficas 66

x

Lista de Figuras

2.1 Representação da cadeia de Markov com três estados.. . . . . . . . . . . 11

5.1 Calculo dos valoresvEX(k)v′ (denotada com) e covariância do erro de

estimaçãovEY (k)v′ (denotada por×) . . . . . . . . . . . . . . . . . . . 47

5.2 Cálculo dos valores devEX(k)v′ (denotada com) e covariância do erro

de estimaçãovEY (k)v′ (denotada por×) . . . . . . . . . . . . . . . . . 47

6.1 Estimação da Covariância de erro de Exemplo 6.1.EY k(D,E,Σ) (deno-

tada com) eEY k(D,B,Ψ) (detotada com×). . . . . . . . . . . . . . . 57





xi

Lista de Figuras

xii

Lista de Símbolos

E(·) Valor esperado

O(·) Notação de Landau

E,Σ Valores nominais

B,Ψ Valores reais

(A,E, P ) SLSM com valores nominais e matriz de transiçãoP

(A,B, P ) SLSM com valores reais e matriz de transiçãoP

Xkt (Σ, B) Covariância do estadox(k) para os valores nominaisE eΣ no intervalo de

tempo[t, k]

Xk(Σ, B) Covariância do estadox(k) para os valores nominaisE eΣ no intervalo de

tempo[0, k]

Y kt (D,E,Σ) Covariância do erro de estimação para os valores nominaisE eΣ no inter-

valo de tempo[t, k]

Y kt (D,B,Ψ) Covariância do erro de estimação para os valores reaisB eΨ no intervalo

de tempo[t, k]

Y k(D, ·, ·) Covariância do erro de estimação no intervalo de tempo[0, k]

σ1(A) Raio espectral de uma matriz A

xiii

Lista de Símbolos

xiv

CAPÍTULO

1

Introdução

Neste capítulo, apresentamos o cenário de estudo no qual desenvolvemos o trabalho,

descrevemos as motivações e estratégias na elaboração dos principais resultados.

Sistemas de controle vêm, há décadas, empregando filtros lineares, também chamados de

estimadores lineares ou observadores lineares de estado. Estes filtros são recursivos, apre-

sentando uma dinâmica linear que se baseia na dinâmica da planta e em alguns parâmetros

ajustados para, por exemplo, garantir erro de estimação limitado, ou erro de estimação ótimo.

Em particular, a teoria de filtragem ótima vem ganhando destaque em diversas áreas de pes-

quisa, o que a torna cada vez mais relevante. Desde o desenvolvimento do filtro de Kalman,

na década de 60, os problemas tem se tornado cada vez mais complexos e estão presentes

em um vasto número de aplicações, dentre as quais, podemos citar aplicações em engenha-

ria, telecomunicações, robótica e processamento de sinais. Dada a importância do assunto,

é natural o avanço de pesquisas envolvendo a teoria de filtragem. Destacam-se os estudos

envolvendo o filtro de Kalman, que é ótimo na classe dos estimadores lineares, [29], [41],

sendo clássicas as referências [2] e [51]. Citam-se também osfiltros derivados, filtrosH∞,

filtros H2, [1], [35], filtros robustos, veja por exemplo [31], os filtros de Butterworth, filtros

de Chebyshev e filtros elípticos, veja [2]. Os argumentos paraconcentrar-se em filtragem

linear são os da aplicabilidade e facilidade de tratamento matemático.

Várias aplicações de filtros encontram-se disponíveis na literatura de sistemas dinâmicos

1

Capítulo 1 Introdução

e atualmente a teoria a seu respeito é bastante completa. Este é o caso dos sistemas lineares

determinísticos invariantes no tempo (SLD) e mesmo dos sistemas determinísticos variantes

no tempo. Contudo, o desenvolvimento de aplicações da teoriade filtragem é menos de-

senvolvida para sistemas cujos parâmetros sejam alteradosde maneira aleatória, como é o

caso dos chamados sistemas lineares sujeitos a saltos markovianos (SLSM), que como ve-

remos adiante, são sistemas lineares que apresentam mudanças abruptas de comportamento.

As mudanças abruptas apresentadas pelos SLSM são ”indexadas” por uma variávelθ(k) e

podem ser devidas a perturbações ambientais, falha de um componente ou reparos, altera-

ções em subsistemas conectados, modificações no ponto de operação para uma planta não

linear. Exemplos dessas situações podem ser encontrados, por exemplo, em economia, con-

trole aéreo, controle de receptores solares, manipuladores robóticos, estruturas para estações

espaciais, etc, [15], [24], [28], [38]. O leitor pode encontrar diversos resultados interessantes

sobre SLSM nos livros [25], [21] e [34].

Neste trabalho abordaremos, num primeiro cenário, filtros lineares gerais para sistemas

lineares com saltos markovianos (SLSM). Em seguida, consideraremos filtros lineares mar-

kovianos, os quais possuem a propriedade de que o estimador éum SLSM, ou seja, no

instante de tempok os ganhos e parâmetros dependem somente deθ(k) (e não de toda a

realização deθ) veja [? ]. O estimador linear de mínimo erro médio quadrático desenvol-

vido em [18], [27], [30], [23] é um dos de maior interesse, pois são ótimos na classe dos

sistemas lineares markovianos. Em qualquer um desses filtros, a matriz de covariância do

erro de estimação forma um processo estocástico, aqui denotado porY (k). Alguns aspectos

relevantes do processo de erro são ainda largamente inexplorados. Destaca-se que a autora

não tem conhecimento sobre trabalhos anteriores que tenhamconsiderado uma caracteriza-

ção da positividade uniforme deY (k) em termos da estrutura do SLSM em tempo discreto.

Igualmente, não há resultados sobre estabilidade de filtros; estabilidade é um tema relevante,

uma vez que em situações práticas filtros instáveis podem causar a divergência da covari-

ância do erro de estimação, mesmo com uma mudança infinitesimal na estatística do ruído.

Sucintamente, estabilidade exige que a covariância do erroseja limitada, mesmo quando há

perturbações no sistema, como descreveremos adiante.

Alguns resultados preliminares estão apresentados em um artigo de conferência [39], no

entanto, naquele trabalho abordamos somente estabilidadedo filtro de Kalman no contexto

dos SLSM com cadeia ergódica e com perturbação apenas na condição inicial, bem mais

simples de tratar; resultado análogo para SLSM a tempo contínuo encontram-se em [45]. A

2

-

estabilidade do filtro de Kalman para sistemas lineares variantes no tempo possui um estudo

mais amplo, veja [8], [46], [47] e [50]. Vale ressaltar que [9] contém resultados sobre a

existência de limitantes superiores para o processo de erropara SLSM (sem as perturbações

nas matrizes do processo de ruído aditivo), consequentemente, a estabilidade não é abordada.

Levando em conta o exposto acima, o trabalho aqui apresentado, aborda dois temas cen-

trais, a positividade deY e a estabilidade do estimador. Destaca-se também o conceitode

alcançabilidade média (M-alcançabilidade), que é uma das principais condições de traba-

lho. Apresentamos a seguir uma descrição um pouco mais detalhada dos resultados e da

abordagem utilizada.

1.1 TerminologiaConsidere um filtro na forma

x(k + 1) = Aθ(k)x(k) +G(k)[y(k)− Cθ(k)x(k)],

sendoy(k) a variável observada (medida a partir do sistema real, geralmente usando sen-

sores) ex(k) a estimativa para a variávelx(k), que é uma componente do estado de um

SLSM. A variávelθ(k) é o estado de uma cadeia de Markov homogênea no tempo, e cada

vez que esta variável assume um valor, por exemploθ(k) = i, então temosAθ(k) = Ai e

Cθ(k) = Ci, sendoAi eCi conhecidos, tomadas de um conjunto de matrizes. A matrizG(k)

é chamada de ganho do filtro, geralmente projetada para atender algum critério sobre o erro

de estimação.

Em aplicações reais de controle, muitas vezes acabamos projetando o filtro com base

nos parâmetrosE,Σ da planta e acabamos operando em condições diferentes, com parâ-

metrosB,Ψ substituindoE,Σ. Por exemplo, isso ocorre quando a planta tem uma varia-

ção inesperada durante a operação (possivelmente por envelhecimento), ou quando o pro-

jeto deG(k) envolve erros numéricos (como é comum em computadores). O ganho não

é recalculado. Em cenários como este, é comum que a covariância do erro de estimação

Y k(B,Ψ) = E(x − x)(x − x)′, aqui também denomidada processo de erro, apresente

rápida divergência dos valores verdadeiros.

Também estamos interessados na positividade do erro de estimação, em parte pela im-

portância para o estudo de estabilidade. Definimos estes conceitos fundamentais a seguir; a

notaçãoY k(B,Ψ) é usada para deixar claro que se trata do erro de estimação sobos parâ-

metros ’reais’B,Ψ.

3


Definição 1.1 (Positividade)Dizemos que o processo de erro é positivo em média quando

existemλ > 0 eK ≥ 0 tais queEY k(B,Ψ) − λI é uma matriz positiva definida,k ≥ K.

Definição 1.2 (Estabilidade)Dizemos que um filtro é estável se, para quaisquerΨ e B

existe uma matrizP tal queEY k(Ψ, B) − P é uma matriz negativa definitiva.

1.2 AbordagemA abordagem adotada neste trabalho é descrita a seguir. Introduzimos o conceito de

M-alcançabilidade, o qual envolve uma condição de positividade do gramiano. Em seguida

construímos um conjunto de matrizesRℓ,i, denominado matrizes de alcançabilidade e esta-

belecemos condições para um teste de completude de posto. A abordagem, nesta parte do

trabalho, é semelhante a encontrada por exemplo em [10], [11] e [12], referente a observa-

bilidade fraca. Mostram-se que o teste do posto caracterizaa positividade do gramiano de

alcançabilidade, Teorema 1. Em seguida, estudamos a positividade da covariância de estado

e covariância do erro de estimação no cenário de SLSM e filtroslineares gerais. De fato,

provamos que alcançabilidade é uma condição necessária e suficiciente para que o segundo

momento condicionado dex(k), Ex(k)x(k)′|θ(k) = i seja limitado inferiormente por

βI para algum escalar positivoβ, para estados de Markov recorrentes ek suficientemente

grande, como apresentado na Proposição 4.1. Isto implica napositividade deEx(k)x(k)′,

o que significa que o ruído excita, em média, todos os estados do sistema. O resultado é

então estendido para o processo de erro do filtroY (k), estabelecendo no Corolários 5.2 e

Corolário 5.3 queEY (k) é positivo parak grande o suficiente, com a interpretação de que

a estimativa nunca é precisa (não há componente ou projeção que coincida comx).

A análise de estabilidade é realizada para a subclasse de sistemas lineares composta de

filtros lineares markovianos. Com o objetivo de consolidar uma condição de estabilidade,

ajusta-se a condição de alcançabilidade requerendo a positividade deEx(k)x(k)′|θ(k) = ipara todoi (não somente para estados de Markov recorrentesi). Vale ressaltar que esta

condição pode ser testada numericamente, como oportunamente explicado e é obviamente

recorrente da alcançabilidade quando a cadeia de Markov é ergódica.

A análise de estabilidade é realizada por um método direto, através da avaliação e com-

paração do processo de erro com e sem perturbações nas matrizes de covariância do ruído.

Assumimos que o o filtro seja calculado para valores nominais, o qual é caracterizado por

certas matrizes de covariânciaEi e Σ, em substituição dos valores reais do sistema,Bi e

4

1.2 - Abordagem

Ψ, respectivamente. Adicionalmente incluímos a hipótese deque a covariância do erro de

estimação nominal no instante de tempok, aqui denotada porY k(E,Σ), k ≥ 0 tenha valor

esperado limitado,EY k(E,Σ) ≤ P , uma condição suficiente para esta hipótese seja ver-

dadeira é a detetabilidade estocástica do sistema, veja [6]. Mostra-se de forma construtiva

que M-alcançabilidade e a limitação deEY k(E,Σ) ≤ P são condições suficientes para

que exista um limitante superior uniforme no tempo paraEY k(B,Ψ). A maior dificuldade

encontrada está na obtenção da uniformidade na limitação doprocesso de erro. A construção

da prova exigiu a introdução de uma recursão no valor esperado, veja Lema 6.1, e na com-

paração e ordenação de valores deY (k) envolvendo matrizes de ruído que excitam todas as

direções do sistema, Corolário 6.1 e Lema 6.2. O resultado de estabilidade está apresentado

no Teorema 3 e Corolário 6.2.

1.3 Interpretação física e detalhes técnicos

A interpretação física que norteia as construções das provas apresentadas neste trabalho

envolve as relações entre o comportamento da variável de estado e a evolução do estimador.

Quando a variável de estadox é completamente ruidosa, não é possível que um filtro linear

elimine ruído, logo a covariância do erro de estimação também torna-se ruidosa.

A excitação por ruídos completos é fundamental para revelarqualquer dinâmica instá-

vel durante o desenvolvimento do projeto do filtro - se existir uma dinâmica instável,Y (k)

cresce indefinidamente, evidenciando a instabilidade do estimador já durante o projeto. As-

sim, não haveriam dinâmicas instáveis ocultas (que pode acontecer com SLSM que não são

M-alcansáveis).

Embora a interpretação dos principais resultados sejam relativamente simples, como des-

crito acima, os detalhes técnicos e as avaliações necessárias são complexas. As principais

dificuldades são as expostas a seguir. Por um lado, como não estamos exigindo ergodicidade

da cadeia de Markov, a existência de estados transientes e diferentes conjuntos irredutíveis

de estados recorrentes faz com que a análise e notação sejam inevitavelmente complexas. As

principais dificuldades técnicas, no entanto, vem do fato deque estamos considerando per-

turbações no ruído aditivo da variável de estadox. Isto exige que busquemos positividade

em sentido uniforme do valor esperado do processo de erro, ambos com relação ao estado

x, no sentido de que existaγ satisfazendoEY (k)|θ(k) > γI (γ é uniforme para todos

os valores dek ≥ K1 para um certoK1). Isto torna algumas passagens mais complexas

que em casos nos quais não é necessário que exista uniformidade. Um exemplo é o Teo-

5


rema 2, no qual comparamosY comX, generalizando a conhecido fato de que o filtro não

é capaz de eliminar ruído, mostrando que erros de estimação pequenos implicam em erros

pequenos na variávelx, ou mais precisamente, para qualquerǫ ≥ 0, sev′Y (k)v < ǫ‖v‖2

entãov′X(k)v < hk(ǫ)‖v‖2, onde a funçãohk éO(ǫ1

2k ), referindo-se a notação de Landau.

Surgem também dificuldades técnicas quando comparamos o processo de erro (sob pertur-

bações e sem perturbações), uma vez que podemos compará-lossomente em valor esperado

condicionado, exigindo a criação de uma recursão para o valor esperado condicionado do

processo do erro, como no Lema 6.1. Este resultado nos permite relacionar, algebricamente,

o conceito de M-alcançabilidade com a limitação do processode erro, estabelecendo a estabi-

lidade, Teorema 3 e Corolário 6.2. Este resultado é válido somente para filtros markovianos,

pelas razões expostas na Observação 4.

1.4 Organização do texto

O texto está organizado da seguinte forma: o Capítulo 2 apresenta as notações utilizadas

ao longo do texto, algumas hipóteses e definições, bem como a base da teoria de SLSM

e filtragem. O objetivo deste capítulo, além de apresentar a teoria básica, é padronizar e

estabelecer foco para o entendimento sobre o apresentado posteriormente. Este capítulo

não apresenta nenhum resultado novo sobre a teoria, apenas detalha pontos relevantes já

conhecidos e que se fazem necessários no trabalho.

O Capítulo 3 introduz a noção de gramiano de alcançabilidade eo conjunto das matrizes

de alcançabilidade. Este capítulo também apresenta algunsresultados auxiliares envolvendo

o núcleo das matrizes de alcançabilidade, os quais são utilizados no principal resultado do

capítulo, o Teorema do posto completo, que fornece um teste para alcançabilidade média.

Com o objetivo de obter resultados de positividade, introduzimos no Capítulo 4 matrizes

similares às matrizes de alcançabilidade, desenvolvemos propriedades de ordenção, carac-

terizamos a relação entre alcançabilidade e segundo momento do estado e provamos que

alcançabilidade média é uma condição necessária e suficiente para que a matriz de covariân-

cia do segundo momento seja positiva em valor esperado.

A positividade do processo de erro é de grande interesse neste estudo, sendo apresen-

tada no Capítulo 5. Em virtude dos resultados obtidos não serem extensões diretas dos

resultados dos capítulos anteriores, mas serem desenvolvidos por construção, optou-se pela

apresentação de resultados de ordenção para realizações dacadeia de Markov e em seguida,

extendemos o resultado para o caso mais geral, M-alcançabilidade é condição suficiente para

6

1.4 - Organização do texto

positividade do valor esperado do processo de erro, Corolário 5.2 e Corolário 5.3.

Desenvolvemos, finalmente, os resultados de estabilidade no Capítulo 6. A estratégia

para obter uma prova de que M-alcançabilidade é condição suficiente para estabilidade está

na manipulação de limitantes inferiores e superiores do processo de erro. Construímos um

limitante superior uniforme para o processo de erro real, este procedimento exige a utilização

de um resultado envolvendo uma espécie de recursão do valor esperado da covariância do

erro de estimação, Lema 6.1. Enfim, mostramos que M-alcançabilidade é condição suficiente

para estabilidade de filtros markovianos no contexto de cadeias de Markov ergódicas. O

Capítulo 6 também ilustra os resultados obtidos, a partir da apresentação e discussão de

exemplos.

As conclusões sobre o trabalho desenvolvido, com o destaquede suas principais inova-

ções, são discutidas ao longo do Capítulo 7.

7


8

CAPÍTULO

2

Notações, definições e resultados

preliminares

Neste capítulo, apresentamos resultados básicos a serem utilizados no decorrer do texto.

O critério para a inclusão ou não de cada um destes neste capítulo baseou-se na importância

de cada um para compreensão do estudo. Apresentamos provas para aqueles que não são

facilmente encontrados na literatura ou que de alguma formatenha sido modificado para se

enquadrar ao trabalho. Apresentamos também provas para os resultados cujas demonstra-

ções trazem algum argumento técnico que seja relevante em algum ponto do texto. O leitor

interessado somente nas contribuições inéditas do trabalho poderia omitir a leitura deste ca-

pítulo.

2.1 Notações

Nesta seção introduzimos as notações utilizadas no decorrer do texto. Algumas notações

adicionais serão acrescentadas posteriormente de acordo com a necessidade de adequação

ao contexto ou visando o melhor entendimento do leitor.

Denota-se o espaço euclidiano n-dimensional porRn, R+ o conjunto dos números re-

ais positivos eZ+ o conjunto dos números inteiros.Mr,s (respectivamenteMr) o espaço

linear normado formado por todas as matrizes reaisr × s (respectivamenter × r). As-

9

Capítulo 2 Notações, definições e resultados preliminares

sumaMr0(Mr+) o cone convexo fechadoU ∈ Mr | U = U ′ ≥ 0, (o cone aberto

U ∈ Mr | U = U ′ > 0), ondeU ′ denota a matriz transposta deU ; U−V ≥ 0 (U−V > 0)

significaU − V ∈ Mn0 (U − V ∈ Mn+). NN,r,s = U = (U1, U2, . . . , UN ), N ∈ Z+,

denota o espaço linear normado formado por sequências de matrizes reaisUi ∈ Mr,s, i ∈S = 1, 2, . . . , N, tal que paraU, V ∈ NN,r,s, U + V = Ui + Vi, i ∈ S, U ≥ V

denotaUi ≥ Vi para todoi ∈ S e similarmente para qualquer operação envolvendo termos

pertencentes aNN,r,s. Quando o conjuntoNN,r é formado porUi ∈ Mr0 (Ui ∈ Mr+)

para todoi = 1, 2, . . . N , denotamosNN,r0 (NN,r+). E· denota o valor esperado de uma

variável aleatória,P(·) uma medida de probabilidade,I denota a matriz identidade de di-

mensão apropriada eI = I, I, . . . , I ∈ NN,r. O símbolo‖ · ‖ denota todas as normas sub

multiplicativas de vetores e matrizes.1· é a função indicadora. Denotamos a cardinalidade

de um conjuntoA porCard(A).

A Notação doO maíusculo (A letraO é utilizada devido ao fato da taxa de crescimento

de uma função ser denominada ordem), conhecida como símbolode Landau , é um simbo-

lismo utilizado em ciência da computação e matemática para descrever o comportamento

assintótico de funções. Basicamente, informa o quão rápido uma função cresce ou declina.

Por exemplo, poderíamos dizer quef(n) cresce com ordemn2 e escreverf(n) = O(n2),

veja [5].

2.1.1 Propriedades usuais do valor esperado

Destacamos aqui algumas propriedades usuais de valor esperado que serão consideradas

no decorrer do texto.

Para quaisquer variáveis aleatóriasA,B,C ∈ Mr,s, tem-se as seguintes propriedades

para o valor esperado:

1) SeA ≥ B, entãoEA ≥ EB.

2) SeA ≥ B, entãoECAC ′ ≥ ECBC ′.

3) Linearidade :E(αA+ βB) | C = αEA | C+ βEB | C, α, β ∈ R.

4) EA = EEA | B.

Para SLSM, como veremos nos próximos capítulos, o aparecimento de termos com com-

portamento estocástico, induz a necessidade de introduzirferramentas da teoria de probabi-

lidades para obtenção de conclusões consideradas em termosdo valor esperado. Faremos

10

2.1 - Notações

p11p12

p13

p21p22

p23p31p32

p33

1 2

3

Figura 2.1:Representação da cadeia de Markov com três estados.

uso das propriedades descritas acima de forma indiscriminada, referenciando-as somente em

casos nos quais o resultado não seja direto.

2.2 Cadeia de MarkovRecentemente os SLSM tem atraído uma atenção considerável, em parte devido ao fato

de que fornecem modelos convenientes para aplicações que secaracterizam por mudanças

bruscas de comportamento, como frequentemente encontrados em controle de rede e em

outros campos, veja por exemplo [23], [34], [37] e [38].

Para melhor entender os sistemas lineares com saltos markovianos, considere um sistema

que apresenta mais de um modo de operação, como uma sub-classe de sistemas lineares cha-

veados, quando as comutações formam um processo estocástico. Sistemas como os descritos

acima, alteram seu modo de operação de acordo com uma cadeia de Markov, isto é, a pro-

babilidade deste mover-se de um estado a outro depende unicamente do seu modo atual.

Considere ainda que sejam conhecidas todas estas probabilidades de transição do estadoi

paraj. A Figura 2.1 traz a representação de um sistema obedecendo uma cadeia de Markov

com três modos.

Formalmente, considera-seΩ um espaço amostral e um processo estocásticoθ =

[θn, n ∈ N] com espaço de estados enumerávelS, isto é, para cadan ∈ N eω ∈ Ω, θn(ω) é

um elemento deS, veja [4].

Definição 2.1 O processo estocásticoθ = [θn | n ∈ N] é chamado uma cadeia de Markov

desde que

P(θn+1 = j | θ0, . . . , θn) = P(θn+1 = j | θn), ∀j ∈ S, n ∈ N.

11


Denota-se uma cadeia de Markov porΘ = θ(k), k ≥ 0. Neste trabalho consideramos

o espaço de estado tomando valores no conjunto finitoS.

Para cada estado existe uma probabilidade, as quais podem ser dispostas em um vetor

π, denominado vetor de probabilidades de estados (para distingui-las das probabilidades de

transição). A conexão com a matriz de probabilidade é como segue

π(0) = π0 e π(r) = π(r − 1)P, 1 ≤ r ≤ N,

ondeP = pij = Pθ(k + 1) = j | θ(k) = i é a matriz de probabilidade de transição da

cadeia de Markov. Dizemos que uma cadeia de Markov é homogênea quandoP(θ(k+ 1) =

j | θ(k) = i) é independente dek, ou seja, as probabilidades de transição não mudam ao

longo do tempo.

2.2.1 Propriedades da cadeia de Markov

Considere a cadeia de Markov aperiódica discreta no tempoΘ. Assume-se, sem perda

de generalidades, que a matriz de probabilidade de transição assume a seguinte forma, veja

[4, Proposition 3.8, Theorem 3.14],

P =

P1

P2

. . .

Pr

O1 O2 . . . Or Q

. (2.1)

Denota-se porSℓ, ℓ = 1, 2, . . . , r os conjuntos de estados de Markov correspondentes a cada

matriz de probabilidadePℓ e define-seRP =⋃r

ℓ=1 Sℓ, card(Sℓ) = Nℓ e card(RP ) = N .

É conhecido que cadaSℓ é um conjunto irredutível fechado de estados recorrentes e desde

que a cadeia seja aperiódica, pode-se mostrar quePℓ é a matriz de probabilidade de uma

cadeia de Markov ergódica. Além disso, as distribuições de estado para uma cadeia ergódica

possuem limitantes na formaι < P(θ(k)) < κ, k ≥ K0, para algum0 < κ ≤ 1, 0 < ι < κ,

eK0 ∈ Z+ (o qual geralmente depende deι, κ), de forma que estes limitantes sejam válidos

para cadaSℓ. Esta propriedade pode ser facilmente extendida paraΘ, levando ao resultado

na Proposição 2.1.

Para dar contexto ao resultado seguinte, destacamos que parte do estudo é feita em pe-

12

2.2 - Cadeia de Markov

ríodos de tempo finito, motivando a caracterização da distribuição da cadeia de Markov em

um intervalo de tempo específico. O resultado é uma adaptaçãode [4, Theorem 3.2].

Proposição 2.1Existem0 < κ ≤ 1, 0 < ι < κ eK0 ∈ Z+ tais que, para cada1 ≤ ℓ ≤ r,

ιP(θ(N) ∈ Sℓ) ≤ πi(k) ≤ κP(θ(N) ∈ Sℓ), ∀k ≥ K0 +N, i ∈ Sℓ.

ParaK0 como considerado acima, definimos a seguinte constante, a qual será empregada

em todo o texto,

K1 = K0 + n2N +N. (2.2)

Introduzimos a seguinte noção de estados alcançáveis.

Definição 2.2 Dadoπ(0) = π, considere o conjunto

Rπ = i ∈ RP | ∃ j0, . . . , jm e pj0j1 , pj1j2 , . . . , pjmi > 0, πj0 > 0 (2.3)

de estadosθ que podem ser alcançados a partir de estados iniciais com probabilidade posi-

tiva.

2.3 Sistemas lineares com saltos markovianosNesta seção, apresentamos e descrevemos brevemente algumas das propriedades dos

sistemas lineares com saltos markovianos, dos quais tratamos no trabalho. Consideram-se

SLSMs em termos discretos e de dimensão finita.

Os SLSMs são sistemas cuja dinâmica muda abruptamente em instantes de tempo in-

determinados e comportam-se como sistemas lineares nos demais instantes. As alterações

repentinas na dinâmica do sistema são denominados saltos e referem-se a mudanças em pa-

râmetros do sistema, as quais ocorrem de acordo com uma cadeia de Markov subjacente.

Desta forma, os SLSM são sistemas dinâmicos estocásticos, cuja propriedade característica

é que cada salto não conserva a memória dos instantes de tempodecorridos e somente o

estado no instante atual pode influênciar no comportamento do sistema no instante seguinte.

Neste Trabalho, abordamos exclusivamente o caso em que o processo de Markov subjacente

percorre um conjunto de estados discreto finito.

13


A motivação para o estudo deste tipo de sistema decorre do fato de que grande parte dos

sistemas de controle são baseados em modelos matemáticos deprocessos a serem controla-

dos, os quais podem ser descritos, por exemplo, por modelos de sistemas lineares invarantes

no tempo, mas um grande número está sujeito a mudanças incertas em sua dinâmica. Se

essa mudança é abrupta, tendo pouca influência no comportamento do sistema, uma análise

clássica de sensibilidade do sistema pode fornecer uma avaliação adequada dos efeitos. No

entanto, quando as variações causadas pelas mudanças transformam o comportamento do

sistema de forma significativa, é preferível um modelo estocático que apresente a indicação

da probabilidade relativa dos vários cenários possíveis. Para ilustrar a situação, considere um

sistema dinâmico que é, em um determinado momento, bem representado por um modelo

Φ1. Suponha que este modelo esteja sujeito a mudanças que torneeste modelo, após um

período de tempo, em um modelo diferente, digamosΦ2. Com este mesmo raciocínio pode-

mos considerar que o sistema esteja sujeito a uma série de possíveis mudanças qualitativas

que transformem o sistema em outro sistema pertencente a um conjunto finito de modelos

Φ1,Φ2, . . . ,ΦN. Podemos associar cada um dos modelos a um modo de operação dosis-

tema ou a apenas saltos de um modo para outro, ou que existe umatransição entre os modos.

Assumimos neste trabalho que os saltos do sistema descrito acima evoluem de acordo com

uma cadeia de Markov, isto é, dado que em um certo instante de tempok o sistema per-

manece em um estadoi, sabe-se que a probabilidade de salto para qualquer um dos outros

modos, e também a probabilidade de permanecer no modoi, depende somente do modo de

operação no instante de tempo atual. Tais sistemas são denominados sistemas lineares com

saltos markovianos e o estado de Markov (ou modo de operação)será denotado porθ(k).

Para uma caracterirazação mais completa veja [24].

A seguir, apresentamos a formulação do sistema linear a tempo discreto com saltos mar-

kovianos que consideraremos no trabalho.

Considere que a cadeia de Markov homogêneaΘ = θ(k) | k ≥ 0 assume valores em

S, sendo caracterizada pela matriz de probabilidadesP = [pij, i, j ∈ S], com distribuição

de probabilidade inicialP(θ(k) = i) = πi(k), i ∈ S.

SejaAi ∈ HN,n, Bi ∈ HN,n,q, Ci ∈ HN,r,n e Di ∈ HN,r,q. Consideramos o SLSM

14

2.3 - Sistemas lineares com saltos markovianos

definido em um espaço de probabilidade(Ω,F,Fk,P) como sendo:

ΦM :

x(k + 1) = Aθ(k)x(k) + Bθ(k)w(k),

y(k) = Cθ(k)x(k) +Dθ(k)v(k), k ≥ 0,

x(0) = x0, θ(0) = θ0,

(2.4)

assume-seDiD′i > 0 (ruído não singular). O par(x(k), θ(k)) é a variável de estado, onde

x(k) ∈ Rn é a variável de estado contínua, comx(0) uma variável aleatória de média nula

satisfazendoEx(0)x(0)′ = Ψ e θ(k) ∈ S é a variável de estado discreta.y(k) ∈ Rr é a

variável de observação,w(k) ∈ Rp e v(k) ∈ R

q formam ruídos estocásticos estacionários

independentes, com média nula e satisfazendoEw(k)w(k)′ = I, Ev(k)v(k)′ = I.

Assume-se também quex(0), w(k) ev(k) são mutuamente independentes. Assume-se

observação das variáveis de saída e de estado discreto, ou seja, as informações disponíveis

no instante de tempok ≥ 0 são dadas porFk = y(0), θ(0), . . . , y(k), θ(k). Denota-se

Θk = x0, θ(0), . . . , θ(k). Para demais aspectos do SLSM, referênciam-se [15], [24], [28],

[21], [38].

São diversas as aplicações para SLSM, dentre as quais citamos a área de aeronáutica

[3], modelos macroeconômicos [32] e receptores térmicos [49]. Muitos resultados teóricos

estão presentes na literatura de SLSM, dentre os quais destacamos [16], [17], [19], [22],[28],

[21], [33], [43], [44] e [48]. Aspectos sobre como os SLSM generalizam sistemas lineares

discretos podem ser encontrados em [13] e [37].

2.3.1 Segundo momento de x(k)

O segundo momento do estadox(k) está ligado às matrizes de M-alcançabilidade, como

veremos no Capítulo 3, sendo fundamental no desenvolvimentode resultados de positividade

relacionados à estabilidade.

Introduzimos o processo estocástico no espaçoMn dado por

X(k + 1) = Aθ(k)X(k)A′θ(k) + Bθ(k)B

′θ(k),

X(t) = Ψ, k ≥ t ≥ 0.(2.5)

Com o objetivo de enfatizar a dependência das variáveisB e Ψ, denotamosX(k) por

Xkt (Ψ, B) ou porXk(Ψ, B) quandot = 0. Os sistemasX(k) e x(k) estão ralacionados

como abaixo, veja [9, Proposition 1].

15


Proposição 2.2Considere o sistemaΦM em (2.4) eX(k) definido em (2.5). Então

Ex(k)x′(k) | Θk = Xk(B,Ψ).

2.4 Filtros lineares

Problemas de filtragem são de interesse não só por causa de seugrande número de aplica-

ções, mas também por ser o principal passo para estudar problemas com observações parciais

sobre a variável de estado. Atualmente existem diversos estudos envolvendo filtragem. En-

tre as ferramentas matemáticas significativas que podem serutilizadas para a estimativa de

processos estocásticos, uma das mais conhecidas e frequentemente utilizadas é o filtro de

Kalman. Com poucas ferramentas computacionais, o filtro de Kalman é atualmente muito

utilizado.

Neste trabalho, consideramos filtros lineares dados porx(0) = 0 e

x(k + 1) = Aθ(k)x(k) +G(k)[y(k)− Cθ(k)x(k)], (2.6)

assume-se que o ganho do filtro é uma função do tempo e deΘk, isto é,

G(k) = g(k, x(0), θ(0), . . . , θ(k)), (2.7)

para alguma funçãog (que pode ser trivial em alguns de seus argumentos).

Definimosx(k) = x(k)− x(k), k ≥ 0 e obtemos de (2.4) e (2.6) que

x(k + 1) = (Aθ(k) −G(k)Cθ(k))x(k) + Bθ(k)w(k)−G(k)Dθ(k)v(k). (2.8)

A covariância do erro de estimaçãoY ∈ Mn é definida por

Y k(D,B,Ψ) = Ex(k)x′(k)|Θk.

DadosU ∈ NN,r,q eV ∈ NN,n,p, considere

Υk(U, V ) = G(k)Uθ(k)U′θ(k)G

′(k) + Vθ(k)V′θ(k), (2.9)

A covariância do erro de estimaçãoY k(D,B,Ψ) pode ser escrita como na proposição a

16

2.4 - Filtros lineares

seguir.

Proposição 2.3

Y (k + 1) = (Aθ(k) −G(k)Cθ(k))Y (k)(Aθ(k) −G(k)Cθ(k))′ +Υk(D,B),

Y (t) = Ψ, k + 1 ≥ t ≥ 0.(2.10)

Veja [9], [47]. Similarmente a (2.5), denotamosY (k) porY kt (D,B,Ψ), ouY k(D,B,Ψ),

quandot = 0.

Observação 1Observe que o filtro é definido de forma similar ao utilizado para sistemas

lineares variantes no tempo, [7], entretanto note que as informaçõesFk permitem o cálculo

deY (k) eG(k) no instante de tempok (implementações off-line, nas quais os ganhosL(k)

calculados a priori não são considerados), como em [9]. Note também que as variáveis

Y (k) eG(k) estão em função das variáveis aleatóriasθ(0), θ(1), . . . , θ(k), de maneira que

formam processos estocásticos, requerendo que as covariâncias sejam estudadas em valor

esperado.

Observação 2SeBi é de posto completo, então o ruído acarreta uma excitação persistente

e completa na dinâmica do filtro, note que de(2.10), Y k(D,B,Ψ) ≥ mini(σ1(BiB′i))I.

Isto pode levar à divergência deEY k(D,B,Ψ) (ao passo que seria limitada seB = Ψ),

revelando dinâmicas instáveis.

Em virtude do fato de que as dinâmicas em (2.10) são estocásticas, estudarEY (k) é

uma questão bastante complexa. Uma condição bastante óbviapara se obter a limitação de

EY (k,B,Ψ) é a de queEY (k, E,Σ) seja limitada.

Suposição 1[Limitação] ExisteP ∈ Mn0 tal queEY (k) < P, ∀ k ≥ 0.

A homogeneidade da cadeia de Markov é relevante na prova de resultados que exijam

translações no tempo, generalizações (noções de uniformidade) e induções no tempo; conse-

quentemente, é necessária a introdução da noção de filtros homogêneos no tempo, conceito

similar à homogeneidade da cadeia. Assumimos que o filtro linear é homogêneo no tempo

no seguinte sentido.

P(Y k(Y (0) = Ψ)|θ(0) = j, θ(k) = i)

= P(Y k+t(Y (t) = Ψ)|θ(t) = j, θ(k + t) = i).(2.11)

17


2.5 Filtros lineares markovianos

Neste trabalho estudamos também características e propriedades teóricas de filtros mar-

kovianos, os quais possuem a propriedade de que o sistema de malha fechada é novamente

um SLSM, veja [? ]. Uma desvantagem dos filtros lineares na forma (2.6)-(2.7)é que os

ganhos exigem cálculos on-line, que é muitas vezes difícil erestringe aplicações computa-

cionais. Uma maneira de superar essa dificuldade é a de considerar a subclasse de filtros

lineares markovianos, cujos ganhos são da forma

G(k) = g(k, θ(k))

e são selecionados a partir de uma sequência de conjuntos de matrizesHi(k), tomando

G(k) = Hθ(k)(k)

em cada momentok. A sequênciaH é projetada independentemente da realização da cadeia

de Markov, com base apenas nas informações disponíveis antes da operação do sistema,

como apresentado por exemplo em [26], [? ] e [20].

A covariância do erro de estimação é dada pela soluçãoY (k) de (2.10). Ao lidar com

filtros markovianos, será conveniente expressarY (k) decomposto em soluções homogêneas

e soluções forçadas de (2.13), como segue.

O processo dado por (2.10) satisfaz:Y tt (0, 0,Ψ) = Ψ,

Y kt (0, 0,Ψ) = (Aθ(k) −Hθ(k)(k)Cθ(k)) . . . (Aθ(t) −Hθ(t)(t)Cθ(t))Ψ

× (Aθ(t) −Hθ(t)(t)Cθ(t))′ . . . (Aθ(k) −Hθ(k)(k)Cθ(k))

′,(2.12)

e

Y kt (D,B,Ψ) = Y k

t (0, 0,Ψ) +k∑

ℓ=t+1

Y kℓ (0, 0,Υℓ−1(D,B)) . (2.13)

Dada uma sequênciaθ(0), θ(1), . . . , θ(k), k ≥ 0, tem-se

Y k(D,B,Ψ) = Y kt (0, 0, Y

t(D,B,Ψ)) +k∑

ℓ=t+1

Y kℓ (0, 0,Υℓ−1(D,B)) , (2.14)

18

2.5 - Filtros lineares markovianos

dessa forma, a fim de expressar a recursãoY (k) no intervalo de tempo[t, k], quando conve-

niente, denotaremos

Y k(D,B,Ψ) = Y kt (D,B, Y t(D,B,Ψ)), k ≥ t > 0. (2.15)

Como exemplo de filtro markoviano, citamos o estimador linearde mínimo erro médio

quadrático desenvolvido em [23], que são ótimos na classe dos sistemas lineares markovia-

nos.

19


20

CAPÍTULO

3

M-alcançabilidade e matrizes de

M-alcançabilidade

Neste capítulo introduzimos o conceito de alcançabilidademédia (M-alcançabilidade).

Inicialmente apresentamos uma definição de alcançabilidade envolvendo a positividade do

gramiano. Em seguida, introduzimos um conjunto de matrizesRℓ,i, ℓ = 1, 2, . . . , r, i ∈Sℓ, o qual definimos como sendo o conjunto das matrizes de alcançabilidade, o qual se

assemelha ao conjunto de matrizes de alcançabilidade de SLD. Resultados relacionados à

dimensão deRℓ,i são incluídos. Apresentamos, também, propriedades envolvendo o núcleo

das matrizesRℓ,i. Enfim, desenvolve-se o principal resultado do capítulo: cada matriz do

conjunto de matrizes de M-alcançabilidade é de posto completo se e somente se o sistema

é M-alcançável, estabelecendo um paralelo com o teste de M-alcançabilidade para sistemas

lineares determinísticos.

3.1 M-alcançabilidade, gramiano e matrizes de

M-alcançabilidade

Alcançabilidade é um conceito clássico na teoria dos sistemas lineares, todavia não se

encontra na literatura o desenvolvimento do conceito para SLSM. Por ser uma propriedade

que possibilita controle sobre os estados do sistema (alcançabilidade implica em controlabi-

21

Capítulo 3 M-alcançabilidade e matrizes de M-alcançabilidade

lidade, mas a recíproca não é sempre verdadeira. Controlabilidade implica em alcançabili-

dade somente se as matrizes consideras são inversíveis), surge o questionamento de como a

alcançabilidade poderia afetar o processo de erro gerado por estimadores.

Com o objetivo de firmar o conceito de alcançabilidade no contexto de SLSM e na

busca por condições que sejam necessárias e/ou suficientes para que se obtenha limitação do

processo de erro, apresentamos a seguir, um estudo da noção de M-alcançabilidade.

Considere o Gramiano de alcançabilidadeG : Z+ → Mn0 do sistema (2.4) definido por

G(k) =k−1∑

t=0

Φ(k, t+ 1)Bθ(t)B′θ(t)Φ

′(k, t+ 1), θ(k) ∈ S, k > t ≥ 0, (3.1)

onde

Φ(k + 1, t) = Aθ(k)Aθ(k−1) . . . Aθ(t). (3.2)

Consideramos o seguinte conceito de alcançabilidade média,o qual é uma adaptação do

conceito de alcançabilidade para sistemas lineares variantes no tempo (caso discreto) e possui

a interpretação de que um subspaço alcançável é aquele composto por todos os pontosx1, em

um instante de tempot1, para os quais exista uma entrada (que dependa det0, t0+1, . . . , t1−1) que transfira o estado do ponto inicialx(t0) = 0 àx(t1) = x1, veja por exemplo [42].

Definição 3.1 (M-Alcançabilidade) Dizemos que(A,B, P ) é M-alcançável quando exis-

tem um inteirok e um escalarγ ∈ R+ tais que

EG(k) | θ(0) = j ≥ γI, j ∈ S

.Note que mesmo no cenário de SLSM, é simples exemplificar um caso não alcançável, basta

considerar um sistema que não seja infuenciado pela entrada

x(k + 1) = Aθ(k)x(k), k ≥ 0.

No entanto, a construção (ou verificação) de um sistema alcançável pode não ser uma tarefa

simples. Para tanto, desenvolvemos um resultado que permite testar a M-alcançabilidade.

Considere as seguintes definições.

22

3.1 - M-alcançabilidade, gramiano e matrizes de M-alcançabilidade

Para cadaℓ = 1, 2, . . . , r e i ∈ Sℓ, definimos

Mℓ,i =N∑

j=0

pjiBjB′j1j∈Sℓ, i ∈ Sℓ. (3.3)

Definimos o operadorAℓ,i : NNℓ,n0 → NNℓ,r0, de forma que paraU ∈ NNℓ,n0,

Aℓ,i(U) =∑

j∈Sℓ

pjiAjUjA′j, i ∈ Sℓ. (3.4)

Mostra-se em [22] queA dado em (3.4) é um operador linear semi-definido positivo.

Denota-seA0(U) = U e paraA : NNℓ,n0 → NNℓ,n0, definimosAk(U) recursivamente

porAk(U) = A(Ak−1(U)), k > 0.

Definem-se as coleções de matrizesRℓ,i(k) ∈ Mn0 por

Rℓ,i(k + 1) = Aℓ,i(Rℓ(k)) +Mℓ,i, k ≥ 0, i ∈ Sℓ,

Rℓ,i(0) = 0, i ∈ Sℓ.(3.5)

Observe que, com a notação introduzida, temos

Rℓ(k + 1) =k∑

t=0

Atℓ

(

Mℓ

)

, k ≥ 0. (3.6)

Como buscamos um teste de posto para M-Alcançabilidade baseado nas matrizesRℓ(k),

é de interesse utilizar a linearidade do operadorA e o Teorema de Cayley-Hamilton para

reduzir a dimensão do teste. Os resultados seguintes podem ser obtidos como uma adaptação

direta dos resultados em [14, Lemma 3] e [39, Lemma 2].

Lema 3.1 Considere as matrizes definidas em(3.5). Para cadaℓ = 1, 2 . . . , r e i ∈ Sℓ,

temos que

posto

(

[

Rℓ,i(1)...Rℓ,i(2)

... . . ....Rℓ,i(k)

]

)

= n,

para algumk ≥ n2Nℓ, se e somente se

posto(Rℓ,i(n2Nℓ)) = n.

Assumindo este resultado, neste trabalho lidamos com a seguinte definição de matrizes de

M-alcançabilidadeRℓ,i.

23


Definição 3.2 A coleção de matrizes de M-alcançabilidade é dada por,

Rℓ,i = Rℓ,i(n2Nℓ), i ∈ Sℓ, ℓ = 1, 2, . . . , r. (3.7)

3.1.1 Propriedades do KerRℓ,i(k)Apresentamos agora algumas propriedades do espaço nulo dasmatrizesRℓ,i(k), as quais

serão utilizadas na prova do Teorema 1.

Lema 3.2 Se para algum1 ≤ ℓ ≤ r, existemv ∈ Rn não trivial ei ∈ Sℓ, tais que

KerRℓ,i(k) ⊂ KerΦ(k, t)[Mℓ,i]Φ′(k, t),

quase certamente (q.c)1 parak ≥ t ≥ 0.

Demonstração: Suponha que existam um vetor não trivialv ∈ Rn e 1 ≤ ℓ ≤ r, tais que

para algumi ∈ Sℓ ev ∈ KerRℓ,i(k), k ≥ 0, então por (3.5) segue que

0 = v′Rℓ,i(k)v

= v′(

Aℓ,i

[

k−1∑

t=0

Atℓ

(

Mℓ

)]

+Mℓ,i

)

v

= v′(

Aℓ,i(Mℓ) +Aℓ,i

[

Aℓ

(

Mℓ

)]

+ . . .+Aℓ,i

[

Ak−1ℓ

(

Mℓ

)]

+Mℓ,i

)

v

≥ v′(

Aℓ,i

[

Atℓ

(

Mℓ

)])

v, t = 1, 2, . . . , k − 1.

(3.8)

(3.8) leva a

v′ ∈ Ker

Aℓ,i

[

Atℓ

(

Mℓ

)]

.

ExpandindoAtℓ obtém-se avaliações da forma

pj1iAj1pj2iAj2 . . . pjtiAjt(Mℓ,i)A′j1A′

j2. . . A′

jt ,

portanto (3.8) implica que

v ∈ Ker

pj1iAj1pj2j1Aj2 . . . pjtjt−1Ajt(Mℓ,jt)A′j1A′

j2. . . A′

jt

,

1P (v ∈ KerΦ(k, t)[Mℓ,i]Φ′(k, t)) = 1

24

3.1 - M-alcançabilidade, gramiano e matrizes de M-alcançabilidade

onde a coleção de índicesj1, j2, . . . jt, t = 1, 2, . . . , k pertence aSℓ. ComoSℓ é um conjunto

fechado irredutível, segue que todo valor de probabilidadepjti é positivo, portanto

v ∈ Ker

Aj1Aj2 . . . Ajt(Mℓ,jt)A′j1A′

j2. . . A′

jt

, t = 1, 2, . . . , k.

Logo,

P(v ∈ KerΦ(k, t)(Mℓ,jt)Φ′(k, t)) = 1, k ≥ t ≥ 0.

O resultado segue tomandojt = i.

Corolário 3.1 ConsidereRℓ como definido em(3.5). Tem-seKerRℓ,j(k) = KerRℓ,i(k),para todoi, j ∈ Sℓ ek ≥ 0.

Demonstração: Suponha que existam um valor não trivialℓ ≤ r, j ∈ Sℓ e v ∈KerRℓ,j(k), então

0 = v′[

Aℓ,j(Rℓ(k)) +Mℓ,j

]

v = v′Mℓ,jv. (3.9)

Segue do Lema 3.2 que

v ∈ Ker

Φ(k, t)[

N∑

ℓ=1

pℓjBℓB′ℓ1ℓ∈Sℓ

]

Φ′(k, t)

, k ≥ t, q.c.

Comopℓi > 0 para todoi ∈ Sℓ, tem-se

v ∈ Ker

Φ(k, t)[

N∑

ℓ=1

pℓiBℓB′ℓ1ℓ∈Sℓ

]

Φ′(k, t)

, ∀ i ∈ Sℓ.

Como consequência

v′

k−1∑

t=0

(

N∑

ℓ=1

pℓiAℓk−1

N∑

ℓ=1

pℓiAℓk−2. . .

N∑

ℓ=1

pℓiAℓ1

[

N∑

ℓ=1

pℓiBℓB′ℓ1ℓ∈Sℓ

]

A′ℓk−1

A′ℓk−2

. . . A′ℓ1

)

v = 0,

portanto

0 = v′[Aℓ,i(k−1∑

t=0

Atℓ(Mℓ)) +Mℓ,i]v = v′Rℓ,i(k)v.

25


Logo concluímos quev ∈ KerRℓ,i(k), para todoi ∈ Sℓ.

3.2 O Teorema do posto completoNesta seção, mostramos que o conceito de M-alcançabilidadedado em 3.1 é equivalente

à posto completo deRℓ,i, i ∈ Sℓ. Fornecendo um teste para M-alcançabilidade.

Teorema 1 (Teorema do posto completo)Considere a coleção de matrizes de

M-alcançabilidadeRℓ,i, em (3.7). (A,B, P ) é M-alcançável se e somente se, para

cadaℓ = 1, 2, . . . , r, tem-seposto(Rℓ,i) = n, i ∈ Sℓ.

Demonstração:Para facilitar a escrita dos resultados, nesta prova consideramos

φt,j = Φ(n2N + 2N, t+ 1)BjB′jΦ

′(n2N + 2N, t+ 1),

ondeΦ é como em (3.2). Definimos a função semidefinida positiva

f(v, j) = v′EG(n2N + 2N) | θ(0) = jv, j ∈ S. (3.10)

Observe que da definição do Gramiano de alcançabilidade em (3.1), tem-se

f(v, j) = v′E[

n2N+2N−1∑

t=0

Φ(n2N + 2N, t+ 1)

Bθ(t)B′θ(t)Φ

′(n2N + 2N, t+ 1)]

| θ(0) = j

v

= v′E

n2N+2N−1∑

t=0

φt,θ(t) | θ(0) = j

v.

(3.11)

(Suficiência)Suponha que(A,B, P ) não seja M-alcançável, ou seja, para qualquer escalarγ

e qualquer inteiroK existemv ∈ Rn e j ∈ S tais que

v′EG(K) | θ(0) = jv < γ ‖v‖2 .

Primeiramente mostramos que existemv e j tais que

f(v, j) = 0. (3.12)

26

3.2 - O Teorema do posto completo

FixandoK = n2N + 2N e tomando a sequênciaγk = 1/k, k ∈ Z+. Temos de (3.10) que

existemvk ∈ Rn e jk ∈ S tais quef(vk, jk) < γk‖vk‖2 para cadak ≥ 0. Como o conjunto

W = (u, j), u ∈ Rn, j ∈ S : ‖u‖ = 1

é compacto, comcluímos que a sequência(vk/‖vk‖, jk) ∈ W possui ao menos um ponto

de acumulação(v, j) ∈ W . Tomando uma subsequência(vkℓ/‖vkℓ‖, j) convergente para o

ponto(v, j), segue da continuidade def em seu primeiro argumentov que

f(v, j) = f( limℓ→∞

vkℓ/‖vkℓ‖, j) ≤ limℓ→∞

γkℓ = 0,

levando a igualdade em (3.12).

Agora, da definição em (3.11), temos

v′E

n2N+2N−1∑

t=2N

φt,θ(t) | θ(0) = j

v ≤ v′E

n2N+2N−1∑

t=0

φt,θ(t) | θ(0) = j

v = 0.

Então

v′(

n2N+2N−1∑

t=2N

φt,θ(t)

)

v = 0, (3.13)

quase certamente quandoθ(0) = j, isto é, para qualquer sequênciaj0 = j, j1, j2, . . . , que

satisfaça

P(

θ(0) = j0 = j, θ(1) = j1, . . . , θ((n2N + 2N − 1)) = jn2N+2N−1

)

> 0. (3.14)

Em particular, tomandoℓ tal queSℓ seja alcançável a partir dej e considerando o conjunto

de sequências da forma (3.14) para as quaisjN ∈ Sℓ. Como o espaço de estados da cadeia

de Markov é finito, este conjunto de sequências é finito. Denotamos este conjunto por

M = (m1), (m2), . . . (mς), onde(mℓ) = (j(mℓ)0 , j

(mℓ)1 . . . , j

(mℓ)

n2N+2N−1), (3.15)

comj(mℓ)0 = j e j(mℓ)

N ∈ Sℓ.

27


Para cada(mℓ) ∈ M definimos

Γℓ =n2N+2N−2∑

t=2N

pj(mℓ)t

j(mℓ)t+1

. . . pj(mℓ)

n2N+2N−2j(mℓ)

n2N+2N−1

φt,jt1jt∈Sℓ. (3.16)

De (3.13), (3.14) e nas condições da definição acima, avaliamos v′Γℓv = 0. Note que, como

jN ∈ Sℓ, entãojt, t ≥ 2N pertence a (e pode ser qualquer membro de)Sℓ. Combinando isto

com o fato de que os termos em (3.16) são os mesmos que aparecemna definição (3.5) com

termos expandidos, ou seja,

ς∑

ℓ=1

Γℓ =∑

i∈Sℓ

Aℓ,i

n2N−2∑

t=0

Atℓ(Mℓ)

+Mℓ,i,

obtemos

0 = v′

Aℓ,i

n2N−2∑

t=0

Atℓ(Mℓ)

+Mℓ,i

v

= v′(Aℓ,i(Rℓ(n2N − 1)) +Mℓ,i)v

= v′(Rℓ,i(n2N))v,

parai ∈ Sℓ. Isto e o Lema 3.1 implicam queposto(Rℓ,i(n2Nℓ)) < n.

(Necessidade)Assuma que exista1 ≤ ℓ ≤ r, tal queposto(Rℓ,i) < n, para algum

i ∈ Sℓ. Logo existe um vetor não trivialv ∈ Rn tal quev ∈ KerRℓ,iR′

ℓ,i, levando a

v′(Rℓ,iR′ℓ,i)v = 0, e como consequência

v′

n2Nℓ∑

t=1

Rℓ,i(t)R′ℓ,i(t)

v = 0.

Isto e o Lema 3.1 implicam que

v′(Rℓ,i(t)R′ℓ,i(t))v = 0, t = 1, 2, . . . , n2Nℓ,

logo do Lema 3.1, para cadak ≥ n2Nℓ, existe um vetor não trivialvk ∈ Rn, tais quevk ∈

KerRℓ,i(k). Similarmente a prova de suficiência, consideramos o conjunto de sequências

28


M = (m1), (m2), . . . ,mϕ. Paraθ(0) = j ∈ Sℓ, e para cada(mℓ) ∈ M definimos

Γℓ =k∑

t=0

pj(mℓ)j

(mℓ)1

. . . pj(mℓ)

k−1 j(mℓ)

k

φt,jt1jt∈Sℓ.

Pelo Corolário 3.1,vk ∈ KerRℓ,j(k) para todoj ∈ Sℓ, então

0 = v′k+1

∑

i∈Sℓ

(Rℓ,i(k + 1))vk+1

= v′k+1

∑

i∈Sℓ

(Aℓ,i(R(k)) +Mℓ,i)vk+1 = v′k+1

ϕ∑

ℓ=1

Γℓvk+1,

(3.17)

pode-se verificar a última igualdade expandindo-seRℓ,i definida em (3.5)-(3.6) e comparando

os termos que aparecem na definição deΓ.

Logo, (3.17) fornece

v′k+1Γℓvk+1 = 0, (mℓ) ∈ M,

levando a

v′k+1(Ek∑

t=0

φt,jt1jt∈Sℓ|θ(0) = j)vk+1 = 0, j ∈ Sℓ.

Isto contradiz a M-alcançabilidade, concluindo a prova.

O resultado abaixo é o primeiro resultado de positividade apresentado e dele decorrem,

direta ou indiretamente, todos os resultados de positividade abordados no decorrer do traba-

lho. Uma versão preliminar do Corolário 3.2 pode ser encontrada em [39], [40].

Corolário 3.2 Se(A,B, P ) é M-alcançável, então para cada1 ≤ ℓ ≤ r existeγR,ℓ ∈ R+

tal que

Rℓ,i(k) ≥ γR,ℓI, i ∈ Sℓ, k ≥ n2Nℓ.

Demonstração:Parak ≥ n2Nℓ, temos

Rℓ(k + 1) =

n2Nℓ−1∑

t=0

Atℓ(Mℓ) +

k∑

t=n2Nℓ

Atℓ(Mℓ)

= Rℓ(n2Nℓ) +

k∑

t=n2Nℓ

Atℓ(Mℓ) ≥ Rℓ(n

2Nℓ) ≥ γR,ℓI,

onde a última desigualdade segue do Teorema 1.

29


3.2.1 Exemplos

Os exemplos adiante ilustram o teste para M-alcançabilidade fornecido pelo teorema do

posto completo.

Exemplo 3.1 Considere o sistemaΦM em(2.4)com

A1 =

0 1, 9 1

1 0 0

1 0 1

, A2 =

0 0 1

0 0 1, 2

1 0 1, 3

, B1 =[

1 0 0]′

, B2 =[

1 0 1]′

,

C1 = C2 = D1 = D2 = I, P =

[

0, 1 0, 9

0, 1 0, 9

]

.

De (3.7)

R1,1 = R1,1(18) = 1, 0e+ 028 ∗

2, 4 1, 4 3, 1

1, 4 0, 8 1, 8

3, 1 1, 7 3, 8

, posto(R1,1) = 3

R1,2 = R1,2(18) = 1, 0e+ 028 ∗

2, 4 1, 4 3, 1

1, 4 0, 8 1, 7

3, 1 1, 7 3, 8

, posto(R1,2) = 3,

portanto pelo Teorema do posto completo, o sistema(A,B, P ) é M-alcançável.

Exemplo 3.2 Considere o Exemplo 3.1 com

A1 =

0 0, 1 0

0 1, 1 0

0 0 0, 9

, A2 =

0, 9 0, 4 0

0 0, 5 0

0 0, 5 0, 8

, B1 =[

1 0 0]

,

B2 =[

0, 1 0 0]′

, P =

[

0, 9 0, 1

0, 9 0, 1

]

.

30


De (3.7)

R1,1 = R1,1(18) =

26, 71 0 0

0 0 0

0 0 0

, posto(R1,1) = 1

R1,2 = R1,2(18) =

26, 71 0 0

0 0 0

0 0 0

, posto(R1,2) = 1,

portanto pelo Teorema do posto completo, o sistema(A,B, P ) não é M-alcançável.

31


32

CAPÍTULO

4

Positividade do segundo momento

Neste Capítulo, mostramos que M-alcançabilidade é uma condição necessária e sufici-

ente para que o segundo momento dex(k), Ex(k)x(k)′, seja limitado inferiormente por

βI, para algum escalar positivoβ, para instantes de tempok suficientemente grande, como

apresentado na Proposição 4.1. Isso assegura que M-alcançabilidade é uma condição su-

ficiente para a positividade da covariância do erro de estimaçãoEY k(D,B,Ψ), veja o

Teorema 2.

4.1 Resultados auxiliares e ordenação de matrizes

Embora as matrizes de M-alcançabilidade definidas em (3.7) não dependam dos valores

das distribuiçõesπi(k), estão relacionadas ao segundo momento do estadox(k). A fim de

mostrar que M-alcançabilidade é condição para positividade, definimos o conjunto de ma-

trizesSi(k) que pode ser comparado com ambosRi(k) ex(k). Seguindo esta mesma linha,

definimos a seguir, certas matrizesTi(k), Si(k) e reunimos alguns resultados essenciais na

prova da Proposição 4.1 e do Teorema 2.

33

Capítulo 4 Positividade do segundo momento

4.1.1 Matrizes de M-alcançabilidade e segundo momento

Definimos o operadorHV : NN,n0 → NN,r0, de maneira que paraU ∈ NN,r0 e V ∈NN,r,n,

HV,i(U) =N∑

j=1

pjiVjUjV′j , i = 1, . . . , N. (4.1)

Considere as matrizesSi(k) ∈ Mn0, i ∈ S, definidas como

Si(k + 1) = HA,i(S(k)) +N∑

j=1

πj(k)pjiBjB′j, k ≥ 0,

Si(0) = Ψπi(0).

(4.2)

Si(k) ex(k) são relacionados como segue.

Lema 4.1 As seguintes afirmações valem:

1. Si(k) = Ex(k)x′(k)1θ(k)=i, i ∈ S, k ≥ 0,

2. EXk(B,Ψ)|θ(k) = i = Si(k)P(θ(k) = i).

Demonstração:A primeira afirmação segue diretamente de [23, Proposição 3.1]. A segunda

afirmação segue da Proposição 2.2 e da afirmação do item1. acima,

EXk(B,Ψ)|θ(k) = i = E Ex(k)x′(k)|Θk|θ(k) = i= E

x(k)x′(k)1θ(k)=i

P(θ(k) = i) = Si(k)P(θ(k) = i),

completando a prova.

4.1.2 Ordenação de matrizes

Dada a relação entre os valores deSi(k) ex(k) no Lema 4.1, definimos abaixo coleções

de matrizes auxiliares,Tℓ(k) e Sℓ(k) que, em função de propriedades de completude do

posto deRi(k), fornecem um resultado de positividade paraSi(k), Lema 4.6.

Introduzimos sequências de matrizesTℓ e Sℓ, as quais são similares aRℓ - (3.5) eSi -

(4.2), respectivamente.

34

4.1 - Resultados auxiliares e ordenação de matrizes

Lembre-se queK1 = K0 + n2N + N . Para cada1 ≤ ℓ ≤ r, define-seTℓ,i(k) ∈ Mn0

como

Tℓ,i(k + 1) = Aℓ,i(Tℓ(k)) +Mℓ,i, k ≥ K1, i ∈ Sℓ,

Tℓ,i(K1) = 0, i ∈ Sℓ,(4.3)

eSℓ,i(k) ∈ Mn0 como

Sℓ,i(k + 1) = Aℓ,i(Sℓ(k)) +Mπ,i(k), i ∈ Sℓ,

Sℓ,i(0) = Ψπi(0),(4.4)

onde

Mπ,i(k) =N∑

j=1

πj(k)pjiBjB′j1j∈Sℓ, i ∈ Sℓ.

Observe queTℓ é uma translação no tempo deRℓ. Sℓ é uma ”versão local” deSi, coincidindo

comSi quando a distribuição inicialπi(0) é igual a zero para qualquer estadoθ(0) fora de

Sℓ.

A seguir, mostramos que as matrizesSi(k), Sℓ,i(k) eTℓ,i(k) podem ser ordenadas.

Lema 4.2 Considere as matrizesSi(k) em(4.2)eSℓ,i(k) em(4.4), então para cada1 ≤ ℓ ≤r, e i ∈ Sℓ, tem-seSi(k) ≥ Sℓ,i(k), ∀k ≥ 0.

Demonstração: DenotandoNπ,i(k) =∑N

j=1 πj(k)pjiBjB′j, tem-seNπ,i ≥ Mπ,i, i ∈ Sℓ.

Temos que

Si(k + 1) = HA,i

[

HkA(Ψπ(0)) +

k−1∑

t=0

HtA

(

Nπ(k − t))]

+Nπ,i(k)

≥ Aℓ,i

[

Akℓ (Ψπ(0)) +

k−1∑

t=0

Atℓ

(

Mπ(k − t))]

+Mπ,i(k)

= Sℓ,i(k + 1), ∀k ≥ 0, i ∈ Sℓ,

e a prova está completa.

Lema 4.3 Assuma queℓ seja tal queSℓ ∈ Rπ. Então existeι ∈ R+, tal queSℓ,i(k) ≥ιP(θ(N) ∈ Sℓ)Tℓ,i(k), ∀ i ∈ Sℓ, k ≥ K1.

35


Demonstração:Segue da Proposição 2.1 que paraℓ satisfazendoSℓ ∈ Rπ existe0 < ι < 1

tal queπj(k) ≥ ιP(θ(N) ∈ Sℓ), j ∈ Sℓ, k ≥ K0, portanto de (4.3) e (4.4) tem-se

Sℓ,i(k + 1) = Aℓ,i

[

Akℓ (Ψπ(0)) +

k−1∑

t=0

Atℓ (Mπ(k − t))

]

+Mπ,i(k)

≥ Aℓ,i

[

Akℓ (Ψπ(0)) +

k−1∑

t=0


]

+ ιP(θ(N) ∈ Sℓ)Mℓ,i

≥ Aℓ,i

[

Akℓ (Ψπ(0))

]

+Aℓ,i

[

K0−1∑

t=0


]

+ ιP(θ(N) ∈ Sℓ)

[

Aℓ,i

(

k−1∑

t=K0

Atℓ (Mℓ)

)

+Mℓ,i

]

= Aℓ,i

[

Akℓ (Ψπ(0))

]

+Aℓ,i

[

K0−1∑

t=0


]

+ ιP(θ(N) ∈ Sℓ)Tℓ,i(k + 1)

≥ ιP(θ(N) ∈ Sℓ)Tℓ,i(k + 1),

concluindo a prova.

Lema 4.4 Se existiremγR > 0 eK ≥ 0, tais queRℓ,i(k) ≥ γRI, ∀k ≥ K, então existem

γT ≥ 0 eKT ≥ 0, tais queTℓ,i(k) ≥ γT I, k ≥ KT , i ∈ Sℓ.

Demonstração:O resultado a seguir segue diretamente das definições das matrizesTi(k) e

Ri(k) (veja (3.5)), tomandoKT ≥ K + n2N .

Lema 4.5 Considere o sistema em (2.4) e assumax0. Se existir um vetor não trivialv ∈KerRℓ,i(k), entãov ∈ KerSℓ,i(k), para todok ≥ K.

Demonstração: A prova segue do fato de que, quandox0 = 0, a expressão que define

Rℓ,i(k) é análoga à deSℓ,i(k), i ∈ Sℓ, se diferenciando somente por escalares positivos

πj(k) ≥ ι ≥ 0.

4.2 Positividade do processo X(k)

Nesta seção, mostramos que M-alcançabilidade é uma condição necessária e suficiente

para positividade deEX(k). A prova segue da relação entreSi(k) ex(k), Lema 4.1, e das

36

4.2 - Positividade do processo X(k)

relações de ordenação apresentadas acima.

Lema 4.6 Valem as seguintes afirmações:

1. Se(A,B, P ) é M-alcançável, então existeβ ∈ R+ (independente deΨ) tal que, para

cada distribuição inicialπ = π(0), 1 ≤ ℓ ≤ r e i ∈ Sℓ ∩Rπ,

Si(k) ≥ β P(θ(N) ∈ Sℓ) I k ≥ K1.

2. Assuma que(A,B, P ) não seja M-alcançável eΨ = 0. Então existem uma distribui-

ção inicialπ = π(0) e i ∈ Rπ tal queSi(k) é singular para algumk ≥ 0.

Demonstração:

1. Do Corolário 3.2 temos queRi(k) ≥ γRI, k ≥ n2N , portanto dos Lemas 4.2–4.4,

temos parai ∈ Sℓ ∩Rπ, k ≥ K0 + n2N ,

Si(k) ≥ Sℓ,i(k) ≥ ιP(θ(N) ∈ Sℓ)Tℓ,i(k) ≥ ιP(θ(N) ∈ Sℓ) γT I.

2. Para um sistema não alcançável, de acordo com o Teorema 1, existe m tal que

posto(Rm,i) < n, para algumi ∈ Sm. Considereπ = π(0) de forma queRπ = Sm.

Obtemos do Lema 3.1 queposto(Rm,i(k)) < n, k ≥ 0, e o Corolário 3.1 fornece

posto(Rm,j(k)) < n, k ≥ 0, ∀j ∈ Sm. Agora, escolhendox(0) = 0, obtemos do

Lema 4.5 que

posto(Sm,j(k)) < n, ∀k ≥ 0, ∀j ∈ Sm. (4.5)

Por outro lado, paraπ como acima e para cadak ≥ 0 temos queπj(k)pjℓ = 0 sempre

quej /∈ Sm ou ℓ /∈ Sm, obtemos de (4.2) e (4.4) queSℓ(k) = Sm,ℓ(k), ℓ ∈ Sm e

Sℓ(k) = 0, ℓ /∈ Sm. Isto e (4.5) implicam que, para cadaj ∈ S, existev ∈ Rn tal

quev ∈ Ker

Sj(k)

, k ≥ 0, e a afirmação do lema segue escolhendo-se um valor

particular dej ∈ Rπ.

A seguinte proposição relaciona o conceito de M-alcançabilidade com a covariância do

estadoXk(B,Ψ). Um resultado similar pode ser encontrado em [39, Lemma 3] sob a hipó-

tese de controlabilidade fraca e da restrição de ergodicidade sobre a cadeia de Markov.

37


Proposição 4.1Considere o conjunto de matrizes dado por(2.10). (A,B, P ) é

M-alcançável se e somente se, para toda distribuição inicial π = π(0) e i ∈ Rπ,

E

Xk(B, 0)|θ(k) = i

> βκI, k ≥ K1,

comβ eκ definidos respectivamente como no Lema 4.6 e Proposição 2.1.

Demonstração:(Necessidade)Para todoπ, i ∈ Rπ ek ≥ N , temos de propriedades básicas

da cadeia de Markov queP(θ(k) = i) > 0. Por esta propriedade, do fato de queK1 ≥ N ,

pelos Lemas 4.1(2) – 4.6(1) para sistemas alcansáveis, podemos avaliar parak ≥ K1,

E

Xk(B, 0)|θ(k) = i

= Si(k)P(θ(k) = i) ≥ βP(θ(N) ∈ Sℓ)P(θ(k) = i)I

≥ βκI,(4.6)

ondeℓ é tal quei ∈ Sℓ e a última desigualdade segue da Proposição 2.1.

(Suficiência)Provamos por contradição. Suponha que(A,B, P ) não seja M-alcançável,

então pelo Teorema 1, existem tal queposto(Rm,i) < n, para algumi ∈ Sm. Tomandoπ(0)

tal queSm = Rπ e x(0) = 0 (tal queΨ = 0), obtemos do Lema 4.6 e Lema 4.1 que existe

um vetor não trivialv ∈ Rn, satisfazendo

0 = v′

(

N∑

j=1

Sj(k)

)

v ≥ v′Si(k)v = P(θ(k) = i) v′(EXk(B, 0)|θ(k) = i)v.

Comoi ∈ Rπ, tem-seP(θ(k) = i) > 0, k ≥ K1, e as equações acima implicam

v′(EXk(B, 0)|θ(k) = i)v = 0.

O resultado da Proposição 4.1 é o primeiro passo para obtermos um limitante inferior

para a covariância do erro em médiaEY (k), o que será estudado no capítulo seguinte.

O corolário abaixo segue diretamente da Proposição 4.1 e da Propriedade 4. do valor

esperado.

Corolário 4.1 (A,B, P ) é M-alcançável se e somente se,

E

Xk(B, 0)

> βκ−1I, k ≥ K1,

38

4.2 - Positividade do processo X(k)

comβ eκ definidos respectivamente como no Lema 4.6 e Proposição 2.1.

ex3.1

39


40

CAPÍTULO

5

Positividade do processo de erro do

estimador

Nossa estratégia para obter um limitante inferior paraY (k) (similar a limitação deX(k)

na Proposição 4.1) é essencialmente simples: mostra-se queX(k) eY (k) estão relacionados

de forma que “Y pequeno” implica “X pequeno”. Uma interpretação é que um filtro linear

não é capaz de eliminar ruídos em subespaços nos quais o ruídoestá presente no estado, o que

é um fato bem conhecido para sistemas lineares variantes no tempo. Aqui, revisitamos este

resultado, pois precisamos de informações mais precisas sobre as relações entre os valores

deY (k) eX(k). De fato, mostramos que: para qualquerv ∈ Rn, tal quev′Y (k)v sejaO(ǫ)

implica quev′X(k)v também éO(ǫ1/2k

). OndeO(ǫ) se refere a notação de Landau.

5.1 Positividade do processo Y(k)

Iniciamos com uma generalização de [39, Corolário 3], onde seassume a condição res-

tritiva de queπi(k) ≥ α, k ≥ 0, i ∈ S para algumα ∈ R+.

Lema 5.1 SejaK2 um inteiro positivo,m = j0, . . . , jK2 uma realização truncada da

cadeia de Markov eY (k,m) a solução da equação da covariância do erro de estimação,

(2.10). Existeζ > 0 tal que para cada0 ≤ k ≤ K2 − 1, v ∈ Rn e ǫ > 0 satisfazendo

41

Capítulo 5 Positividade do processo de erro do estimador

v′Y (k + 1,m)v < ǫ‖v‖2 tem-se:

v′A′jkY (k,m)Ajkv ≤ ζ2ǫ‖v‖2.

Demonstração: A prova é trivial parav = 0. Como a variável aleatóriaY (k) satisfaz a

equação em (2.10), possuindo assim coeficientes limitados (independente do histórico da

cadeia), existe um limitante superior paraY (k) em intervalos de tempo fixos, ou seja, existe

Y tal que‖Y (k)‖ < Y q.c,0 ≤ k ≤ K2. Lembrando queY (k) = Y k(D,B,Ψ), avalia-se

de (2.10) que

v′G(k,m)DjkD′jkG′(k,m)v ≤ v′Y (k + 1,m)v < ǫ‖v‖2.

Denotandoχ = miniσ1(DiD′i) temosχv′G(k,m)G′(k,m)v < ǫ‖v‖2, portanto

‖G′(k,m)v‖2 < ǫ‖v‖2χ

. (5.1)

Por outro lado, de (2.10) tem-se

v′(Ajk −G(k,m)Cjk)Y (k,m)(Ajk −G(k,m)Cjk)′v < ǫ‖v‖2,

que pode ser escrito como

v′(

AjkY (k,m)A′jk− AjkY (k,m)C ′

jk(k)G′(k,m)−G(k,m)CjkY (k,m)A′

jk

+G(k,m)CjkY (k,m)C ′jkG′(k,m)

)

v < ǫ‖v‖2,

ou

‖Y 12 (k,m)A′

jkv‖2 + ‖Y 1

2 (k,m)C ′jkG′(k,m)v‖

< v′AjkY (k,m)C ′jkG′(k,m)v + v′G(k,m)CjkY (k,m)A′

jkv + ǫ‖v‖2

≤ 2‖v′G(k,m)CjkY (k,m)A′jkv‖+ ǫ‖v‖2

≤ 2Y ‖G′(k,m)v‖‖Cjk‖‖Y12 (k,m)A′

jkv‖+ ǫ‖v‖2,

onde utilizamos a desigualdade de Cauchy-Schwarz e a consistência da norma nas desigual-

dades acima. Utilizando (5.1), tem-se

‖Y 12 (k,m)A′

jkv‖2 ≤ 2

√

ǫ/χ ‖v‖ (Y maxi

(‖Ci‖)) ‖Y12 (k,m)A′

jkv‖+ ǫ‖v‖2. (5.2)

42

5.1 - Positividade do processo Y(k)

Sejaα a única raiz real e positiva deα2 + 2√

1/χ(Y maxi(‖Ci‖))α − 1, de forma que

(1/α)− α = 2√

1/χ(Y maxi(‖Ci‖)), o que permite escrever

(

‖Y 12 (k,m)A′

jkv‖+ α

√ǫ‖v‖

)

(

‖Y 12 (k,m)A′

jkv‖ −

√ǫ‖v‖α

)

= ‖Y 12 (k,m)A′

jkv‖2 − 2

√

1/χ(Y maxi

(‖Ci‖)) (√ǫ‖v‖) ‖Y 1

2 (k,m)A′jkv‖ − ǫ‖v‖2

≤ 0.

onde a desigualdade segue imediatamente de (5.2). Comoα > 0 e v é não trivial, multipli-

camos a desigualdade acima pelo inverso de‖Y 12 (k,m)A′

jkv‖+ α

√ǫ‖v‖ para obter

‖Y 12 (k,m)A′

jkv‖ −

√ǫ‖v‖α

≤ 0,

e o resultado segue comζ = α−1.

Lema 5.2 Considere0 ≤ k ≤ K2 e sejaj(m)0 , . . . , j

(m)K2

qualquer realização truncada fixa

da cadeia de Markov eY (k,m) correspondendo a equação(2.10). Então vale o seguinte,

se existemv ∈ Rn e ǫ > 0 tais quev′Y (k,m)v < ǫ‖v‖2, então existehk ∈ O(ǫ

1

2k ) tal que

v′Xk(B,Ψ,m)v < hk(ǫ)‖v‖2, 0 ≤ k ≤ K1.

Demonstração: Inicialmente, é simples verificar que existeX > 0 tal que

‖Xk(B,Ψ,m)‖ ≤ X , ∀ 0 ≤ k ≤ K1. A prova do resultado é feita por indução. Para

k = 0, temosY (0,m) = Ψ = X0(B,Ψ,m), e o resultado é imediato comh0(ǫ) = ǫ.

Suponha por indução que o resultado do lema seja válido parak > 0. Considerev ∈ Rn

satisfazendov′Y (k + 1,m)v < ǫ‖v‖2, temos do Lema 5.1 que existeζ > 0 tal que

v′AjkY (k,m)A′jkv ≤ ζ2ǫ ‖v‖2.

Agora, consideramos dois casos possíveis:

1. Se‖Ajkv‖2 ≥√ǫ ‖v‖2, então

v′AjkY (k,m)A′jkv ≤ ζ2ǫ ‖v‖2 ≤ ζ2

√ǫ ‖Ajkv‖2,

43


o que pela hipótese de indução leva a

v′AjkXk(B,Ψ,m)A′

jkv < hk

(

ζ2√ǫ)

‖Ajkv‖2 ≤ hk

(

ζ2√ǫ)

‖Ajk‖2‖v‖2.

2. Se‖Ajkv‖2 ≤√ǫ ‖v‖2, então


jkv ≤ ‖A′

jkv‖2‖Xk(B,Ψ,m)‖

≤ √ǫ ‖v‖2 ‖Xk(B,Ψ,m)‖ ≤ √

ǫX ‖v‖2.

Combinando as desigualdades acima tem-se


jkv ≤ max

(

X , ‖A1‖2, ‖A2‖2, . . . , ‖AN‖2)

hk(ζ2√ǫ+

√ǫ)‖v‖2,

o que implica


jkv ≤ hk(ǫ)‖v‖2, (5.3)

ondehk éO((√ǫ)

1

2k ) = O(ǫ1

2k+1 ).

Agora temos da hipótese do Lema e de (2.10) quev′BjkB′jkv < ǫ‖v‖2. Substituindo isto

e (5.3) em (2.5) obtemos

v′Xk+1(B,Ψ,m)v = v′AjkXk(B,Ψ,m)A′

jkv + v′BjkB

′jkv ≤

(

hk (ǫ) + ǫ)

‖v‖2,

portanto, o resultado vale parak + 1, completando a prova.

A partir de agora queremos modificar um valor esperado condicional sem mudar a dis-

tribuição da cadeia de Markov, veja a Observação 3. A relaçãoentre as magnitudes deX e

Y obtida nos lemas acima é essencial na extensão da limitação inferior deX paraY , como

apresentamos a seguir.

Teorema 2 (Positividade do processo de erro)Assuma(A,B, P ) M-alcançável e consi-

dere o processo de erroY (k). Existeλ ∈ R+, tal que, para toda distribuição inicial

π0 eK1 ≤ k ≤ K2,

EY (k)|θ(k) = i, θ(0) = j, Y (0) > λI, i, j ∈ Rπ.

44


Demonstração: Denotamos o conjunto de distintas realizações de uma cadeiade Mar-

kov no intervalo de tempoK1 ≤ k ≤ K2 por M = m1,m2, . . .mε, de forma que

mℓ = (jℓK1, . . . , jℓK2

) seja uma realização. Temos um número finitoε de (diferentes) rea-

lizações, uma vez que o espaço de estado da cadeia de Markov é finito. SejaX ∈ R+ tal que

‖Xk(B,Ψ,m)‖ ≤ X , K1 ≤ k ≤ K2. Relacionado ao valor deX , definimosM1 ⊂ M por

M1 = mℓ ∈ M : P(mℓ|θ(k), θ(0), Y (0)) ≤ β

2κX ε,

ondeβ, κ é como no Lema 4.1. Denota-se porM2 ao conjunto complementar deM1.

Procedemos por contradição, supondo que para todoλ > 0 existamv ∈ Rn eK1 ≤ k ≤ K2

tais quev′EY (k)|θ(k), θ(0), Y (0)v ≤ λ‖v‖2, podemos escrever

v′EY (k)|θ(k), θ(0), Y (0)v =ε∑

ℓ=1

P(mℓ|θ(k), θ(0), Y (0))v′Y (k,mℓ)v ≤ λ‖v‖2,

o que leva a

v′Y (k,mℓ)v ≤ 2λ‖v‖2κX εβ−1, mℓ ∈ M2,

e do Lema 5.2 obtém-se

v′Xk(B,Ψ,mℓ)v ≤ hk(2λκX εβ−1)‖v‖2, mℓ ∈ M2,

ondehk éO((·) 1

2k ). Portanto

v′EXk(B,Ψ)|θ(k), θ(0), Y (0)v =ε∑

ℓ=1

P(mℓ|θ(k), θ(0), Y (0))v′Xk(B,Ψ,mℓ)v

=∑

ℓ∈M1


+∑

ℓ∈M2


≤∑

ℓ∈M1

β

2κX ε‖Xk(B,Ψ,mℓ)‖‖v‖2

+∑

ℓ∈M2

P(mℓ|θ(k), θ(0), Y (0))hk

(

2λκX ε

β

)

‖v‖2

45


=β

2κX ε‖v‖2

∑

ℓ∈M1

‖Xk(B,Ψ,mℓ)‖

+ hk

(

2λκX ε

β

)

‖v‖2∑

ℓ∈M2

P(mℓ|θ(k), θ(0), Y (0))

≤ β

2κX ε‖v‖2X ε+ hk

(

2λκX ε

β

)

‖v‖2

=

(

β

2κ+ hk

(

2λκX ε

β

))

‖v‖2.

Lembrando quehk é O((·) 1

2k ), basta tomarλ > 0 suficientemente pequeno tal que

hk(2λκX ε

β) < β

2κ, e a equação acima implica

v′EXk(B,Ψ)|θ(k), θ(0), Y (0)v ≤ βκ−1‖v‖2.

Tomando o valor esperado condicionalE·|θ(k), obtém-se

v′EXk(B,Ψ)|θ(k)v ≤ βκ−1‖v‖2,

de forma que(A,B, P ) não é M-alcançável de acordo com a Proposição 4.1.

A fim de abordar o caso em queY (0) = Ψ ≥ 0 é não trivial, note que

EY (k)|θ(k), θ(0), Y (0) = Ψ ≥ EY (k)|θ(k), θ(0), Y (0) = 0 > λI,

implicando no resultado seguinte.

Corolário 5.1 Assuma(A,B, P ) M-alcançável e considere a matriz de covariância do erro

de estimação definida em(2.10). Então, existeλ ∈ R+, tal que, para toda distribuição

inicial π = π(0), i, j ∈ Rπ, K1 ≤ k ≤ K2 eM ∈ Mn0, tem-se

EY (k)|θ(k) = i, θ(0) = j, Y (0) = M > λI.

Os resultados acima podem ser extendidos para o intervalo detempoK1 ≤ k ≤ ∞ em

função da suposição de que o filtro é homogêneo no tempo e do fato dehk, β eλ dados no

Teorema 2 serem independentes deY (0).

Corolário 5.2 (Positividade do processo de erro)SejaY (k) a matriz de covariância do

46


erro de estimação de qualquer filtro linear. Se(A,B, P ) é M-alcançável, então existe

λ ∈ R+, tal que para toda distribuição inicialπ = π(0),

1. E(Y (k + t)|θ(k + t) = i, Y (t) = M) > λI, ∀M ∈ Mn0, i ∈ Sℓ, k ≥ K1, t ≥ 0.

2. EY (k)|θ(k) = i > λI, i ∈ Sℓ, k ≥ K1.

3. E

∑t+k−1ℓ=t Y k−1

ℓ (0, 0,Υℓ−1(D,B))|θ(k)

≥ λI, t ≥ 0, k ≥ K1.

Demonstração:Pela homogeneidade no tempo (2.11), podemos escrever,

E (Y (k + 1)|θ(k + t) = i, θ(t) = j, Y (t) = M)

= E (Y (k + 1)|θ(k) = i, θ(0) = j, Y (0) = M) , t ≥ 0,(5.4)

e o Corolário 5.1 implica

E (Y (k + t)|θ(k + t) = i, θ(t) = j, Y (t) = M) > κI,

logo

E (E (Y (k + t)|θ(k + t) = i, θ(t), Y (t)) |θ(k + t) = i, Y (t)) > κI,

concluindo a prova do item 1. A segunda afirmação segue de 1., fazendot = 0 e tomando

o valor esperado condicionado aθ(k) = i. Quanto a terceira afirmação, temos da definição

recursiva em (2.13),

E

t+k−1∑

ℓ=t

Y k−1ℓ (0, 0,Υℓ−1(D,B))|θ(k + t)

= E Y (k + t)|θ(k + t), Y (t) = 0 ,

tomandoM = 0, a primeira afirmação conclui o resultado.

Observação 3Note queY (t) carrega informações sobre a cadeia de Markov e em particu-

lar sobreπ(t). No lado esquerdo de(5.4) queremos mudar o valor deY (t) sem mudar a

distribuição da cadeia de Markov no intervalo[t, k+ t], o que explica a introdução do valor

esperado condicionado aθ(t) = j. Nas avaliações realizadas nesta etapa, é necessário

considerar o valor esperado condicionado àθ(t) = j e àθ(0) = j.

O próximo resultado segue tomando o valor esperado (não condicionado) na afirmação

1. do Corolário 5.2,

47


Corolário 5.3 SejaY (k) a matriz de covariância do erro de estimação de qualquer filtro

linear. Se(A,B, P ) é M-alcançável, então existeλ ∈ R+, tal que

EY (k) > λI, k ≥ K1.

5.2 M-alcançabilidade e cadeias ergódicas

A razão pela qual as avaliações para o processo de erro em média dadas no Teorema 2

e Corolário 5.2 estão restritas àθ(k) = i ∈ Rπ é dada pela relação com a Proposição 4.1,

cujos resultados são válidos para estados de Markov alcançáveis e recorrentes. Os métodos

e argumentos de prova desta seção podem ser reproduzidos para estados geraisθ(k) ∈ S sob

a condição abaixo.

Suposição 2Assuma que existaβ tal que, para todok ≥ K1 e i ∈ S,

E

Xk(B, 0)|θ(k) = i

> βI.

Corolário 5.4 Considere a Suposição 2 e a matriz de covariâcia do erro de estimaçãoY (k)

definida em(2.10)para filtros lineares para SLSM. Então, existeλ ∈ R+, tal que, para toda

distribuição inicialπ = π(0),

1. EY (k)|θ(k) = i > λI, i ∈ S, k ≥ K1.

2. E

∑t+k−1ℓ=t Y k−1

ℓ (0, 0,Υℓ−1(D,B))|θ(k) = i

> λI, t ≥ 0, i ∈ S, k ≥ K1.

A Suposição 2 pode ser verificada para instantes de tempo finitos calculando as matrizes

Si dadas em (4.2) e usando o Lema 4.1. É suficiente queDi seja de posto completo para que

a Suposição 2 seja verdadeira, para todoi ∈ S. Além disso, é trivialmente satisfeita para

sistemas alcançáveis com cadeia de Markov ergódicas, nestecasoRπ ≡ S.

5.2.1 Exemplos ilustrativos

Abaixo, apresentamos exemplos ilustrando os resultados doCorolário 4.1 e Corolário

5.3. Implementamos o filtro de Kalman em todos os casos, o qualsatisfaz as condições de

homogeneidade. Obtivemos as estimativas empregando simulação Monte Carlo com1000

realizações.

48

5.2 - M-alcançabilidade e cadeias ergódicas

Exemplo 5.1 [M-alcançável] Considere o Exemplo 3.1 comΨ = 0 e sejav =[

0 0 1]′

.

A Figura 5.1 ilustra que os valores devEX(k)v′ evEY (k)v′ permanecem positivos com

a variação do tempo, exemplificando a suficiência da M-alcançabilidade para positividade

em ambos os casos.

0 50 100 150 20010

0

1050

10100

10150

k, tempo discreto

0 50 100 150 2000

2

4

6

8

k, tempo discreto

Figura 5.1: Calculo dos valoresvEX(k)v′ (denotada com) e covariância do erro deestimaçãovEY (k)v′ (denotada por×)

Exemplo 5.2 [Não M-alcançável] Sejav =[

0 0 1]′

. Considere o sistemaΦM em(2.4)

com

A1 =

0, 9 0, 1 0

0 1, 1 0

0 0 0, 9

, A2 =

0, 9 0, 1 0

0, 1 0, 1 0

0 0 0, 8

, B1 =[

0 0, 1 0]′

, B2 = 0,

C1 = C2 = D1 = D2 = I, Ψ =

0, 2 0, 1 0

0, 1 0 0

0 0 2

, P =

[

0, 5 0, 5

0, 5 0, 5

]

.

O teste do posto fornece que(A,B, P ) não é M-alcançável. A Figura 5.2 ilustra que os

valores deEX(k) e EY (k) decrescem com o tempo, exemplificando a necessidade da

M-alcançabilidade para garantir positividade deEX(k), Corolário 4.1. Este resultado e

a relação entreX e Y discutida neste capítulo sugerem que M-alcançabilidade é também

49


condição necessária para a positividade deEY (k). O exemplo reforça esta linha, observe

a figura.

0 50 100 150 20010

−30

10−20

10−10

100

1010

k, tempo discreto

0 50 100 150 20010

−40

10−20

100

1020

k, tempo discreto

Figura 5.2: Cálculo dos valores devEX(k)v′ (denotada com) e covariância do erro deestimaçãovEY (k)v′ (denotada por×)

50

CAPÍTULO

6

Estabilidade de filtros lineares

markovianos

A estabilidade de um filtro é um aspécto relevante para aplicações, uma vez que o modelo

da planta sempre apresenta algum nível de imprecisão ou aproximação, afetando o cálculo

dos ganhos do filtro. Por exemplo, algumas vezes os valores deB eΨ não estão disponíveis

e o filtro é computado em função de valores nominais em substituição dos valores reais.

E em outras aplicações, essas matrizes de parâmetros são manuseados com precisão finita

em um computador, ou mudam durante o funcionamento do sistema devido a mudanças

ambientais imprevisíveis, falhas, etc. Abrangendo todas estas situações, em nosso estudo

o ganho do filtro é computado baseando-se nos parâmetrosΣ e E (em substituição deΨ

eB, respectivamente) e aplicado no sistema atual cujos parâmetrosΨ eB estão sujeitos a

mudanças de qualquer magnitude. Nos referimos aΣ, E e grandezas relacionadas a estes

como teóricas, em oposição à grandezas reais que estão relacionadas com os valoresΨ eB.

Neste capítulo mostramos que as Condições 1 e 2 garantem a estabilidade de estimadores

lineares markovianos. O conceito de estabilidade tratada aqui é definida como a invariância

(aos parâmetros das matrizes de ruído aditivo) da existência de limitantes superiores deY .

Esta noção de estabilidade está em perfeita analogia com a estabilidade de um sistema na

forma padrãox(k+1) = Ax(k)+w(k) ondew(k) é um processo de ruído i.i.d. e os autova-

lores deA pertencem à um disco unitário se, e somente se, para cada matriz de covariância

51

Capítulo 6 Estabilidade de filtros lineares markovianos

dew, existe um limitante superior paraE‖x(k)‖2.

Resultados preliminares são apresentatos em [36] e [39], os quais abordam o filtro

de Kalman para SLSM para cadeias ergódicas e perturbações somente na covariância da

condição inicial. Adicionalmente a referência emprega umaconjectura provada aqui, Lema

6.1.

Assuma que os valores deΨ e deB não estejam disponíveis para a implementação do

filtro, logo empregam-se valores nominaisΣ eE em substituição dos verdadeiros. Assim,

adotamos dois modelos para análise. O primeiro sendo o modelo verdadeiro e também co-

nhecido como modelo real, o qual é caracterizado pelas matrizes de ruído aditivo de estado e

covariância inicial denotadas, respectivamente, porB eΨ. O segundo sendo o modelo nomi-

nal, no qual consideramos as informações disponíveis e através do qual realizamos o cálculo

do ganho do filtro. Denotamos as matrizes de ruído e covariância inicial respectivamente por

E eΣ. Por consequência assumiremos as Condições 1 e 2 nas variáveisE eΣ, por exemplo,

consideramos que(A,E,Σ) seja M-alcançável.

No sentido discutido acima, consideramos a seguinte definição de estabilidade do filtro.

Definição 6.1 (Estabilidade)Dizemos que um filtro linear markoviano é estável se, para

cadaB ∈ NN,n,p eΨ ∈ Mn0, existirY ∈ Mn+ tal queEY k(D,B,Ψ) < Y , k ≥ 0.

Observe que não é possível comparar (admitir algum tipo de ordenação) de forma direta

os valores deEY kt (D,E,Σ) (limitado por hipótese, Suposição 1) eEY k

t (D,B,Ψ), ou

seja, uma grande dificuldade é encontrar um escalar positivoϑ que satisfaça

ϑEY kt (D,B,Ψ) ≤ EY k

t (D,E,Σ) ≤ P , k ≥ 0. (6.1)

O método para tratar este ponto é direto. Criamos uma trajetória auxiliar

EY kt (D, I,Σ)|θ(k) = i, que possa ser comparada com ambas as covariâncias de erro

EY kt (D,B,Ψ)|θ(k) = i eEY k

t (D,E,Σ)|θ(k) = i, cuja limitação é proveniente da Su-

posição 1. Para tanto, mostramos a existência de uma recursão que satisfaça (6.1), que limita

inferiormente o processo de erro nominalEY kt (D,E,Σ) no intervalo[t, k], Corolário 6.1.

E através de um resultado auxiliar apresentado no Lema 6.1, extendemos este resultado para

limitação inferior uniforme deEY kt (D,E,Σ)|θ(k) = i.

O próximo Corolário caracteriza o discutido acima para o intervalo de tempo[t, k].

52

-

Corolário 6.1 Considere a Suposição 2 e o processo de erroY (k). Para cadat ≥ 0, k ≥K1 + t, existeξ > 0 tal que

ξ2EY kt (D, I,Ψ)|θ(k) = i ≤ EY k

t (D,B,Ψ)|θ(k) = i.

Demonstração:Segue de (2.13) e do Corolário 5.2 (iii) que

E

k−1∑

ℓ=t

Y k−1ℓ (0, 0,Υℓ−1(D,E))|θ(k)

≥ λI, t ≥ 0, k ≥ K1 + t. (6.2)

Por outro lado, para cadak ≥ K1 + t sempre existe um escalar suficientemente pequeno

ξ > 0, satisfazendo

ξ2E

k−1∑

ℓ=t

Y k−1ℓ (0, 0,Υℓ−1(D, I))|θ(k) = i

≤ λI, (6.3)

então tomandoξ < 1 e empregando (2.13), (2.15), (6.2), (6.3), obtemos

ξ2E

Y kt (D, I,Σ)|θ(k) = i

=

= ξ2E

Y k−1t (0, 0,Σ)|θ(k) = i

+ ξ2E

k−1∑

ℓ=t+1

Y k−1ℓ (0, 0,Υℓ−1(D, I))|θ(k) = i

≤ E

Y k−1t (0, 0,Σ)|θ(k) = i

+ λI

≤ E

Y k−1t (0, 0,Σ)|θ(k) = i

+ E

k−1∑

ℓ=t+1

Y k−1ℓ (0, 0,Υℓ−1(D,E))|θ(k) = i

= E

Y kt (D,E,Σ)|θ(k) = i

,

A seguir escrevemosEY k0 = EY k

s (0, 0, η), ondeη = EY k0 , nos permitindo mani-

pular o valor esperado deY recursivamente nos passos seguintes. O resultado apresentado

no Lema 6.1 passou por um processo de adequação desde o iníciodo estudo. Inicialmente o

apresentamos como uma conjectura, [39], em seguida obtivemos uma prova deste resultado

no estudo da estabilidade do filtro de Kalman para SLSM no casoem que a distribuição

da cadeia é positiva, veja [40]. Neste trabalho, ajustamos oresultado com o acréscimo do

valor esperado condicionado, o qual possibilita a extensãodo Corolário 6.1 para limitação

uniforme e qualquerk ≥ K1. A prova é dada pelo desenvolvimento do valor esperado, pelo

53


Teorema da probabilidade total e pela propriedade de observação do estado disretoθ(k). O

resultado fornece uma relação entre a recursão em função do valor esperado discutida acima

e o processo de erro geral.

Lema 6.1 ConsidereY como definido em(2.10)e

η = EY s(D,E,Σ)∣

∣θ(s), s ≥ 0,

então vale o seguinte parak ≥ s,

E

Y ks (0, 0, Y

s(D,E,Σ))|θ(k)

= E

Y ks (0, 0, η)|θ(k)

. (6.4)

Demonstração:TomandoΓi = (Ai +Hi(k)Ci) e usando a lei da probabilidade total, escre-

vemos

E

Y ks (0, 0,Y

s(D,E,Σ))|θ(k)

=N∑

i(k−1)=1

pi(k−1)θ(k)Γi(k−1)

(

N∑

i(k−2)=1

pi(k−2)i(k−1)Γi(k−2)

. . .×

(

N∑

i(s+1)=1

pi(s+1)i(s+2)Γi(s+1)

N∑

is=1

E

Y s(D,E,Σ)1θ(s)=is|θ(k)

Γ′i(s+1)

)

. . .Γ′1(k−1)

.

(6.5)

Similarmente, expandindoEY ks (0, 0, η)|θ(k) obtém-se

E

Y ks (0, 0, η)|θ(k)

=N∑

i(k−1)=1

pi(k−1)θ(k)Γi(k−1)

(

N∑

i(k−2)=1

pi(k−2)i(k−1)Γi(k−2)

. . .×

(

N∑

i(s+1)=1

pi(s+1)i(s+2)Γi(s+1)

N∑

is=1

E

E

Y s(D,E,Σ)∣

∣θ(s)

1θ(s)=is|θ(k)

Γ′i(s+1)

)

. . .Γ′1(k−1)

.

(6.6)

Basta mostrar que as expressões desenvolvidas em (6.5) e (6.6) são equivalentes. Usando

propriedades do valor esperado, obtemos

E

E Y s(D,E,Σ)|θ(s) 1θ(s)=i

∣

∣θ(k)

= E

E Y s(D,E,Σ)|θ(s)∣

∣θ(s) = i, θ(k)

P (θ(s) = i|θ(k))= E Y s(D,E,Σ)|θ(s) = iP (θ(s) = i|θ(k))

54

-

(6.7)

e da conhecida propriedade da Cadeia de Markov, a qual afirma que os estados passados

e futuros são independentes quando é dado o estado presente (lembrando queY s(D,E,Σ)

é uma função somente de estados passadosθ(0), . . . , θ(s)), temos que a igualdade acima é

equivalente a

E Y s(D,E,Σ)|θ(s) = i, θ(k)P (θ(s) = i|θ(k)) (6.8)

que é igual aE

Y s(D,E,Σ)1θ(s)=i|θ(k)

, completando a prova.

Observação 4A hipótese markoviana acima é indispensável para o resultado, a qual ga-

rante queθ(k) é a única variável aleatória envolvida emΓi = (Ai+Hi(k)Ci). Em cenários

mais geraisH(k) pode depender deθ(0), . . . , θ(k), e não podemos manipular o valor es-

perado como em(6.5) (poderia permanecer fora dos somatórios). Além disso, noteque o

condicional emθ(s) é também essencial para que a equivalência entre(6.7) e (6.8) seja

válida.

A principal ideia desta etapa é obter uma grandeza auxiliar limitada

ξ2EY k(D, I,Σ)|θ(k) = i (de uma forma uniforme), que seja um limitante superior

para uma variação do processo de erroβ2EY k(D,B,Ψ)|θ(k) = i, β > 0, k ≥ K1. A

questão que surge é como assegurar que a desigualdade

β2EY k(D,B,Ψ)|θ(k) = i ≤ ξ2EY k(D, I,Σ)|θ(k) = i ≤ EY k(D,E,Σ)|θ(k) = i

permaneça ao longo do tempo para algumβ, ξ > 0 ek ≥ K1. O Lema 6.2 mostra que existe

um escalarξ ∈ R+ (independente dek) satisfazendo a segunda desigualdade acima, ou seja,

satisfazendo o Corolário 6.1 parak ≥ K1.

Lema 6.2 Considere o processo de erroY (k) dado em(2.10), então existeζ ∈ R+ tal que

para todok ≥ K1,

ζ2E

Y k(D, I,Σ)|θ(k) = i

≤ E

Y k(D,E,Σ)|θ(k) = i

.

55


Demonstração:O resultado segue por indução na variávelk, iniciando comk = K1. Inici-

almente, definimosυ > 0 (usualmente um escalar pequeno) tal que

υ2E

t+K1∑

ℓ=t

Y kℓ (0, 0,Υℓ−1(D, I))|θ(k) = i

≤ λI, t ≥ 0 (6.9)

ondeυ é independente det devido à homogeneidade no tempo do processoY (claro que,υ

depende do tamanho do intervalo de tempo,K1) eλ é dado como no Corolário 5.2. Considere

ζ =√

min(ξ2, υ2) comξ > 0 como no Corolário 6.1. Voltando à indução, parak = K1 o

resultado segue diretamente do Corolário 6.1,

ζ2E


≤ ξ2E


≤ E


.

Por hipótese de indução assumimos que, para algumk = k > K1 fixo,

ζ2EY s(D, I,Σ)|θ(s) = i ≤ EY s(D,E,Σ)|θ(s) = i, ∀K1 ≤ s ≤ k]. (6.10)

Com o objetivo de completar a indução, assumimos que (6.10) seja válido parak = k + 1.

Por facilidade de notação, no restante desta prova, denotaremosk0 = k + 1−K1,

µ = ζ2EY k0(D, I,Σ)∣

∣θ(k0)

e

η = EY k0(D,E,Σ)∣

∣θ(k0).

Comok0 ∈ [K1, k], a desigualdade 6.10 implicaµ ≤ η. Considerando a definição recursiva

deY k(D,E,Σ) como em (2.13) – (2.15) escrevemos

ζ2E


= ζ2E

Y kk0(D, I, Y k0(D, I,Σ))|θ(k) = i

,

= E

Y kk0(0, 0, ζ2Y k0(D, I,Σ))|θ(k) = i

+ ζ2E

k∑

ℓ=k0+1

Y kℓ (0, 0,Υℓ−1(D, I))|θ(k) = i

56

-

e aplicando o Lema 6.1,

ζ2E


=

= E

Y kk0(0, 0, µ)|θ(k) = i

+ ζ2E

k∑

ℓ=k0+1

Y kℓ (0, 0,Υℓ−1(D, I))|θ(k) = i

.

Como o intervalo de tempo da soma acima éK1, podemos aplicar a equação (6.9); Isto em

adição comµ ≤ η leva a

ζ2E


≤ E

Y kk0(0, 0, η)|θ(k) = i

+ λI.

Do Corolário 5.2 (iii) obtém-se

ζ2E


≤ E

Y kk0(0, 0, η)|θ(k) = i

+ E

k∑

ℓ=k0+1

Y kℓ (0, 0,Υℓ−1(D,E))|θ(k) = i

,

empregando novamente (2.13), (2.15) e o Lema 6.1 (na ordem inversa ao usado acima),

ζ2E


≤ E

Y kk0(0, 0, Y k0(D,E,Σ))|θ(k) = i

+ E

k∑

ℓ=k0+1

Y kℓ (0, 0,Υℓ−1(D,E))|θ(k) = i

= E

Y kk0(D,E, Y k0(D,E,Σ))|θ(k) = i

= E


e a prova está completa.

Os resultados apresentados acima dão base para a prova do principal resultado do ca-

pítulo, a Suposição 2 é suficientes para a estabilidade de filtros markovianos. A estra-

tégia de prova segue a mesma linha do Lema 6.2, mas neste caso,usamos uma varia-

ção do processo de erroEY k(D,B,Ψ)|θ(k) = i como limitante superior do processo

EY k(D, I,Σ)|θ(k) = i, que por sua vez é limitada superiormente.

Teorema 3 (Estabilidade) ConsidereY como definido em(2.10), e suponha que as Condi-

ções 1 e 2 sejam válidas. Então existeY ∈ Mn+ tal que

EY k(D,E,Σ)|θ(k) = i < Y , ∀ k ≥ K1.

57


Demonstração:Sejaζ > 0 como no Lema 6.2. Podemos escolher um escalar positvoβ < ζ

tal que para todok ≥ 0, i ∈ S,

βBi(k)Bi(k)′ ≤ ζI, (6.11)

e

βΨ ≤ ζΣ, (6.12)

ondeζ é como no Lema 6.2. Então empregando (2.13) e (6.11) – (6.12),podemos escrever

β2E

Y k(D,B,Ψ)|θ(k) = i

= β2E

Y k(0, 0,Ψ)|θ(k) = i

+ β2E

k∑

ℓ=1

Y kℓ (0, 0,Υℓ−1(D,B))|θ(k) = i

≤ ζ2E

Y k−1(0, 0,Σ)|θ(k) = i

+ ζ2E

k∑

ℓ=1

Y kℓ (0, 0,Υℓ−1(D, I))|θ(k) = i

= ζ2E


.

O Lema 6.2 e a Suposição 1 implicam

β2E

Y k(D,B,Ψ)|θ(k) = i

≤ ζ2E


≤ E


≤ P , k ≥ K1,

portantoEY k(D,B,Ψ)|θ(k) = i ≤ β−2P = δP = Y , completando a prova.

O próximo corolário segue diretamente de propriedades do valor esperado

EEY k(D,B,Ψ)|θ(k) = i ≤ EY .

Corolário 6.2 ConsidereY como definido em(2.10), e suponha que as Condições 1

e 2 sejam válidas. Se(A,E, P ) é M-alcançável então existeY ∈ Mn+ tal que

EY k(D,B,Ψ) < Y , ∀ k ≥ K1.

58

6.1 - Exemplos ilustrativos

0 50 100 150 2000

0.5

1

1.5

2

2.5

3

k, tempo discreto

Figura 6.1:Estimação da Covariância de erro de Exemplo 6.1.EY k(D,E,Σ) (denotadacom) eEY k(D,B,Ψ) (detotada com×).

6.1 Exemplos ilustrativosNesta seção apresentamos exemplos ilustrativos do resultado de estabilidade. Os casos

apresentados são bastante simples, de forma que buscamos ilustrar de forma bastante direta

que os resultados apresentos são válidos. Variamos as Condições 1 e 2 em cada um dos

exemplos, de forma que quando uma das condições é falha, a estabilidade não ocorre. Ilus-

tramos também que a Suposição 2 não é necessária para estabilidade. Implementamos o

ELMQ como apresentado em [18], [27], [30] e [23].

Exemplo 6.1 (Suposição 1, Suposição 2) Considere o sistemaΦM com

A1 =

0 0 0

0 0, 1 1

0 0 0, 9

, A2 =

0, 9 0 0

0, 1 0, 9 0

0 0 0, 9

, E1 =[

1 0 0]′

,

E2 =[

1 0 0]′

, B1 =[

1 0 0]′

, B2 =[

1 0 1]′

,

C1 = C2 = D1 = D2 = I, Σ = 0, Ψ =

1 0 0

0 1 0

0 0 1

, P =

[

0, 9 0, 1

0, 9 0, 1

]

.

Comcluímos através do Teorema do posto completo que(A,B, P ) é M-alcançável, e nas

condições do sistema, a Suposição 2 é satisfeita. Computamosos ganhos do ELMQ em

função dos parâmetros nominaisE,Σ. Os resultados indicam queEY k(D,E,Σ) e

EY k(D,B,Ψ) são limitados, (veja a Figura 6.1), sugerindo que o filtro é estável.

59


0 20 40 60 80 100 120 140 160 180 20010

−5

100

105

1010

1015

k, tempo discreto


Exemplo 6.2 (Suposição 1 falha, Suposição 2) Considere o sistemaΦM do Exemplo 6.1

com

A1 =

0 0 0

0 1, 1 0

0 0 1

, A2 =

0 0, 1 0

0 0, 9 0

0 0 1

, E1 =[

1 1, 5 1]′

,

E2 =[

1 1 1]′

, B1 = B2 =[

1 0 0]′

, C1 = C2 = D1 = D2 = I,

Σ =

0 0, 1 0

0 0 0

0 0 0, 1

,Ψ = 0, P =

[

0, 9 0, 1

0, 5 0, 5

]

.

Temos que(A,E, P ) é M-alcançável. Os cálculos do ganho do ELMQ foram realizados em

função dos valoresE,Σ. O exemplo ilustra que o erro de estimação cresce exponencialmente

sob perturbações no modelo de ruído, veja a Figura 6.2.

Exemplo 6.3 (Suposição 1, Suposição 2 falha) Considere o sistemaΦM do Exemplo 6.1

com

A1 =

0 0, 1 0

0 1, 1 0

0 0 0

, A2 =

0, 9 0, 1 0

0, 1 0 0

0 0 0

, E1 = E2 = 0,

B1 =[

0, 5 0, 1 0]′

, B2 =[

0, 5 0 1, 5]′

, P =

[

0, 1 0, 9

0, 1 0, 9

]

,

60

6.1 - Exemplos ilustrativos

0 50 100 150 2000

1

2

3

4

k, tempo discreto


Ψ =

0, 2 0, 1 0

0, 1 0 0

0 0 1

, Σ =

0, 5 0 0

0 0, 2 0

0 0 0

.

Obtemos através do teste do posto que(A,E, P ) não é M-alcançável. A Figura 6.3 sugere

que as grandezasEY k(D,E,Σ) e EY k(D,B,Ψ) são limitados e portanto o filtro é

estável. Este exemplo mostra que a Suposição 2 não é necessária.

61


62

CAPÍTULO

7

Conclusão

Este trabalho considerou o estudo da alcançabilidade, da positividade uniforme da co-

variância do processo do erro de estimação e da estabilidadede estimadores para sistemas

lineares sujeitos a saltos markovianos.

Inicialmente, introduzimos o conceito de M-alcançabilidade e o conjunto de matrizes

R para SLSM. Obtemos um teste para M-alcançabilidade, Teorema 1, estabelecendo um

paralelo com o teste usual de alcançabilidade para sistemaslineares invariantes no tempo.

A noção de alcançabilidade introduzida possibilitou a obtenção de condições de positi-

vidade. De fato, mostramos que M-alcançabilidade é uma condição necessária e suficiente

para a positividade do segundo momento do estado em média, isto é,EXk(E,Σ) > 0,

veja o Lema 4.1, deixando claro o papel da M-alcançabilidadena estrutura de SLSM. Em

seguida, mostramos que M-alcançabilidade é condição suficiente para a positividade uni-

forme do valor esperado do processo de erro, ou seja, existe um escalar positivoβ tal que

EY (k) ≥ βI, Teorema 2 e Corolário 5.2.

A positividade da covariância é a principal ferramenta parao estudo da estabilidade,

nos permitindo mostrar que a covariância é limitada em média, mesmo sob perturbações

nos parâmetros da planta, como apresentado no Teorema 3. É umpouco paradoxal que

seja preciso ruído completo na planta para que se garanta estabilidade do filtro, no entanto

é este ruído que evidencia possíveis dinâmicas instáveis durante o cálculo do ganho - sem

ruído completo, estas dinâmicas podem ficar desapercebidas. Em aplicações de controle e

63

Conclusão

filtragem é preciso estar atento a estes aspectos, pois mesmoum filtro ótimo pode ter seu

desempenho degradado rapidamente.

Assim, entendemos que os estudos abordados por esse trabalho representam uma contri-

buição importante para o problema de filtragem de sistemas lineares a tempo discreto com

saltos markovianos, fornecendo informações relevantes sobre o comportamento do processo

de erro.

Como sugestão de trabalhos futuros, propomos neste mesmo cenário a análise de es-

tabilidade para filtros lineares gerais, sem a hipótese de markovianidade. Também acre-

ditamos que seja importante investigar condições necessárias e suficientes para a estabili-

dade do filtro, provavelmente usando uma noção do tipo M-estabilizabilidade que generalize

M-alcançabilidade.

64

Referências Bibliográficas

[1] S. Aberkane and V. Dragan. H infinity filtering of periodicmarkovian jump systems:

Application to filtering with communication constraints.Automatica, 48:31513156,

2012.

[2] B. D. O. Anderson and J. B. Moore.Optimal Filtering. Prentice-Hall, London, first

edition, 1979.

[3] M. Athans, D. Castanon, K. P. Dunn, C. S. Greene, W. H. Lee, N.R. Sandell, and A. S.

Willsky. The stochastic control of the F-8C aircraft using amultiple model adaptive

control (MMAC) method - Part i :Equilibrium flight.IEEE Transactions on Automatic

Control, (22):798–780, 1977.

[4] E. Cinlar. Introduction to Stochastic Processes. Prentice-Hall, 1975.

[5] T. Cormen, C. Leiserson, and C. Stein R. Rivest.Introduction to Algorithms.

McGraw-Hill, 2001.

[6] E. F. Costa and A Astolfi. A bound for the error covariance ofthe recursive Kalman fil-

ter with Markov jump parameters. In47th IEEE Conference on Decision and Control,,

pages 37–42, 2009.

[7] E. F. Costa and A. Astolfi. Characterization of exponentialdivergence of the Kal-

man filter for time-varying systems.SIAM Journal on control and optimazation,

48(5):2917–2944, 2009.

[8] E. F. Costa and A. Astolfi. A necessary and sufficient condition for exponential diver-

65


gence of the recursive Kalman filter for linear time-varyingsystems.SIAM Journal on

Control and Optimization, 48:2917–2944, 2009.

[9] E. F. Costa and A. Astolfi. Stochastic detectability and mean bounded error covariance

of the recursive kalman filter with markov jum parameters.Stochastic analysis and

Aplications, 28(2):190–201, 2010.

[10] E. F. Costa and J. B. R. do Val. On the detectability and observability of discrete-time

Markov jump linear systems.System and Control Letters, 44:135–145, 2001.

[11] E. F. Costa and J. B. R. do Val. On the observability and detectability of continuous-

time markov jump linear systems.Society for Industrial and Applied Mathematics,

41:1295–1314, 2002.

[12] E. F. Costa and J. B. R. do Val. Weak detectability and the linear quadratic control pro-

blem of discrete-time Markov jump linear systems.International Journal of Control.

Special issue on Switched and Polytopic Linear Systems, 75:1282–1292, 2002.

[13] E. F Costa and J. B. R do Val. Weak detectability and the linear quadratic control

problem of discrete time Markov jump linear systems.International journal of control.

Special issue on Switched and Polytopic Linear Systems, (75):1282–1292, 2002.

[14] E. F. Costa, A. L. P. Manfrim, and J. B. R. Do Val. Weak controllability and weak

stabilizability concepts for linear systems with Markov jump parameters. InProc.

ACC’06 American Control Conference, number 75, pages 1282–1292, Minneapolis,

USA, 2006.

[15] J. B. R. do Val Costa and J. C. Geromel. Continuous time state-feedbackH2-control

of Markovian jump linear systems via convex analysis.Automatica, 35(5):259–268,

1999.

[16] O. L. V. Costa. Discrete-times coupled Riccati equationsfor systems with Mar-

kovia switching parameters.Journal of Mathematical Analysis and Applications,

(149):197–216, 1983.

[17] O. L. V. Costa. Linear minimum mean square error estimation for discrete- time Marko-

vian jump linear systems.IEEE Transactions on Automatic Control, 39(8):1685–1689,

1994.

66


[18] O. L. V. Costa. Linear minimum mean square error estimation for discrete-time Marko-

vian jump linear systems.IEEE Transactions on Automatic Control, 39(8):1685–1689,

1994.

[19] O. L. V. Costa. Stability and control for linear systems with jump Markov pertubations.

Stochastic Analysis and Applications, 1(13):91–110, 1995.

[20] O. L. V. Costa and G. R. A. M. Benites. Linear minimum mean square filter for

discrete-time linear systems with markov jumps and multiplicative noises.Automa-

tica, 47:466–476, 2011.

[21] O. L. V. Costa and M. D. Fragoso. Stability results for discrete-time linear systems with

Markovian jumping parameters.Journal of Mathematical Analysis and Applications,

179:154–178, 1993.

[22] O. L. V. Costa and M. D. Fragoso. Discrete-time LQ-optimal control problems for

infinite markov jump parameter systems.IEEE Transactions on Automatic Control,

40:2076–2088, 1995.

[23] O. L. V. Costa, M. D. Fragoso, and R. P. Marques.Discrete-Time Markov Jump Linear

Systems. Springer-Verlag, United States of America, second edition, 2005.

[24] O. L. V. Costa, M. D. Fragoso, and R. P. Marques.Discrete-Time Markovian Jump

Linear Systems. Springer-Verlag, New York, 2005.

[25] O. L. V. Costa, M. D. Fragoso, and M. G. Todorov.Continuous-Time Markov Jump

Linear Systems. Springer, Berlin, Heidelberg, 2013.

[26] O. L. V. Costa and S. Guerra. Stationary filter for linear minimum mean square error

estimator of discrete-time Markovian jump systems.Automatic Control, IEEE Tran-

sactions on, 47(8):1351–1356, 2002.

[27] O. L. V. Costa and S. G. Jimenez. Stationary filter for linear minimum mean square

error estimator of discrete-time Markovian jump systems.IEEE Transactions on Auto-

matic Control, 47(8):1351–1356, 2002.

[28] O. L. V. Costa and R. P. Marques. RobustH2-control for discrete-time Markovian jump

linear systems.International Journal of Control, 73(1):11–21, 2000.

67


[29] O. L. V. Costa and A. Oliveira. Optimal meanvariance control for discrete-time linear

systems with markovian jumps and multiplicative noises.Automatica, 48:304–315,

2012.

[30] O. L.V. Costa and G. R.A.M. Benites. Linear minimum mean square filter for

discrete-time linear systems with Markov jumps and multiplicative noises.Automa-

tica, 47(3):466 – 476, 2011.

[31] J. C. Geronel Deaecto, G. S. and J. Daafouz. Robusth2 switched filter design for

discrete-time polytopic linear parameter-varying systems. Signal Processing, 2014.

[32] J. B. R do Val and T. Basar. Receding horizon control of jump linear systems

and a macroeconomic policy problem.Journal of Economic Dynamics and Control,

23:1099–1131, 1999.

[33] J. B. R. do val and E. F. Costa. Numerical solutions for the linear-quadratic control

problem of Markov jump linear systems and a weak detectability concept.IEEE Tran-

sactions on Automatic Control, 114(1):69–96, 2002.

[34] V. Dragan, T. Morozan, and A. M. Stoica.Mathematical methods in robust control of

discrete-time linear stochastic systems. Springer, 2009.

[35] V. Dragan and A.M. Stoica. Optimal h2 filtering for a class of linear stochastic systems

with sampling.Automatica, 48:24942501, 2012.

[36] M. J. F. Gomes e E. F. Costa.Estabilidade do Filtro de Kalman para Sistemas Lineares

com Saltos Markovianos. Dissertação de Mestrado - ICMC/USP, 2010.

[37] J. B. R. do Val E. F. Costa and M. D. Fragoso. A new approach to detectability of

discrete-time infinite Markov jump linear systems.SIAM Journal on Control and Op-

timization, Philadelphia, 43(6):2132–2156, 2005.

[38] M. D. Fragoso and O. L. V. Costa. A unified approach for stochastic and mean square

stability of continuous-time linear systems with Markovian jumping parameters and

additive disturbances.SIAM Journal on Control and Optimization, 44(4):1165–1191,

2005.

68


[39] M. J. F. Gomes and E. F. Costa. On the stability of the recursive Kalman filter with

Markov jump parameters. InProc. ACC’010 American Control Conference, pages

4159–4163, 2010.

[40] M. J. F. Gomes and E. F. Costa. Stability of the Kalman Filter for Markov jump linear

systems. InProc. ECMC’011 Electronic Control, Measurement and Signals Confe-

rence, pages 7–12, Liberec, Czech Republic, 2011.

[41] A. C. Harvey. Forecasting, Structural Time Series Models and the Kalman Filter.

Cambridge University Press, 1979.

[42] P. J. Hespanha.Linear Systems Theory. Princeton University Press, Princeton, New

Jersey, first edition, 2009.

[43] Y. Ji and H. J. Chizeck. Jump linear quadratic gaussian control: Steady-state solu-

tion and testable conditions.Control Theory and Advanced Technology, 3(6):289–319,

1990.

[44] S. Mastellone, P. Dorato, and C. T. Abdallah. Finite-time stochastic stability of

discrete-time nonlinear systems: Analysis and design.43th Conference on Decision

and Control, 3:2572 – 2577, 2004.

[45] A.R.R. Narváez and E. F. Costa.Alcançabilidade e controlabilidade médias para

sistemas lineares com saltos markovianos a tempo contínuo. Tese de doutorado -

ICMC/USP, 2014.

[46] C. Price. An analysis of divergence problem in the Kalmanfilter. IEEE Transactions

on Automatic Control, 13(6):699–702, 1968.

[47] S. Sangsuk-Iam and T. E. Bullock. Analysis of discrete-time Kalman filtering

under incorrect noise covariances. IEEE Transactions on Automatic Control,

35(12):1304–1309, 1990.

[48] G.N. Saridis. Intelligent robotic control.IEEE Transactions on Automatic Control,

(28):547–557, 1983.

[49] D. D. Sworder and R. O. Rogers. An LQ-solution to a control problem associa-

ted with a solar thermal center receiver.IEEE Transactions on Automatic Control,

10(28):971–978, 1983.

69


[50] J. L. Willems and F. M. Callier. Divergence of the stationary Kalman filter for cor-

rect and for incorrect noise variances.IEEE Transactions on Automatic Control,

1(9):47–54, 1992.

[51] A.H. Zawiski. Stochastic Processes and Filtering Theory. Academic Press, 1970.

70

Índice Remissivo

Cadeia de Markov, 11

Covariância do erro de estimação, 17

Definição

Estabilidade, 4, 52

M-alcançabilidade, 22

Positividade, 4

Filtros homogêneos, 17

Filtros lineares, 16

Filtros lineares markovianos, 18

M-alcançabilidade

Matrizes, 23

Gramiano, 22

Notação de Landau, 10

Positividade

do processo de erro, 46

do segundo momento, 36

Processo de erro, 3

Segundo momento, 15

SLSM, 15

Soluções homogêneas, 18

Suposição 2, 48

Suposição 1, 17

Teorema

do posto completo, 26

Estabilidade, 57

Positividade do processo de erro, 44

Valores nominais, 52

71

Propriedades de filtros lineares para sistemas …...filtros H2, [1], [35], filtros robustos, veja por exemplo [31], os filtro s de Butterworth, filtros de Chebyshev e filtros

Documents