SISTEMAS COMPUTACIONAIS
Computação clássica tem dificuldade em lidar com mudanças inesperadas Entradas e interações devem ser
cuidadosamente gerenciadas “Redoma de vidro”
Dispositivos computacionais interagem cada vez mais com mundo real Aberto Ruidoso Incontrolável
Necessidade de uma forma completamente diferente de projetar e implementar programas.
2
SISTEMAS COMPUTACIONAIS
Computação Não-clássica Permite construção de sistemas computacionais
complexos Autônomos Adaptáveis Robustos
Sistemas devem ser executados corretamente e com segurança em ambientes Imprevisíveis Em constante mudança Hostis Por longos períodos de tempo
3
SISTEMAS COMPUTACIONAIS
Processos biológicos lidam bem com esses problemas
Criaturas vivas são robustas, autônomas e adaptáveis
Podem sobreviver a: Machucados Danos Uso prolongado Ataques contínuos de outras criaturas
Adaptam-se ao ambiente de forma continuada;
4
SISTEMAS COMPUTACIONAIS - FUTURO
Deverão ser mais flexíveis e amigáveis; Robustos; Capazes de executar várias atividades sem
intervenção humana: Configuração Otimização Manutenção Conserto
Detecção, diagnóstico, reparo Diferenciação
Possíveis caminhos: orientação as aspectos, reflexão computacional, etc.
5
BIOLOGIA
Biologia produz organismos complexos adaptáveis, mesmo utilizando quantidades enormes de componentes pouco confiáveis Como é possível?
Auto-avaliação Auto-reparo Auto-configuração Vários níveis de redundância Vários níveis de defesa
Por que não modelos computacionais bio-inspirados?
6
COMPUTAÇÃO BIOINSPIRADA
A natureza possui soluções elegantes e eficientes para vários problemas;
Presentes nas mais diversas espécies de seres vivos;
Inspira novas técnicas computacionais Inspiração ≠ Cópia.
8
COMPUTAÇÃO BIOINSPIRADA
Biologia Evolução da
espécies Colônia de formigas Enxames Sistemas
imunológicos Cérebro DNA Células Membranas
biológicas
Computação Algoritmos evolucionários Inteligência de colônia de
formigas Inteligência de exames Sistemas imunes artificiais Redes neurais artificiais DNA computing Autômato celular Membrane computing
A maioria das abordagens computacionais bioinspiradas resultam de modelos matemáticos projetados para melhor compreender os sistemas
naturais, e.g. por meio de simulações
9
ALGORITMOS EVOLUCIONÁRIOS
Existem muitas variações de Algoritmos Evolucionários (AE) Dada uma população de indivíduos, a pressão
exercida pelo ambiente causa uma seleção natural (sobrevivência dos mais aptos), a qual causa o aumento da aptidão da população;
Dada uma função de qualidade a ser maximizada, podemos criar aleatoriamente um conjunto de soluções candidatas;
Com base na aptidão, alguns dos melhores candidatos são escolhidos para serem a semente da nova geração, através da recombinação e/ou mutação;
O operador de recombinação pode ser aplicado a dois ou mais pais, gerando um ou mais filhos;
10
ALGORITMOS EVOLUCIONÁRIOS
A mutação é aplicada em apenas um candidato resultando em um novo candidato;
Produção de novos candidatos que competem com base na aptidão e/ou na idade para formar a nova geração;
O processo normalmente é iterativo até que uma qualidade (soluções) seja alcançada ou então um limite computacional, temporal, etc;
Processos fundamentais dos sistemas evolucionários Operadores de variação (recombinação e mutação) Ação de seleção como força que pressiona a
qualidade11
ALGORITMOS EVOLUCIONÁRIOS
A evolução é visto com um processo de adaptação
Necessidade de manutenção da diversidade de indivíduos;
Procedimentos de seleção contam com mecanismos baseados em aleatoriedade e elitismo;
12
ALGORITMOS EVOLUCIONÁRIOS
AE são baseados em populações, processam simultaneamente uma coleção de soluções;
AE freqüentemente usam recombinação para mesclar informações de mais de uma solução candidata para a criação de uma nova solução;
AE são estocásticos;
População
Pais
Prole
Recombinação
Mutação
Seleção de pais
Seleção de sobreviventes
Termino
Inicialização
13
COMPORTAMENTO TÍPICO DE UM AE
Fases da otimização de um problema unidimensional
Fase inicial:Distribuição quase aleatória da população
Fase mediana:População disposta nas encostas
Fase final:População concentrada no alto das colinas 16
OUTRAS CARACTERÍSTICAS DOS AE
Possuem uma fase de exploração e outra chamada de explotação;
Podem sofrer problemas de convergência prematura, ou seja, perda acelerada da diversidade da população;
Possuem um “anytime behaviour”, ou seja, conseguem apresentar uma solução a qualquer momento da busca;
Freqüentemente chamados de métodos de otimização global;
Englobam um conjunto de algoritmos que diferem em alguns detalhes.
17
FAMÍLIA DE AE
Normalmente são classificados de acordo com a forma de representação das soluções candidatas Genétic Algorithms (GA) – cadeia de caracteres
sob um alfabeto finito; Evolution Strategies (ES) – vetores de valores
reais; Evolutionary Programming (EP) – máquinas de
estados finitos; Genetic Programming (GP) – estrutura de
árvores. Essas diferenças possuem uma origem
principalmente histórica.18
FAMÍLIA DE AE
Componente/
Característica
Dialetos dos AE
GA ES EP GP
Problemas típicos
Otimização combinatória
Otimização contínua
Otimização Modelagem
Representação típica
Cadeia de caracteres sob um alfabeto finito
Vetores de números reais
Freqüente utilização do formato de ES
Árvores
Papel da recombinação
Operador de variação primário
Importante, mas secundário
Nunca aplicado Primário/somente um operador de variação
Papel da mutação
Operador de variação secundário
Importante, mas as vezes é o único operador
Somente um operador de variação
Secundário, as vezes não usado por completo
Seleção de pais
Aleatória, guiada pela aptidão
Aleatória, uniforme
Cada indivíduo cria um filho
Aleatória, guiada pela aptidão
Seleção de sobreviventes
Generational e Stead-state
Determinística, guiada pela aptidão
Aleatória, guiada pela aptidão
Aleatória, guiada pela aptidão
19
POR QUE UTILIZAR AE PARA RESOLVER PROBLEMAS DE OTIMIZAÇÃO?
Propriedades das funções Embora as considerações sobre
convexidade/concavidade e continuidade não sejam necessariamente um fundamento de AE, esse é o real propósito das maioria das técnicas de programação matemática. Embora ambos os domínios compartilhem o mesmo conceito de algoritmos “gerar-e-testar”, procedimentos de busca evolucionários não são diretamente comparáveis as técnicas de busca convencionais.
Uma única solução Técnicas de programação matemáticas fornecem
uma única “melhor” solução que não é interessante para muitas tomadas de decisão. AE são várias “melhores”.
20
POR QUE UTILIZAR AE PARA RESOLVER PROBLEMAS DE OTIMIZAÇÃO?
Impraticabilidade Normalmente não tratável com técnicas de
programação matemáticas, já com AE o problema pode vir a tornar-se tratável.
Conhecimento do domínio Não é difícil utilizar AE, não requerem um
conhecimento rico do domínio. Robustez
Uma mesma estrutura pode ser utilizada para resolver vários problemas.
Manipulação de restrição e métodos de penalidade A função de pênalti é facilmente implementável
assim como a mudança de seus parâmetros.
21
POR QUE UTILIZAR AE PARA RESOLVER PROBLEMAS DE OTIMIZAÇÃO?
Exploração e explotação AE são de propósito geral, independente de
domínio e possuem características de exploração e explotação.
Tempo computacional Provêm rápidas aproximações a funções, near-
optimal Otimização multiobjetivo
Conseguem trabalhar muito bem em problemas com objetivos conflitantes.
Soluções iniciais Não requerem um método especializado para
gerar as soluções iniciais.22
POR QUE UTILIZAR AE PARA RESOLVER PROBLEMAS DE OTIMIZAÇÃO?
Problemas árduos Devido ao paralelismo inerente dos AE os
problemas árduos passam ser menos árduos se comparados quando do uso de técnicas clássicas.
Otimização sob mudança do ambiente Em muitos problemas de otimização do mundo
real, o ambiente flutua, provocando mudanças dramáticas na aptidão dos indivíduos. Otimização sob mudanças no ambiente (dinâmica, não-estacionária ou on-line) podem ser manipuladas eficientemente através do uso de AE. 23
QUANDO É RECOMENDÁVEL USAR AE?
Otimização do conhecimento Mesmo pesquisadores/profissionais com um
pobre ou nenhum conhecimento matemático a respeito do problema de otimização ainda podem resolver o problema usando uma metodologia baseada em AE;
Quando soluções ranked como 2ª, 3ª, etc. melhores são desejadas;
Para solucionar problemas multimodais; Para uma rápida aproximação de soluções; Para solucionar problemas multiobjetivos; Otimização sob mudanças no ambiente; 24
QUANDO É RECOMENDÁVEL USAR AE?
Para a construção de sistemas inteligentes híbridos;
Se AE são computacionalmente menos custosos que outras técnicas, devem então ser preferidos;
Se o tempo computacional não é uma preocupação, métodos baseados em AE podem ser empregados para encontrar soluções quase-ótimas;
Problemas envolvendo características complexas como multi-objetividade, multimodalidade, mudanças no ambiente, etc. torna-se útil a aplicação de AE.
25
DESVANTAGENS DO USO DE AE
Técnicas baseadas em AE são reconhecidas com algoritmos de busca heurísticos. Não há garantia de “ótimalidade” quando aplicados a
solução de problemas de otimização; Os parâmetros usados pelas técnicas baseadas em
AE são orientadas ao problema. Não é uma tarefa fácil a determinação de parâmetros
apropriados para um problema; O padrão de convergência e complexidade de
tempo também são dependentes do problema; Não ajudam a examinar a percepção matemática
de problemas de otimização, onde pode haver informações adicionais úteis para a tomada de decisão.
26
DESVANTAGENS DO USO DE AE
A análise de sensibilidade pode ser executada, para todo o tipo de modelo, na escala desejada, embora não seria tão eficiente quanto a sensibilidade do LP (Linear Programming);
Em alguns casos não são úteis para o ajuste fino de soluções (busca local, explotação);
Alto custo computacional na avaliação do indivíduo (dependente do problema);
Convergência prematura (manutenção da diversidade);
Ausência de um mecanismo explicativo.27
POR QUE HIBRIDIZAR AE?
Modelos híbridos cujos AEs… são parte de um sistema maior ou têm outros métodos ou estruturas de dados
incorporados a eles.
Objetivos da hibridização: Modelos híbridos para melhorar desempenho de
técnicas já existentes. Modelos híbridos para melhorar a busca por boas
soluções. Modelo híbridos para resolver os pontos
negativos dos AE. 28
POR QUE HIBRIDIZAR AE?
Muitos problemas complexos podem ser decompostos em sub-problemas a serem resolvidos com técnicas distintas.
Não existe um método de propósito geral totalmente bem sucedido ou eficiente. Pode-se combinar AEs com heurísticas
específicas. Deve-se ter cautela para não fazer a busca local
inviabilizar a geração de novas soluções. Busca-se solução híbrida por ser melhor que
cada um dos algoritmos que compõe o modelo híbrido.
29
NO FREE LUNCH (NFL) TEOREMA
A quantidade de conhecimento específico no algoritmo híbrido é variável e pode ser ajustada.
30
ALGORITMOS MEMÉTICOS
AEs podem explorar melhor que explotar: Em parte devido à natureza aleatória dos
operadores de variação. Pode-se adicionar uma etapa de busca local
para melhorar explotação. A combinação de AEs com operadores de
busca local que atuam dentro do laço do AE é chamada de Algoritmo Memético. O termo memético também é usado para AEs
cujos operadores empregam conhecimento específico de instâncias do problema.
31
BUSCA LOCAL
Busca local é um processo iterativo para examinar o conjunto de pontos na vizinhança da solução atual e a substituir por um vizinho melhor, caso exista.
32
BUSCA LOCAL
Componentes principais que afetam o algoritmo:
Regra de pivoteamento (encerra o laço interno):
Condição de profundidade (encerra o laço externo): Determina o número de interações da busca local.
Escolha da função geradora de vizinhança
33
BUSCA LOCAL
Escolha da função de vizinhança: N(i) é freqüentemente definida como um conjunto
de pontos que podem ser alcançados através da aplicação de algum operador de movimento ao ponto i.
Representação equivalente: grafo não direcionado G(v,E):
v é o conjunto de vértices que representa todos os pontos representáveis, as soluções em potencial.
E é o conjunto de arestas que representa as possíveis transições que podem ocorrer a partir da aplicação de um único operador. As arestas podem ser direcionadas e ponderadas.
34
BUSCA LOCAL
Em resumo: É definida pela combinação de vizinhança, N(x),
e regra de pivoteamento. É relacionada a metáfora da paisagem
(landscape). N(x) é definida como o conjunto de pontos que
podem ser alcançados a partir da aplicação de um operador de movimento.
Exemplo: Busca bit flipping em problemas binários.
35
LAMARCKIANISMO E EFEITO BALDWIN
Herança das mudanças feitas ao indivíduo (características adquiridas): Um AM é dito Lamarckiano se o indivíduo
resultante da busca local substitui o original. Isto é, as características são herdadas.
Um AM é dito Baldwiniano se o processo evolucionário for guiado pelas adaptações favoráveis sem modificações nas aptidões dos indivíduos, devido a aprendizagem ou desenvolvimento, refletindo em mudanças de características genéticas.
Abordagem Baldwiniana ou uma combinação probabilística dos dois mecanismos.
36
TWO MODELS OF LIFETIME ADAPTATION
Lamarkian traits acquired by an individual during its lifetime
can be transmitted to its offspring e.g. replace individual with fitter neighbour
Baldwinian traits acquired by individual cannot be
transmitted to its offspring e.g. individual receives fitness (but not
genotype) of fitter neighbour
37
ESTRUTURA DE UM AM - INICIALIZAÇÃO
Possíveis benefícios por iniciar AES com soluções existentes: Evitar a perda de esforço computacional
refletindo aumento de eficiência (velocidade). Direcionar busca para regiões promissoras do
espaço de busca levando a aumentar efetividade (qualidade da solução final).
Dividir o esforço computacional entre inicialização heurística e busca evolucionária pode gerar melhores resultados que gastar todo o esforço em busca evolucionária apenas.
40
ESTRUTURA DE UM AM - INICIALIZAÇÃO
Maneiras de mudar a função de inicialização em relação a um critério aleatório: Semeadura (Seeding): Semeia a população com uma
ou mais soluções boas, vindas de outras técnicas: Exemplos de emprego de informação específica do
problema: heurística do vizinho mais próximo para os problemas do tipo TSP e agendamento do mais difícil em primeiro lugar para problemas de agenda e planejamento.
Incialização Seletiva (Selective initialisation): Cria-se grande número de soluções aleatórias e seleciona-se a população inicial a partir delas: Realizar N torneios de tamanho k; Selecionar baseando-se também na diversidade.
41
ESTRUTURA DE UM AM - INICIALIZAÇÃO
Ainda maneiras de mudar a função de inicialização em relação a um critério aleatório: Realizar busca local em cada membro da
população escolhido aleatoriamente. Produz-se um conjunto de indivíduos localmente ótimos.
Empregar um ou mais métodos anteriores para identificar uma ou mais boas soluções: Deve clonar e aplicar mutação com altas taxas (mass
mutation) nas soluções iniciais encontradas de forma a gerar um número de indivíduos na vizinhança do ponto inicial.
42
ESTRUTURA DE UM AM – OPERADORES INTELIGENTES
Operadores inteligentes de variação: Incorporam conhecimento específico da instância ou do problema ao operador.
Introdução de viés (bias) nos operadores: Exemplo 1: Aumentar a probabilidade de escolha
de características mais compactas para emprego em um classificador.
Exemplo 2: Genes codificando instruções de microprocessador de modo a serem agrupados em conjuntos de efeitos similares.
43
ESTRUTURA DE UM AM – OPERADORES INTELIGENTES
Uso de conhecimento específico do problema: Incorporação de uma fase de busca local dentro
de um operador de recombinação. Ex.: testar todas as possíveis orientações dos
dois fragmentos de estrutura de proteína “separados” pelo ponto de cruzamento e pegar a energeticamente mais favorável. Se nenhum ajuste possível for encontrado, escolher outro ponto de cruzamento.
Uso de conhecimento específico da instância: Operadores recebem heurística muito específica. Ex.: Merz and Friesleben’s distance-preserving
crossover (DPX) operator para o TSP.
44
ESTRUTURA DE UM AM – OPERADORES INTELIGENTES
Busca local atuando sobre todas as soluções criadas pelos operadores de variação. É compatível com o conceito de meme, pois
realiza uma ou mais fases de melhorias de indivíduos durante um ciclo do AE.
É o tipo mais comum.
45
PROJETO DE AM
AMs não são “soluções mágicas” para problemas de otimização.
Deve-se tomar cuidado com: Diversidade da população. Escolha dos operadores. Uso do conhecimento adquirido durante o
processo de otimização.
46
PROJETO DE AM – PRESERVAÇÃO DA DIVERSIDADE
O problema da convergência prematura.
Técnicas para combater este problema: Usar somente uma proporção pequena de boas
soluções conhecidas na população inicial. Usar operadores de recombinação que são
projetados para preservar diversidade (como Merz’s DPX).
Modificar operador de seleção para prevenir duplicações.
Modificar operador de seleção ou o critério de aceitação da busca local para usar um método de Boltzmann.
47
PROJETO DE AM – PRESERVAÇÃO DA DIVERSIDADE
Manutenção de diversidade em uma população é o objetivo de algoritmos com algum sucesso: O cruzamento DPX de Merz explicitamente gera
indivíduos que são eqüidistantes para cada pai, tendo a mesma distância entre os pais.
Operador adaptativo de Boltzmann, por Krasnogor, usa critério de aceitação de novo indivíduo baseado no cozimento simulado. A temperatura é inversamente proporcional à diversidade da população.
48
PROJETO DE AM – ESCOLHA DOS OPERADORES
O fator crucial no projeto de um AM é: Escolha da heurística de melhoramento ou do
operador de movimento da busca local.
Merz e Freisleben mostram que a escolha do operador de movimento pode ter efeito dramático na eficiência e na efetividade da busca local.
Krasnogor mostrou vantagens em usar busca local com um operador de movimento que é diferente dos operadores de movimento usados pela mutação e pelo cruzamento.
Podem-se disponibilizar múltiplos operadores de busca local, escolhendo-se qual a ser aplicado em cada caso.
49
PROJETO DE AM – USO DO CONHECIMENTO
Como usar e reusar o conhecimento adquirido durante o processo de otimização? Na recombinação. De modo geral não são usados mecanismos
explícitos. Uma possível hibridização – tabu search. Extensões dos esquemas de aceitação/seleção
de Boltzmann. Uso de informação sobre os genomas da população
atual e/ou populações anteriores.
50
ALGUNS ARTIGOS... Delgado M., Cuellar M.P., Pegalajar M.C. Multiobjective hybrid
optimization and training of recurrent neural networks. In IEEE TRANSACTIONS ON SYSTEMS MAN AND CYBERNETICS PART B-CYBERNETICS, vol. 38(2), pp. 381-403, 2008.
Petrovic N.I., Crnojevic V. Universal impulse noise filter based on genetic programming. IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 17(7), pp. 1109-1120, 2008.
Ben Ali, Y.M. Advances in evolutionary feature selection neural networks with co-evolution learning . NEURAL COMPUTING & APPLICATIONS, vol. 17(3), pp. 217-226, 2008.
Zhou, Y., He, J. A runtime analysis of evolutionary algorithms for constrained optimization problems. IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION, vol. 11(5), pp. 608-619, 2007.
Droste, S., Jansen, T., Wegener, I. On the analysis of the (1 + 1) evolutionary algorithm. Theoretical Computer Science, 276, pp. 51-81, 2002.
51
CONFERÊNCIAS E PERIÓDICOS SOBRE AE
Conferências IEEE Conference on Evolutionary Computation
(CEC) Genetic and Evolutionary Computation
Conference (GECCO) Parallel Problem Solving from Nature (PPSN).
Periódicos Evolutionary Computation, IEEE Transactions on Evolutionary Computation Genetic Programming and Evolvable Machines
52
REFERÊNCIAS Eiben, A.E., Smith, J. E.. Introduction to
Evolutionary Computing. Berlin: Springer, 2003. Linden, R. Algoritmos Genéticos: uma importante
ferramenta da inteligência computacional. Rio de Janeiro: Brasoft, 2006.
Pal, S. k., Bandyopadhyay, S. Classification and Learning using Genetic Algorithms. Berlin: Springer, 2007.
Haupt, R. L., Haupt, S.E. Practical Genetic Algorithms. USA: Wiley, 1998.
Khosla, R., Dillon, Tharam. Engineering Intelligente Hybrid Multi-Agente Systems. USA: KAP, 1997.
De Jong, K. A. Evolutionary Computation. London: MIT, 2006.
53