Top Banner
Sintetizadores de Voz/Leitores de Tela e Reconhecimento de Voz Leandro Rodrigues Ferreira [email protected] 22 de novembro de 2006
21

Sintetizadores leitores reconhecimento_voz

Jul 25, 2015

Download

Technology

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Sintetizadores leitores reconhecimento_voz

Sintetizadores de Voz/Leitores de Tela e Reconhecimento de Voz

Leandro Rodrigues Ferreira

[email protected]

22 de novembro de 2006

Page 2: Sintetizadores leitores reconhecimento_voz

Sintetizadores de Voz

Texto -> Voz

Leitores de Tela●Transmitir a linguagem escrita através da linguagem falada ou em braille

Page 3: Sintetizadores leitores reconhecimento_voz

Utilidade

● Acessibilidade => Deficiência Visual e Auditiva

● Treinos e Terapias

Page 4: Sintetizadores leitores reconhecimento_voz

Exemplos

● Windows– Virtual Vision (Micropower)– DosVox (UFRJ)– Jaws (Freedom Scientific)– Falador

Page 5: Sintetizadores leitores reconhecimento_voz

Exemplos Windows

● Virtual Vision (Micropower)– Ambiente Windows e Office– Melhor em português– Rastreamento do mouse– Preço e suporte no Brasil– Dispensa sintetizador externo– Preço: R$700,00– Multi-idiomas (com o uso de outros

sintetizadores)– Indicação do foco

Page 6: Sintetizadores leitores reconhecimento_voz

Exemplos Windows

● DosVox (NCE – UFRJ)– roda em modo DOS– voltado para deficientes visuais– tecnologia nacional e simples (viabilidade)– baixo custo ou gratuito (p/ versão reduzida)– utiliza padrões internacionais de computação

Page 7: Sintetizadores leitores reconhecimento_voz
Page 8: Sintetizadores leitores reconhecimento_voz
Page 9: Sintetizadores leitores reconhecimento_voz

Exemplos Windows

● Jaws (Freedom Scientific)– Síntese de voz em vários idiomas– Leitura de menus– Indicação de fonte– Simula o mouse (dir. “*” esq. “/”)– programas de difícil acesso a outros

leitores de tela– Custo: US$800,00 a US$1200,00

Page 10: Sintetizadores leitores reconhecimento_voz

Exemplos Windows

● Falador–Sintetizador freeware, roda c/ wine (??)– Apresenta a “boca falada”– Aprendizado de outros idiomas

Page 11: Sintetizadores leitores reconhecimento_voz

Exemplos - Linux

● Festival– Sintetizador de linha de comando

● Gnopernicus– Sintetizador/Leitor do Gnome

● Kmouth– Def. auditivos, em inglês

Page 12: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz● Interpretação da fala humana● Três fases distintas: aquisição do sinal de

voz, extração de parâmetros (características) e reconhecimento do padrão (classificação).

● Utilidades:– Transcrição de texto– Execução de comandos– Automação Residencial

Page 13: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz

● Exemplos Linux:– cVoiceControl: modo texto–VoiceCode: voltado a programadores

com LER● Exemplos Windows:

– FreeSpeech (Philips)– ViaVoice (IBM)

Page 14: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz

● Classificação:– Requerer treinamento– Reconhecer fala contínua ou

pausadamente (período de silêncio)–Tamanho do vocábulo

Page 15: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz

● Funcionamento– Pouco treinamento, ritmo normal, fala

contínua e amplo vocábulo: 95% a 98% de acerto.

– Sem treinamento: reconhece número pequeno de palavras.

Page 16: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz

● Problemas Técnicos– Variações da fala– Ambiente externo– Segmentação da fala (limitação dos

fonemas)– Tamanho do vocabulário e

ambigüidades

Page 17: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz● Etapas do reconhecimento:

– Trabalho de reconhecimento voltado ao reconhecimento de padrões.

– Fase de extração de características: ●LPC (Linear Predictive Coding – Codificação Preditiva Linear, o modelo mistura Gaussiano)

● FFT (Fast Fourier Transform – Transformada Rápida de Fourier)

Page 18: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz

● Etapas do reconhecimento:–Fase de extração de características:

●LPC e modelo de mistura Gaussiano: reconhecimento de locutor (analisa trato vocal, que é peculiar a cada pessoa)

●FFT: reconhecimento de palavras isoladas (abordagem entre sinais em função das freqüências)

Page 19: Sintetizadores leitores reconhecimento_voz

Reconhecimento de Voz

● Etapas do reconhecimento:– Fase de classificação

● Problema no tempo de execução● Métodos matemáticos: alto processamento

● Tendência a algoritmos inteligentes (Redes Neurais Artificiais), mais utilizados em sist. independentes de locutor

Page 20: Sintetizadores leitores reconhecimento_voz

Conclusão

● Sintetizadores/Leitores de tela e sistemas de reconhecimento de voz precisam de ajustes.

● Desenvolvimento para Linux ainda é deficiente.

● Grande crescimento na área.

Page 21: Sintetizadores leitores reconhecimento_voz

Referências● http://www.jornalismo.ufsc.br/acic/acesso/acesso_gr.htm

● http://groups.msn.com/falador/falador.msnw

● http://docs.kde.org/stable/pt/kdebase/userguide/kmouth.html

● http://docs.kde.org/stable/pt/kdebase/userguide/ktts.html

● http://www-usr.inf.ufsm.br/~maicongb/trabalho.html#recon

● http://www.rnp.br/wrnp2/2001/palestras_aplicacao/res_aplic_18.pdf

● http://www.inovacaotecnologica.com.br/noticias/noticia.php?artigo=010150040915

● http://www.speechrecognition.philips.com/index.asp?id=788