MICROSOFT SPEECH API Processamento de Voz Eng. Informática 5º Ano Trabalho Realizado Por: António Afonso Nº 177/01 Nelson Vicente Nº 206/01 Ricardo Antunes Nº 160/01 Escola Superior de Tecnologia Instituto Politécnico de Castelo Branco Licenciatura em Engenharia Informática
16
Embed
MICROSOFT SPEECH API Processamento de Voz Eng. Informática 5º Ano Trabalho Realizado Por: António AfonsoNº 177/01 Nelson VicenteNº 206/01 Ricardo AntunesNº
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
MICROSOFT SPEECH API
Processamento de VozEng. Informática
5º Ano Trabalho Realizado Por:António Afonso Nº 177/01Nelson Vicente Nº 206/01Ricardo AntunesNº 160/01
Disponível em:http://sapi.areadeservico.com
Escola Superior de TecnologiaInstituto Politécnico de Castelo BrancoLicenciatura em Engenharia Informática
Agenda
02-05-2007Processamento da Voz - EST IPCB - 2006 / 2007
2
Introdução ao SAPI Critérios de Escolha de uma API Vista Geral do SAPI Arquitectura do SAPI Visão da Microsoft Comparação entre as Releases 4 e 5 do SAPI Microsoft Speech Research Group Projectos Desenvolvidos Projectos em Desenvolvimento Ferramentas de Desenvolvimento Programa Demonstrativo
Introdução
02-05-2007Processamento da Voz - EST IPCB - 2006 / 2007
3
API desenvolvida pela Microsoft Foi introduzido como parte dos serviços do
Windows em 1995
Actualmente o Windows XP e o Windows Vista já integram nas suas distribuições a plataforma SAPI
As versões mais conhecidas são: SAPI4 SAPI5
Critérios na escolha de uma API
02-05-2007Processamento da Voz - EST IPCB - 2006 / 2007
4
Output das amostras de áudio
Facilidade de uso
Configuração de parâmetros
Linguagem de programação
Portabilidade
Vista Geral
02-05-2007Processamento da Voz - EST IPCB - 2006 / 2007
5
Oferece uma relação de alto nível entre uma aplicação e os motores de voz
As principais funcionalidades: TTS (Text-to-Speech)
Sintetizam frases escritas e ficheiros em áudio usando vozes sintéticas
SR (Speech Recogniser) Convertem a voz de um humano em frases (strings) e
ficheiros
DSR (Dictation Speech Recogniser)
TEL (Telephony)
Arquitectura
02-05-2007Processamento da Voz - EST IPCB - 2006 / 2007
6
Speech API pode ser visto como um middleware
Motores: Text-To-Speech Speech-Recogniser
Visão da Microsoft
02-05-2007Processamento da Voz - EST IPCB - 2006 / 2007
7
Integração de engenhos de reconhecimento e síntese de voz em equipamentos informáticos: