-
1UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y
ARQUITECTURA
DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y
TELECOMUNICACIONES
INGENIERA ELECTRNICA
TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN
ELECTRNICA
TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UN
CODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTACOMPUTACIONAL
MATLAB: CALCULO DE LA EXCITACIN
AUTOR: REYNALDO CRDENAS JORGE
PAMPLONA-COLOMBIANOVIEMBRE DE 2006
-
2UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y
ARQUITECTURA
DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y
TELECOMUNICACIONES
INGENIERA ELECTRNICA
TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN
ELECTRNICA
TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UNCODIFICADOR DE VOZ
CELP UTILIZANDO LA HERRAMIENTA
COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN
AUTOR: REYNALDO CRDENAS JORGE
DIRECTOR: PhD. (c) DIEGO FERNEY GMEZ CAJAS
DIRECTOR DE PROGRAMA: Ing. CESAR AUGUSTO RANGEL
PAMPLONA-COLOMBIANOVIEMBRE DE 2006
-
3UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y
ARQUITECTURA
DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y
TELECOMUNICACIONES
INGENIERA ELECTRNICA
TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN
ELECTRNICA
TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UNCODIFICADOR DE VOZ
CELP UTILIZANDO LA HERRAMIENTA
COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN
NOMBRES Y FIRMAS DE AUTORIZACIN PARA SUSTENTAR:
----------------------------------------------
--------------------------------------------------REYNALDO CRDENAS
PhD. (c) DIEGO FERNEY GMEZ
JORGE CAJAS Autor del trabajo de grado Director del trabajo de
grado
--------------------------------------------------------------
Ing. CESAR AUGUSTO RANGEL VERA
Director de programaJURADO CALIFICADOR
---------------------------------------------- --
---------------------------------------------
Ing. ADRIN CARVAJAL MSc.(c) WALTER GASTELBONDO FERRER
BARRAGAN
Presidente Oponente
---------------------------------------------MSc. (c) JOS DEL
CARMEN PEA
Secretario
PAMPLONA-COLOMBIANOVIEMBRE DE 2006
-
4DEDICATORIA
Este proyecto va dedicado a Dios, a mi papa Cristbal Crdenas
Mendoza, a
mi madre Emilse del Socorro Jorge Arrieta; a mis hermanos,
Mauricio Jos,
Mara Anglica; a mi sobrino Reyden Daniel Crdenas Jorge y a
todas
aquellas personas que ayudaron a crear en mi un espritu de lucha
y
fortaleza, a mis amigos que me colaboraron a que este proyecto
se
efectuara.
-
5PENSAMIENTO
El seor es mi pastor, nada me falta:
En verdes praderas me hace reposar, me conduce hacia las aguas
del
remanso y me conforta mi alma; me gua por los sendero de
justicia, por
amor a su nombre; aunque vaya por un valle tenebroso, no tengo
miedo a
nada, porque tu ests conmigo, tu voz y tu callado me
sostienen.
Me preparas una mesa ante mis enemigos, perfumas con ungento
mi
cabeza y me llenas la copa a rebozar.
Lealtad y dicha me acompaan todos los das de mi vida; habitar la
casa del
seor por siempre jams.
Salmo
-
6AGRADECIMIENTOS
En primer lugar, agradezco a Dios por las bendiciones que me ha
dado y por
permitirme culminar esta etapa importante de mi vida, a mi pap
Cristbal
Crdenas Mendoza, a mi madre Emilse del Socorro Jorge Arrieta, a
mis
hermanos Mauricio Jos, Anglica Mara, a mi sobrino Reyden
Daniel
Crdenas, y a todos mis amigos.
Agradezco a mi director Diego Ferney Gmez Cajas por la
colaboracin en
el desarrollo y finalizacin de este proyecto.
Agradezco a mis compaeros que contribuyeron de alguna u otra
forma a la
realizacin de este trabajo.
-
7NDICE GENERAL
DEDICATORIAPENSAMIENTOAGRADECIMIENTOS
Pag.
RESUMEN Y ABSTRACT ???????????????????. 13INTRODUCCIN
??????????????????????.. 16JUSTIFICACIN????????????????????????
17
DELIMITACIONES???????????????????????? 19
CAPITULO I.EL SONIDO Y SUS CARACTERSTICAS?????????????. 20
El sonido???????????????????????????.. 20
Antecedentes histricos?????????????????????. 21
Naturaleza del sonido??????????????????????. 25
CUALIDADES DEL SONIDO??????????????????? 26
Intensidad???????????????????????????. 27
Tono?????????????????????????????? 28
Presin sonora ?????????????????????????. 29
Potencia ???????????????????????????? 30
Fenmenos fsicos del sonido??????????????????? 30
Reflexin???????????????????????????? 31
Refraccin???????????????????????????. 31
Difraccin ???????????????????????????. 33
Efecto doppler ?????????????????????????. 34
-
8LA VOZ Y SUS CARACTERISTICAS??????????????? 37
Fonologa y fontica ??????????????????????. 40
Fontica experimental?????????????????????? 41
Fontica articulatoria ??????????????????????. 41
ANATOMIA DEL APARATO FONADOR?????????????? 43
Formantes ??????????????????????????? 45
Clasificacin de los sonidos???????????????????.. 49
Oralidad y nasalidad??????????????????????? 50
Tonalidad ???????????????????????????. 50
Lugar y modo de articulacin??????????????????? 51
Posicin de los rganos articulatorios???????????????. 53
Duracin???????????????????????????? 54
Unidades fonticas ??????????????????????? 57
CARACTERISTICAS DE LA VOZ????????????????? 58
Modelo del tracto voclico ???????????????????? 58
ANATOMIA DEL SISTEMA AUDITIVO HUMANO??????????. 61
El odo????????????????????????????? 61
El odo externo ????????????????????????? 62
El odo medio ?????????????????????????.. 63
El odo interno?????????????????????????.. 65
Fenmenos asociados al odo??????????????????.. 68
Efecto de enmascaramiento???????????????????. 69
Capacidad auditiva???????????????????????. 69
RUIDO Y SUS CARACTERISTICAS ???????????????. 72
Ruido externo?????????????????????????.. 73
Ruido industrial????????????????????????? 74
Ruido atmosfrico???????????????????????? 74
-
9Ruido extraterrestre??????????????????????? 75
Ruido interno?????????????????????????... 75
Ruido trmico?????????????????????????.. 76
Ruido de los semiconductores ??????????????????. 78
Ruido de intermodulacion????????????????????.. 78
Ruido blanco o gaussiano????????????????????. 79
Ruido de impulso de aguja???????????????????? 80
CAPITULO II.CODIFICACION DE VOZ ????????????????????. 81
Definicin de codificacin de voz ????????????????? 81
Historia de los codificadores ??????????????????... 81
Muestreo y cuantificacin ???????????????????? 83
Cuantificacin uniformes ????????????????????.. 85
Cuantificacin logartmica ???????????????????? 89
Cuantificacin no uniforme ???????????????????. 89
Cuantificacin vectorial ????????????????????? 91
Medida subjetiva de la voz???????????????????? 92.
CLASIFICACION DE LOS CODIFICADORES???????????.. 91
Codificadores de forma de onda ?????????????????. 95
Codificadores en el dominio del tiempo??????????????.. 95
Modulacin por codificacin de impulsos?????????????? 96
Modulacin por codificacin de impulsos diferencial?????????
96
Modulacin delta???????????????????????? 98
Modulacin por codificacin de impulsos diferencial adaptativa????
99
Codificacin el dominio de la frecuencia ?????????????.. 100
Codificacin perceptual????????????????????.. 101
Codificacin en subbandas ?????????????????? 102
Codificacin por transformada ?????????????????. 102
-
10
Vocoders ??????????????????????????. 105
Vocoder por prediccin lineal?????????????????? 107
Codificadores hbridos ????????????????????? 111
Codificacin relp???????????????????????? 112
Codificacin mpc ???????????????????????. 112
Codificacin celp???????????????????????. 114
Codificacin vselp??????????????????????? 116
Anlisis de predicion lineal???????????????????. 120
Filtro de prediccin de retardo largo???????????????. 121
Codificadores celp??????????????????????? 124
Orgenes del celp???????????????????????.. 127
Estndares??????????????????????????. 127
Predictor corto????????????????????????? 128
Predictor largo????????????????????????? 128
Excitacin por cdigo?????????????????????? 128
Filtros????????????????????????????? 129
Filtro FIR???????????????????????????... 130
Fundamentos de diseo????????????????????? 133
Especificaciones de diseo???????????????????? 134
Fundamentos de mtodos de ventaneo??????????????.. 134
Propiedades de las ventanas??????????????????? 135
Filtro IIR????????????????????????????. 140
Capitulo IIICODIFICACIN DE LA VOZ MEDIANTE PREDICCIN LINEAL
CON
EXCITACIN POR CDIGO ALGEBRAICO DE ESTRUCTURA
CONJUGADA ESTANDAR G.729????????????????. 146
PRINCIPIOS BSICOS????????????????????? 146
-
11
Prediccin lineal ???????????????????????? 146
Modelo fuente filtro de la voz??????????????????? 150
Anlisis de prediccin lineal???????????????????? 150
Clculo de la excitacin?????????????????????.. 152
Predictor de largo plazo????????????????????? 152
Implementacin del codificador CELP??????????????? 153
Descripcin general del codificador/decodificador?????????.
154
Codificador??????????????????????????.. 155
Decodificador?????????????????????????.. 157
Retardo???????????????????????????? 157
Preprocesamiento??????????????????????. 158
Anlisis de la frecuencia fundamental en lazo abierto????????.
158
Clculo de la respuesta impulso?????????????????. 160
Clculo de la seal objetivo?????????????????? 160
Bsqueda de la tabla de cdigos adaptativos????????????.. 161
Generacin del vector de tabla de cdigos adaptativos???????..
164
Clculo de palabras de cdigo para retardos de tabla de
cdigos???
adaptativos??????????????????????????. 164
Clculo de la ganancia de tabla de cdigos adaptativos???????..
165
Tabla de cdigos fijos: estructura y bsqueda????????????..
165
Procedimiento de bsqueda de la tabla de cdigos fijos???????..
168
Clculo de palabra de cdigo de la tabla de cdigos fijos???????.
168
Cuantificacin de las ganancias?????????????????? 168
Bsqueda de la tabla de cdigos para cuantificacin de la
ganancia ??????????????????????????? 169
Descripcin de las funciones del decodificador?????????? 170
Procedimiento de decodificacin de los parmetros????????? 170
Decodificacin de los parmetros de filtro LP??????????? 170
Decodificacin del vector de tabla de cdigos adaptativos?????
171
Decodificacin del vector de tabla de cdigos fijo?????????
172
-
12
Decodificacin de las ganancias de las tablas de cdigos
adaptativos y
Fijos?????????????????????????????? 172
Cdigo en matlab?????????????????????? 175
ANALISIS DE CONFIABILIDAD ????????????????? 180MARCO
ECONOMICO????????????????????? 181ANALISIS DE
LEGALIDAD???????????????????. 183INFLUENCIA AMBIENTAL DEL
TRABAJO????????????. 184RESULTADOS????????????????????????..
185CONCLUSIONES ???????????????????????.
187RECOMENDACIONES?????????????????????. 188REFERENCIAS
BIBLIOGRAFICAS???????????????? 189ANALISIS
BIBLIOGRAFICO??????????????????? 193GLOSARIO DE TERMINOS NO
CONVENCIONALES ???????.. 194SIMBOLOS NO CONVENCIONALES
??????????????? 196ABREVIATURAS
UTILIZADAS????????????..................... 198ANEXOS
???????????????????????????. 199
-
13
ndice de Figuras
Nombre Pg.FIGURA 1 Intensidad de varios
elementos...................................................................
31FIGURA 2 Reflexin del sonido
.....................................................................................
35FIGURA 3 Refraccin del
sonido...................................................................................
36FIGURA 4 Difraccin del sonido
....................................................................................
38FIGURA 5 El efecto Doppler
..........................................................................................
39FIGURA 6 Corte esquematico del aparato fonador humano
...................................... 48FIGURA 7 La glotis
.........................................................................................................
48FIGURA 8 Funcin de rea
............................................................................................
50FIGURA 9 Formantes de un sonido
sonoro..................................................................
50FIGURA 10 Formantes de un sonido
sordo..................................................................
51FIGURA 11 Corte esquematizo de la laringe segn un plano
horizontal................... 51FIGURA 12 Diagrama funcional del
aparato fonador ..................................................
52FIGURA 13 Diagrama funcional del aparato fonador
.................................................. 53FIGURA 14
Zonas del aparato
fonador.........................................................................
63FIGURA 15 El
odo..........................................................................................................
65FIGURA 16 El Odo externo
...........................................................................................
66FIGURA 17 El Odo medio
.............................................................................................
68FIGURA 18 El Odo interno
............................................................................................
69FIGURA 19 Funcionamiento del
odo............................................................................
71FIGURA 20 Enmascaramiento simultaneo
...................................................................
73FIGURA 21 Capacidad auditiva de varios animales
.................................................... 74FIGURA 22
Seal continua
............................................................................................
87FIGURA 23 Seal discreta
.............................................................................................
88FIGURA 24 Cuantificacin
uniforme..............................................................................
90FIGURA 25 Cuantificacin no uniforme
........................................................................
92FIGURA 26 Ejemplo de comprensin
...........................................................................
94FIGURA 27 Ejemplo de comprensin(
b)......................................................................
94FIGURA 28 Grfico de la ley- para distintos valores de
......................................... 95FIGURA 29 Calidad de
voz vs
Velocidad....................................................................
98FIGURA 30 Sistema DPCM (a) codificador (b)
decodificador....................................101FIGURA
31Modulacin delta codificador y decodificador
...........................................102FIGURA 32. Error de
sobrependiente
..........................................................................102FIGURA
33. Codificador/decodificador ADPCM
.......................................................103FIGURA
34. Codificador en
sub-bandas....................................................................106FIGURA
35.Codificador ITU G722 Sub
-band.............................................................107FIGURA
36 .Decodificador ITU G722 Sub
?band.......................................................108FIGURA
37.Codificacin por transformada
.................................................................109FIGURA
38.Modelo de produccin de
voz.................................................................110FIGURA
39. Esquema de funcionamiento de Vocoder LPC-10.
.............................112FIGURA 40. Diagrama de bloques del
emisor.
.........................................................113FIGURA
41 Diagrama de bloques del Receptor
.......................................................114
-
14
FIGURA 42 Salida del
predictor..................................................................................116FIGURA
43 (a) Seal original. (b) Residuo del filtro LPC (aumentado en
10dB). (c)Residuo de los filtros LPC y de pitch en cascada
(aumentado en 10dB) .............117FIGURA 44 Etapa de anlisis de
un transmisor
CELP.............................................119FIGURA 45
Detalle de la figura
44..............................................................................119FIGURA
46. Decodificador (sintetizador) CELP
........................................................120FIGURA
47 Decodificador VSELP.
.............................................................................121FIGURA
48 Diagrama del Speech coder
...................................................................122FIGURA
49. Codificador
RPE-LTP..............................................................................123FIGURA
50. Seal filtrada submuestreada y sus correspondientes
secuencias.126FIGURA 51.Decodificador RPE-LTP
............................................................................127FIGURA
52. Esquema de un analizador CELP en la prctica
...................................130FIGURA 53. Especificaciones
de diseo de un filtro paso-bajo normalizado...........135FIGURA 54.
Prototipo de filtros pasa-bajo y pasa-alto
...............................................136FIGURA 55
Prototipo de filtros pasa-banda y banda de
rechazo..............................137FIGURA 56 Filtro FIR
pasa-bajo usando ventana de
hamming................................140FIGURA 57 Filtro FIR paso
bajo usando ventana de
Kaiser......................................141FIGURA 58 Filtro FIR
pasa banda usando ventana de Blackman
............................141FIGURA 59 Esquema bsico de un filtro
IIR
...............................................................142FIGURA
60 Estrategias de diseo de filtros IIR
..........................................................144FIGURA
61 Modelo de un sistema digital bsico
........................................................146FIGURA
62 Curva a modelar
........................................................................................147FIGURA
67 Diagrama general de un Sistema digital de produccin de voz
............148FIGURA 68.a)seal sorda b) Seal sonora c) excitacin
completa ..........................152FIGURA 69. Diagrama de
bloques del predictor corto y largo
plazo.........................152FIGURA 70 Diagrama del filtro de
largo plazo
............................................................153FIGURA
71 Diagrama funcional del modelo conceptual de sntesis (CELP).
..........154FIGURA 72. Principio de codificacin del codificador
CS-ACELP.............................156FIGURA 73 Principio del
decodificador
CS-ACELP....................................................157FIGURA
74 Diagrama de vector de cdigos
fijos........................................................167FIGURA
75 Diagrama de bloques del codificador celp
..............................................174FIGURA 765
Codificador y Decodificador
CELP.........................................................174
-
15
ndice de Tablas
Nombre Pg.TABLA 1 Ejemplo de monemas, grafemas y fonemas
................................................ 43TABLA 2
Clasificacin de las consonantes de la lengua castellana segn el
lugar yel modo de articulacin y la sonoridad
..........................................................................
57TABLA 3 Clasificacin de las vocales castellanas segn la posicin
de la lengua... 58TABLA 4 Ortografas alternativas de George Bernard
Shaw para dos palabrasinglesas
............................................................................................................................
59TABLA 5 Los fonemas del alfabeto fontico internacional utilizados
en la lenguacastellana
.........................................................................................................................
60TABLA 6 Medida subjetiva de la calidad de voz
.......................................................... 97TABLA
7 Respuesta del filtro FIR de largo
plazo........................................................125TABLA
8 Estructura da la tabla de cdigos fijos
.........................................................166
-
16
RESUMEN
Esta investigacin esta orientada al diseo de un codificador de
voz CELP
(Code Excited Linear Prediction) utilizando la herramienta
computacional
MATLAB calculando la excitacin, tomando como gua el estndar
G.729 de
la UIT-T (Unin Internacional de Telecomunicaciones) con el fin
de reducir el
numero de bits en la transmisin de voz .
Para el modelado de la seal de voz, se utilizan dos predictores,
un predictor
a largo plazo, y uno de corto plazo, el primero intenta modelar
la excitacin
peridica de la seal, y el segundo, imita el comportamiento del
tracto vocal.
Por otro lado, un vector de cdigos fijos modela la excitacin no
peridica de
la seal de voz.
La herramienta computacional MATLAB nos ayuda al diseo del
codificador
de voz CS-CELP (Conjugated Structure - Code Excited Linear
Prediction)
definido por el estndar G729, pues contiene diferentes funciones
que nos
facilitan el clculo de los parmetros del codificador, tales
como, los
coeficientes de prediccin lineal, la correlacin de la seales,
la
ventanizacin, conversin de LPC a LSP (line espectrum pairs),
etc.
Para conseguir nuestro objetivo, primero generamos la excitacin
sin pitch
(frecuencia fundamental), es decir, solo la componente sorda de
la excitacin
(vector de cdigos fijos), posteriormente le sumamos la excitacin
peridica
(seal sonora, que se modela con un vector de cdigos
adaptativos)
completando la excitacin.
-
17
La funcin de este diseo es la de proporcionar informacin del
error,
transmitiendo a bajas tasas de bits reduciendo el ancho de banda
sin
sacrificar calidad en la voz y tambin, para aprovechar de una
forma ms
eficiente los diferentes servicios prestados a travs de las
redes que
transportan voz, como Internet, redes de telefona fija, celular,
etc.
-
18
ABSTRACT
This investigation its oriented to design an voice coder CELP
(Code Excited
Linear Prediction) using computacional tool MATLAB, calculating
the
excitation, taking as guide the G.729 standard from the ITU-T
(International
Telecommunications Union - Telecommunications) with the purpose
of
reducing the number of bits in the voice transmission.
By obtain the model of voice signal, two predictors are used, an
long term
predictor, and other short term predictor, first tries to model
the periodic
excitation of the signal, and the second, imitates the behavior
of vocal tract.
On the other hand, a vector of fixed codes models the
nonperiodic excitation
of the voice signal.
Computacional tool MATLAB helps us to the design of voice coder
CS-CELP
(Conjugated Structure - Code Excited Linear Prediction) defined
by the G729
standard, because it contains different functions that
facilitate the calculation
of the coder parameters, such as, the coefficients of linear
lead, the signals
correlation, the windowed, conversion of LPC to LSP (Line
Spectrum Pairs),
between others.
First the excitation without pitch is generated (base
frequency), that is to say,
single the deaf component of the excitation (vector of fixed
codes), later adds
the periodic excitation to him (sonorous signal, that it is
modeled with a vector
of adaptive codes) completing the excitation.
-
19
The task of this design is the one to also provide information
of the error,
transmitting to low rates of bits reducing the bandwidth for the
improvement of
the voice quality and taking advantage of one more efficient
form different
served through the networks that transport voice, like Internet,
networks of
fixed, cellular telephony, between others.
-
20
INTRODUCCION
La voz es la forma ms natural y eficiente de comunicacin entre
los seres
humanos. Sin embargo, cada vez son ms frecuentes las situaciones
en las
que la comunicacin se establece con una mquina, o aquellas en
las que
una mquina puede ayudar a la comunicacin entre dos seres
humanos. Por
esta razn hay herramientas que nos permiten el procesamiento de
la voz,
tales como los mtodos de codificacin diseados para almacenar
y
transmitir la informacin de la voz en forma digital
eficientemente, incluso sin
perder calidad.
La codificacin de voz nos ayuda a optimizar la utilizacin del
canal de
comunicacin transmitiendo informacin a un ancho de banda menor y
una
mayor inteligibilidad y naturalidad. Por ejemplo, cuando se
desea transmitir
varias comunicaciones por un solo canal con la mnima perdida de
calidad,
optimizando la relacin entre velocidad de transmisin
(bits/segundo) e
inteligibilidad del mensaje. Teniendo en cuenta el
almacenamiento de
informacin en forma digital la codificacin de voz permite
utilizar menos bits
necesarios para el almacenamiento, manteniendo un nivel de
calidad de voz
adecuado. Tambin nos permite incorporar algoritmos de cifrado
para
establecer comunicaciones privadas y seguras, o realizar
grabaciones
indescifrables para otras personas.
-
21
JUSTIFICACION
OBJETO
Diseo e implementacin software de un modelo para la excitacin de
un
codificador CELP para el anlisis de la seal de voz en diferentes
entornos,
tales como telefona digital tanto en la red telefnica pblica
conmutada,
como en la red celular mvil, utilizando el algoritmo genrico de
codificacin
CELP.
PROBLEMA
La comunicacin eficiente de las seales de voz ha sido una
necesidad
creciente desde hace ya muchos aos, en particular, la telefona
en sus
distintas manifestaciones satelital, mvil, convencional y ms
recientemente
con la comunicacin de voz a travs de Internet.
En todos estos sistemas de comunicacin modernos el tratamiento
de la
seal de voz para su adecuada transmisin con un mnimo uso de
los
recursos del sistema, tales como canales telefnicos, ancho de
banda de
radio frecuencia, ranuras (slots) de tiempo, etctera, representa
uno de los
intereses ms grandes de la investigacin actual debido a la
creciente
demanda de servicios con un nivel de calidad especfico.
La seal de voz en las aplicaciones ms modernas se transmite en
forma
digital. sta es la preferida actualmente para los servicios de
comunicacin
punto a punto debido a la versatilidad que ofrece para su
manipulacin por
-
22
algoritmos que permitan realizar tareas como compresin,
redistribucin de la
energa en el espectro mediante transformaciones, extraccin de
parmetros
caractersticos, proteccin contra errores del canal y
criptografa.
Las tcnicas de codificacin de voz son usadas tanto para la
transmisin
cuanto para el almacenamiento compacto de seales de voz. Ellas
son
demandadas para la transmisin compartida por diferentes canales
de voz
en comunicaciones telefnicas digitales tanto por la red
telefnica pblica
como por la red celular mvil, adems de permitir mayor seguridad
y sigilo
mediante la criptografa. Por otro lado, los canales compartidos
pueden
transportar vdeo o datos en entornos multimedia, que se estn
tornando
cada vez mas frecuentes y en los cuales la versatilidad de
disponer de
codificadores que operen a varias tasas de compresin permite
establecer
compromisos entre calidad de servicio y cantidad de canales,
necesarios
para atender a la demanda de la telefona por paquetes como la
telefona va
Internet.
-
23
DELIMITACIONES
Objetivo general:
En el presente trabajo se busca estudiar el desarrollo que
tienen en la
actualidad las diferentes formas de codificacin de voz,
puntualizando la
investigacin en el funcionamiento e implementacin de la
excitacin de un
codificador tipo CELP.
Objetivos especficos:
1. Desarrollo conceptual sobre las diferentes tcnicas y
dispositivos
utilizados en la codificacin de voz.
2. Estudio del software MATLAB para las diferentes
aplicaciones
como elaboracin de filtros, clculos, anlisis de seales.
3. Anlisis de la seal de voz por medio de varios tipos de
excitacin.
4. Experimentacin con el codificador CELP, trabajando con
una
base de datos de voz.
5. Modelado de la excitacin para un codificador de voz CELP.
-
24
CAPITULO I. EL SONIDO Y SUS CARACTERSTICAS FSICAS
El Sonido
Fsicamente, el fenmeno sonoro se puede describir como la
percepcin de
oscilaciones rtmicas estimuladas por algn objeto fsico vibrante
que acta
como fuente emisora, este proceso requiere de una fuente que lo
emita, un
canal que lo distribuya y otro que lo reciba. Como formas del
lenguaje sonoro
encontramos la voz, la msica, el ruido o efecto sonoro y el
silencio. El
fenmeno sonoro se divide en tres [38].
Forma sonora:
Toda configuracin acstica que tiende a ser percibida como un
bloque
sonoro unitario y coherente.
Ruido o efecto sonoro:
Conjunto de formas sonoras representadas por sonidos
inarticulados o de
estructura musical, de fuentes sonoras naturales y/o
artificiales, que
restituyen objetiva y subjetivamente la realidad, construyendo
una imagen.
Silencio:
Conjunto continuo de sucesos sonoros poco definidos,
configurados por una
disminucin sbita de la intensidad en la evolucin temporal del
sonido.
-
25
Por lo tanto, el sonido es la vibracin de un medio elstico, bien
sea
gaseoso, liquido o slido. Cuando nos referimos al sonido audible
por el odo
humano, estamos hablando de la sensacin detectada por nuestro
odo, y
que se produce por las rpidas variaciones de presin en el aire
por encima y
por debajo de un valor esttico. Este valor esttico nos lo da la
presin
atmosfrica (alrededor de 100.000 Pascals) el cual tiene unas
variaciones
pequeas y de forma muy lenta, tal y como se puede comprobar en
un
barmetro.
Cmo son de pequeas y de rpidas las variaciones de presin que
causan
el sonido?:
Cuando las rpidas variaciones de presin se centran entre 20 y
20.000
veces por segundo (igual a una frecuencia de 20 Hz a 20 kHz) el
sonido es
potencialmente audible aunque las variaciones de presin puedan
ser a
veces tan pequeas como la millonsima parte de un pascal. Los
sonidos
muy fuertes son causados por grandes variaciones de presin, por
ejemplo
una variacin de 1 pascal se oira como un sonido muy fuerte,
siempre y
cuando la mayora de la energa de dicho sonido estuviera
contenida en las
frecuencias medias (1kHz - 4 kHz) que es donde el odo humano es
ms
sensitivo. El sonido puede ser producido por diferentes fuentes,
desde una
persona hablando hasta un altavoz vibrando y puede viajar a
travs de
distintos medios de propagacin.
ANTECEDENTES HISTORICOS
Antigedad
Los pueblos antiguos efectuaron numerosas especulaciones sobre
los
fenmenos elementales del sonido; sin embargo, con la excepcin de
unas
-
26
pocas suposiciones que resultaron ser ciertas, la ciencia del
sonido no
empez a desarrollarse hasta aproximadamente 1600 d.C. A partir
de
aquella poca, el conocimiento del sonido avanz con ms rapidez
que el
conocimiento de los fenmenos luminosos correspondientes, ya que
estos
ltimos son ms difciles de observar y medir. A los antiguos
griegos no les
preocupaba demasiado el estudio cientfico del sonido, pero
estaban muy
interesados por la msica, y consideraban que representaba los
?nmeros
aplicados?, frente a la aritmtica, que representaba los ?nmeros
puros?. El
filsofo Pitgoras descubri que una octava corresponde a una
relacin de
frecuencias de dos a uno, y enunci la ley que vincula la
consonancia a las
relaciones numricas; posteriormente construy todo un edificio
de
especulaciones msticas en torno a esa ley. Aristteles, en unas
breves
observaciones sobre el sonido, realiz una suposicin bastante
acertada
sobre la naturaleza de su generacin y transmisin. Sin embargo,
no se
efectuaron estudios experimentales vlidos hasta 1600, cuando
Galileo llev
a cabo un estudio cientfico del sonido y enunci muchas de sus
leyes
fundamentales. Galileo determin la relacin entre tono y
frecuencia, y unas
leyes musicales de armona y disonancia. Tambin explic de forma
terica
cmo la frecuencia natural de vibracin de una cuerda tensa, y por
tanto la
frecuencia de los sonidos producidos por un instrumento de
cuerda, depende
de la longitud, peso y tensin de la cuerda.
Siglos XVII Y XVIII
El matemtico francs Marin Mersenne realiz medidas cuantitativas
en
relacin con el sonido al hallar el tiempo de retorno de un eco y
calcular un
valor de la velocidad del sonido que difera del valor real en
menos del 10%.
Mersenne tambin fue el primero en medir de forma aproximada
la
frecuencia de una nota de tono determinado. Midi la frecuencia
de vibracin
de un cable largo y pesado cuyo movimiento era tan lento que
poda seguirse
-
27
a simple vista; despus, a partir de consideraciones tericas,
calcul la
frecuencia de un cable corto y ligero que produca un sonido
audible.
En 1660, el cientfico ingls de origen Irlands Robert Boyle
demostr que el
sonido necesitaba un medio gaseoso, lquido o slido para su
transmisin.
Boyle colg una campana de una cuerda en el vaco y mostr que,
aunque
poda verse cmo el badajo golpeaba la campana, no se oa ningn
sonido.
El matemtico y fsico britnico Isaac Newton fue el primero en
realizar un
tratamiento matemtico del sonido en sus principios matemticos de
la
filosofa natural (1687). Una vez demostrado que la propagacin
del sonido a
travs de cualquier fluido slo dependa de propiedades fsicas
medibles del
fluido, como la elasticidad o la densidad, Newton calcul a
partir de
consideraciones tericas la velocidad del sonido en el aire.
El siglo XVIII fue sobre todo un periodo de desarrollo terico.
El clculo
supuso una potente herramienta nueva para cientficos de muchos
campos.
Los matemticos franceses Jean le Rond d'Alembert y Joseph
Louis
Lagrange y los matemticos suizos Johann Bernoulli y Leonhard
Euler
contribuyeron al conocimiento de cuestiones como el tono y el
timbre del
sonido producido por un instrumento musical determinado, o la
velocidad y
naturaleza de la transmisin del sonido en diferentes medios. Sin
embargo,
el tratamiento matemtico completo del sonido requiere el anlisis
armnico,
desarrollado por el matemtico francs Joseph Fourier en 1822 y
aplicado al
sonido por el fsico alemn Georg Simon Ohm.
Las variaciones de sonido denominadas ?batidos?, una
consecuencia de la
naturaleza ondulatoria del sonido, fueron descubiertas en torno
a 1740 por el
violinista italiano Giuseppe Tartini y el organista alemn Georg
Sorge. El
fsico alemn Ernst Chladni realiz numerosos descubrimientos sobre
el
-
28
sonido a finales del siglo XVIII, sobre todo en relacin con la
vibracin de
cuerdas y varillas.
Siglos XIX Y XX
El siglo XIX supuso, sobre todo, una era de desarrollo
experimental. Las
primeras medidas precisas de la velocidad del sonido en el agua
fueron
llevadas a cabo en 1826 por el matemtico francs Jacques
Charles
Franois Sturm, y a lo largo del siglo se realizaron numerosos
experimentos
para determinar con extremada precisin la velocidad de sonidos
de
diferentes frecuencias en distintos medios. La ley fundamental
que dice que
la velocidad es la misma para sonidos de cualquier frecuencia y
depende de
la densidad y elasticidad del medio qued establecida en
dichos
experimentos.
Durante el siglo XIX se emplearon en el estudio del sonido
aparatos como el
estroboscopio, el fonendoscopio o la sirena. En este siglo se
dedic tambin
mucho inters al establecimiento de un patrn de tono. La
primera
sugerencia de un patrn la realiz el fsico francs Joseph Sauveur
alrededor
de 1700. Sauveur propuso que el do equivaliera a 256 Hz, un
patrn cmodo
desde el punto de vista matemtico (al ser una potencia de dos).
El fsico
alemn Johann Heinrich Scheibler llev a cabo la primera
determinacin
precisa de la frecuencia de un tono, y en 1834 propuso como
patrn que el la
equivaliera a 440 Hz. En 1859, el gobierno francs decret que el
patrn
para el la fuera de 435 Hz, segn las investigaciones del fsico
francs Jules
Antoine Lissajous. Este patrn se acept en muchas regiones del
mundo
hasta bien entrado el siglo XX.
En el siglo XIX se inventaron el telfono, el micrfono y diversos
tipos de
gramfono, todos ellos muy tiles para el estudio del sonido. En
el siglo XX,
los fsicos dispusieron por primera vez de instrumentos que hacan
posible
-
29
un estudio sencillo, preciso y cuantitativo del sonido. Mediante
osciladores
electrnicos pueden producirse ondas electromagnticas de
cualquier tipo y
convertirlas en sonido mediante sistemas electromagnticos o
piezoelctricos.
En sentido inverso, es posible convertir los sonidos en
corrientes elctricas
mediante un micrfono, amplificarlas electrnicamente sin
distorsin y
analizarlas mediante un osciloscopio de rayos catdicos. Las
tcnicas
modernas permiten grabar y reproducir el sonido con una
fidelidad
extremadamente elevada.
En la primera Guerra Mundial, las necesidades militares llevaron
a emplear
por primera vez el sonar para la deteccin de submarinos, que hoy
tambin
se emplea para estudiar las corrientes y capas ocenicas y para
realizar
mapas de los fondos marinos. En la actualidad, las ondas de
sonido de
frecuencias muy elevadas (ultrasonidos) se emplean en
numerosas
aplicaciones tcnicas y mdicas.
Naturaleza del sonido
Las ondas sonoras constituyen un tipo de ondas mecnicas que
tienen la
virtud de estimular el odo humano y generar la sensacin sonora.
En el
estudio del sonido se deben distinguir los aspectos fsicos de
los aspectos
fisiolgicos relacionados con la audicin. Desde un punto de vista
fsico el
sonido comparte todas las propiedades caractersticas del
comportamiento
ondulatorio, por lo que puede ser descrito utilizando los
conceptos sobre
ondas. A su vez el estudio del sonido sirve para mejorar la
comprensin de
algunos fenmenos tpicos de las ondas. Desde un punto de vista
fisiolgico
slo existe sonido cuando un odo es capaz de percibirlo. El
sonido La
sensacin producida en el odo por la vibracin de las partculas
que se
-
30
desplazan a travs de un medio elstico (slido, lquido o gaseoso)
que las
propaga.
Para que exista el sonido se tienen en cuenta los siguientes
factores.
Una fuente de vibracin mecnica.
Un medio elstico por el cual se propague la perturbacin.
Cuando hay variaciones y perturbaciones est claro que debe haber
un valor
esttico, a partir del cual se producen estas variaciones. En el
caso del aire,
el valor esttico no los da la presin atmosfrica.
CUALIDADES DEL SONIDO
Intensidad
La intensidad del sonido percibido, o propiedad que hace que ste
se capte
como fuerte o como dbil, est relacionada con la intensidad de la
onda
sonora correspondiente, tambin llamada intensidad acstica. La
intensidad
acstica es una magnitud que da idea de la cantidad de energa que
est
fluyendo por el medio como consecuencia de la propagacin de la
onda.
Se define como la energa que atraviesa por segundo una
superficie unidad
dispuesta perpendicularmente a la direccin de propagacin.
Equivale a una
potencia por unidad de superficie y se expresa en W/m2. La
intensidad de
una onda sonora es proporcional al cuadrado de su frecuencia y
al cuadrado
de su amplitud y disminuye con la distancia al foco.
La magnitud de la sensacin sonora depende de la intensidad
acstica, pero
tambin depende de la sensibilidad del odo. El intervalo de
intensidades
acsticas que va desde el umbral de audibilidad, o valor mnimo
perceptible,
-
31
hasta el umbral del dolor es muy amplio, estando ambos valores
lmite en
una relacin del orden de 1014.
Debido a la extensin de este intervalo de audibilidad, para
expresar
intensidades sonoras se emplea una escala cuyas divisiones son
potencias
de diez y cuya unidad de medida es el decibelio (dB). Ello
significa que una
intensidad acstica de 10 decibelios corresponde a una energa
diez veces
mayor que una intensidad de cero decibelios; una intensidad de
20 dB
representa una energa 100 veces mayor que la que corresponde a
0
decibelios y as sucesivamente.
Otro de los factores de los que depende la intensidad del sonido
percibido es
la frecuencia. Ello significa que para una frecuencia dada un
aumento de
intensidad acstica da lugar a un aumento del nivel de sensacin
sonora,
pero intensidades acsticas iguales a diferentes frecuencias
pueden dar
lugar a sensaciones distintas.
Los sonidos que percibimos deben superar el umbral auditivo (0
dB) y no
llegar al umbral de dolor (140 dB).
FIGURA 1 Intensidad de varios elementos
-
32
Tono
El tono es la cualidad del sonido mediante la cual el odo le
asigna un lugar
en la escala musical, permitiendo, por tanto, distinguir entre
los graves y los
agudos. La magnitud fsica que est asociada al tono es la
frecuencia. Los
sonidos percibidos como graves corresponden a frecuencias bajas,
mientras
que los agudos son debidos a frecuencias altas. As el sonido ms
grave de
una guitarra corresponde a una frecuencia de 82,4 Hz y el ms
agudo a
698,5 hertzs. Para que los humanos podamos percibir un sonido
este debe
estar comprendido en la franja de 20 a 20.000 Hz. Por debajo
tenemos los
infrasonidos y por encima los ultrasonidos. A esto se le
denomina rango de
frecuencia audible. Junto con la frecuencia, en la percepcin
sonora del tono
intervienen otros factores de carcter psicolgico. As sucede por
lo general
que al elevar la intensidad se eleva el tono percibido para
frecuencias altas y
se baja para las frecuencias bajas. Entre frecuencias
comprendidas entre 1
000 y 3 000 Hz el tono es relativamente independiente de la
intensidad.
Timbre
El timbre es la cualidad del sonido que permite distinguir
sonidos
procedentes de diferentes instrumentos, aun cuando posean igual
tono e
intensidad. Debido a esta misma cualidad es posible reconocer a
una
persona por su voz, que resulta caracterstica de cada
individuo.
El timbre est relacionado con la complejidad de las ondas
sonoras que
llegan al odo. Pocas veces las ondas sonoras corresponden a
sonidos
-
33
puros, slo los diapasones generan este tipo de sonidos, que son
debidos a
una sola frecuencia y representados por una onda armnica.
Los
instrumentos musicales, por el contrario, dan lugar a un sonido
ms rico que
resulta de vibraciones complejas. Cada vibracin compleja
puede
considerarse compuesta por una serie de vibraciones armnico
simples de
una frecuencia y de una amplitud determinadas, cada una de las
cuales, si
se considerara separadamente, dara lugar a un sonido puro. Esta
mezcla de
tonos parciales es caracterstica de cada instrumento y define su
timbre.
Debido a la analoga existente entre el mundo de la luz y el del
sonido, al
timbre se le denomina tambin color del tono.
Presin Sonora
En primer lugar tenemos la presin atmosfrica, es decir la presin
del aire
ambiental en ausencia de sonido. Se mide en una unidad SI
(Sistema
Internacional) denominada Pascal (1 Pascal es igual a una fuerza
de 1
newton actuando sobre una superficie de 1 metro cuadrado, y se
abrevia 1
Pa). Esta presin es de alrededor de 100.000 Pa (el valor
normalizado es de
101.325 Pa). Podemos luego definir la presin sonora como la
diferencia
entre la presin instantnea debida al sonido y la presin
atmosfrica, y,
naturalmente, tambin se mide en Pa. Sin embargo, la presin
sonora tiene
en general valores muchsimo menores que el correspondiente a la
presin
atmosfrica. Por ejemplo, los sonidos ms intensos que pueden
soportarse
sin experimentar un dolor auditivo agudo corresponden a unos 20
Pa,
mientras que los apenas audibles estn cerca de 20 mPa (mPa es
la
abreviatura de micropascal, es decir una millonsima parte de un
pascal).
Esta situacin es muy similar a las pequeas ondulaciones que se
forman
sobre la superficie de una profunda piscina. Otra diferencia
importante es
que la presin atmosfrica cambia muy lentamente, mientras que la
presin
sonora lo hace muy rpido, alternando entre valores positivos
(presin
-
34
instantnea mayor que la atmosfrica) y negativos (presin
instantnea
menor que la atmosfrica) a razn de entre 20 y 20.000 veces por
segundo.
Potencia (W)
La potencia acstica es la cantidad de energa radiada por una
fuente
determinada. El nivel de potencia Acstica es la cantidad de
energa total
radiada en un segundo y se mide en w. La referencia es 1pw =
1E-12 w.
Para determinar la potencia acstica que radia una fuente se
utiliza un
sistema de medicin alrededor de la fuente sonora a fin de poder
determinar
la energa total irradiada.
La potencia acstica es un valor intrnseco de la fuente y no
depende del
local donde se halle. Es como una bombilla, puede tener 100 w y
siempre
tendr 100 w la pongamos en nuestra habitacin o la pongamos
dentro de
una nave enorme su potencia siempre Serra la misma. Con la
potencia
acstica ocurre lo mismo el valor no varia por estar en un local
reverberante
o en uno seco. Al contrario de la Presin Acstica que si que
varia segn
vare las caractersticas del local donde se halle la fuente, la
distancia etc.
Fenmenos fsicos del sonido
Reflexin
Una onda se refleja (rebota al medio del cual proviene) cuando
topa con un
obstculo que no puede traspasar ni rodear.
-
35
FIGURA 2 Reflexin del sonido
El tamao del obstculo y la longitud de onda determinan si una
onda rodea
el obstculo o se refleja en la direccin de la que provena. Si el
obstculo es
pequeo en relacin con la longitud de onda, el sonido lo rodeara
(difraccin),
en cambio, si sucede lo contrario, el sonido se refleja
(reflexin). Si la onda
se refleja, el ngulo de la onda reflejada es igual al ngulo de
la onda
incidente, de modo que si una onda sonora incide
perpendicularmente sobre
la superficie reflejante, vuelve sobre s misma. La reflexin no
acta igual
sobre las altas frecuencias que sobre las bajas. Lo que se debe
a que la
longitud de onda de las bajas frecuencias es muy grande (pueden
alcanzar
los 18 metros), por lo que son capaces de rodear la mayora de
obstculos.
En acstica esta propiedad de las ondas es sobradamente conocida
y
aprovechada. No slo para aislar, sino tambin para dirigir el
sonido hacia el
auditorio mediante placas reflectoras (reflectores y
tornavoces).
Refraccin
Es la desviacin que sufren las ondas en la direccin de su
propagacin,
cuando el sonido pasa de un medio a otro diferente.
-
36
A diferencia de lo que ocurre en el fenmeno de la reflexin, en
la refraccin,
el ngulo de refraccin ya no es igual al de incidencia.
La refraccin se debe a que al cambiar de medio, cambia la
velocidad de
propagacin del sonido. Posteriormente puede producirse dentro de
un
mismo medio, cuando las caractersticas de este no son homogneas,
por
ejemplo, cuando de un punto a otro de un medio aumenta o
disminuye la
temperatura.
Ejemplo: Sobre una superficie nevada, el sonido es capaz de
desplazarse
atravesando grandes distancias. Esto es posible gracias a las
refracciones
producidas bajo la nieve, que no es medio uniforme. Cada capa de
nieve
tiene una temperatura diferente. Las ms profundas, donde no
llega el sol,
estn ms fras que las superficiales. En estas capas ms fras
prximas al
suelo, el sonido se propaga con menor velocidad.
FIGURA 3 Refraccin del sonido
-
37
Difraccin
La difraccin es un fenmeno que afecta a la propagacin del
sonido.
Hablamos de difraccin cuando el sonido en lugar de seguir en la
direccin
normal, se dispersa.
La explicacin la encontramos en el Principio de Huygens que
establece que
cualquier punto de un frente de ondas es susceptible de
convertirse en un
nuevo foco emisor de ondas idnticas a la que lo origin. De
acuerdo con
este principio, cuando la onda incide sobre una abertura o un
obstculo que
impide su propagacin, todos los puntos de su plano se convierten
en
fuentes secundarias de ondas, emitiendo nuevas ondas,
denominadas ondas
difractadas.
La difraccin se puede producir por dos motivos diferentes:
Por que una onda sonora encuentra a su paso un pequeo obstculo y
lo
rodea. Las bajas frecuencias son ms capaces de rodear los
obstculos que
las altas. Esto es posible porque las longitudes de onda en el
espectro
audible estn entre 3 cm y 12 m, por lo que son lo
suficientemente grandes
para superar la mayor parte de los obstculos que encuentran.
Por que una onda sonora topa con un pequeo agujero y lo
atraviesa.
La cantidad de difraccin estar dada en funcin del tamao de la
propia
abertura y de la longitud de onda.
Si una abertura es grande en comparacin con la longitud de onda,
el efecto
de la difraccin es pequeo. La onda se propaga en lneas rectas o
rayos,
como la luz.
-
38
Cuando el tamao de la abertura es considerable en comparacin con
la
longitud de onda, los efectos de la difraccin son grandes y el
sonido se
comporta como si fuese una luz que procede de una fuente
puntual
localizada en la abertura.
FIGURA 4 Difraccin del sonido
Efecto Doppler
El fenmeno fue descrito por primera vez por el matemtico y fsico
austriaco
Christian Doppler (1803-1853). Consiste en que el sonido emitido
por una
fuente es percibido por nuestro odo con distintas frecuencias
dependiendo si
dicha fuente est en reposo, acercndose o alejndose. En efecto,
la
frecuencia aumenta si la fuente se aproxima (sonido ms agudo) y
disminuye
si se aleja (sonido ms grave).
-
39
FIGURA 5 El efecto Doppler
Una fuente emisora de ondas sonoras que se aproxima, se acerca
al
observador durante el periodo de la onda. Y, dado la longitud de
la onda se
acorta y la velocidad de propagacin de la onda permanece sin
cambios, el
sonido se percibe ms alto. Por esta misma razn, la altura
(desplazamiento
de la frecuencia de las ondas sonoras) de una fuente que se
aleja, se reduce.
El efecto Doppler se observa siempre que la fuente de ondas se
mueve con
respecto al observador. Es el efecto producido por una fuente de
ondas mvil
por el cual hay un aparente desplazamiento de la frecuencia
hacia arriba
para los observadores hacia los cuales se dirige la fuente y un
aparente
desplazamiento hacia debajo de la frecuencia para los
observadores de los
cuales la fuente se aleja.
El efecto Doppler se origina cuando hay un movimiento relativo
entre la
fuente sonora y el oyente cuando cualquiera de los dos se mueven
con
respecto al medio en el que las ondas se propagan. El resultado
es la
aparente variacin de la altura del sonido. Existe una variacin
en la
frecuencia que percibimos con la frecuencia que la fuente
origina.
-
40
El fenmeno no se restringe al movimiento de la fuente. Si la
fuente de
sonido est fija, un oyente que se mueva hacia la fuente observar
un
aumento similar en el tono. Un oyente que se aleja de la fuente
de sonido
escuchar un sonido de menor tono. El cambio en la frecuencia del
sonido
que resulta del movimiento relativo entre una fuente y un oyente
se
denomina efecto Doppler.
El efecto Doppler se refiere al cambio aparente en la frecuencia
de una
fuente de sonido cuando hay un movimiento relativo de la fuente
y del oyente.
Efecto clsico: Mientras la onda avanza, el cuerpo se aleja del
observador. El
receptor capta tarde el prximo mximo y dir que el periodo es mas
largo, la
frecuencia es menor y la longitud de onda mayor.
-
41
LA VOZ Y SUS CARACTERISTICAS
Los sistemas de comunicacin transportan informacin. A
continuacin se
estudiar un sistema de comunicacin especfico, el de la
comunicacin a
travs de seales de voz, es decir seales acsticas
tradicionalmente
emitidas y recibidas por seres humanos en forma oral.
Histricamente, desde la Antigua Grecia se han realizado intentos
por
generar voces artificiales. En muchos casos eran simplemente
juegos de
tuberas conectadas a un locutor humano, en otros autnticos
ingenios
acsticos capaces de producir sonoridades voclicas.
El desarrollo de la telefona a principios del siglo XX motiv
intensas
investigaciones sobre las propiedades de la voz y la audicin con
el fin de
mejorar la calidad de la comunicacin telefnica. El proceso
continu y hoy
en da las tecnologas existentes permiten, por ejemplo, disponer
de
sistemas de comunicacin oral hombre mquina.
En todo sistema de comunicacin hay varios componentes: emisor,
receptor,
mensaje, cdigo, canal y contexto .Se debe conocer algunos
aspectos de
cada uno de ellos para poder integrar sistemas que funcionen de
manera
eficaz y eficiente. En l a s p e r s o n a s el emisor es el
conjunto integrado por
el cerebro que ?piensa? el mensaje y el aparato fonatorio que lo
?traduce? a
una emisin acstica. El receptor es el aparato auditivo que
recibe la onda
sonora y la transforma en impulsos nerviosos que luego son
interpretados por
el cerebro. El mensaje es la idea a comunicar. El cdigo es el
lenguaje
hablado. La combinacin del mensaje y el cdigo constituyen la
seal. El
canal puede ser el medio en el cual se propaga la onda sonora
(en general el
-
42
aire) o un medio de transmisin electrnico que constituye en s
mismo otro
subsistema de comunicacin cuyas propiedades son bien conocidas y
que
se aproxima en muchos casos (aunque no siempre) a la idealidad.
El
contexto puede tener un sinnmero de componentes, que van desde
factores
puramente subjetivos o psicolgicos, como el inters, la atencin,
la
motivacin hasta factores fsicos tales como respuesta en
frecuencia,
interferencias, distorsiones, ruido. De acuerdo con
investigaciones realizadas,
existen evidencias suficientes como para establecer que
empleamos ms o
menos el 70% de nuestras horas de actividad comunicndonos
verbalmente,
es decir, que cada uno de nosotros emplea alrededor de 10 a 11
horas
diarias para comunicarse.
Conceptos sobre lenguaje
La lengua es un sistema de signos lingsticos que permiten la
comunicacin en una comunidad. Es un sistema, cada uno de sus
elementos tiene entidad propia y entidad relativa a su posicin o
relacin
con los otros elementos. Es un cdigo de signos. Tiene carcter
social, ya
que es comn a una sociedad. El habla es el acto de seleccionar
los signos
de entre los disponibles y organizarlos a travs de ciertas
reglas. Materializa
el cdigo, es individual, vale decir que cambia de un individuo a
otro.
Los signos pueden corresponder al lenguaje escrito o al oral. El
lenguaje es
un sistema articulado ya que los sonidos y otros componentes se
integran
entre s. Est formado por signos lingsticos, nombre que recibe la
seal en
el lenguaje. El lenguaje tiene modalidades regionales llamadas
dialectos. Un
signo es algo que reemplaza a otra cosa para comunicarla en un
mensaje.
Los signos lingsticos se clasifican en dos tipos: significado y
significante.
El significado es el concepto mental, idea o contenido a
comunicar. El
significante es la imagen, ya sea grfica o acstica que se le
asigna. La
-
43
relacin entre significado y significante es arbitraria o
convencional, aunque
no necesariamente discrecional: involucra acuerdos tcitos,
explcitos o
normativos en una comunidad lingstica. En el lenguaje escrito,
el
significante es la grafa escrita, formada por combinaciones de
letras, en
tanto que en el lenguaje hablado es su realizacin acstica
mediante la
palabra hablada. Las palabras son los elementos libres mnimos
del
lenguaje. La sintaxis es el conjunto de reglas para la
coordinacin de las
palabras en frases u oraciones. En su versin escrita las
palabras estn
formadas por letras o grafemas, es decir unidades grficas
mnimas, y, en el
caso oral, por fonemas. Los fonemas son la unidad fnica ideal
mnima del
lenguaje. Se materializan a travs de los sonidos, pero de una
manera no
unvoca. Las variantes de los fonemas se denominan alfonos.
Los
monemas son unidades mnimas con significado, que puede ser
gramatical,
dando origen a los morfemas, o lxico, representado por los
lexemas. Los
morfemas tienen relacin con la gramtica, o la forma de organizar
o dar
estructura a las categoras bsicas del lenguaje (gnero, nmero,
tiempo o
persona de los verbos, etc.), mientras que los lexemas se
refieren a
significados externos al lenguaje mismo. Las palabras constan de
al menos
un monema, siendo las ms comunes bimonemticas, que incluyen
un
lexema y un morfema.
En la tabla siguiente se dan dos ejemplos en los que se
identifican los
componentes de la palabra
TABLA 1 Ejemplo de monemas, grafemas y fonemas
-
44
Fonologa y fontica
La Fonologa estudia los fonemas, es decir el modelo fnico
convencional e
ideal del lenguaje. La Fontica, en tanto, se refiere a los
sonidos en el
habla, incluyendo su produccin acstica y los procesos fsicos
y
fisiolgicos de emisin y articulacin involucrados. As, la
Fonologa es el
estudio de los sonidos de la lengua en cuanto a su carcter
simblico o de
representacin mental. Procede detectando regularidades o
recurrencias en
los sonidos del lenguaje hablado y sus combinaciones, y
haciendo
abstraccin de las pequeas diferencias debidas a la
individualidad de cada
hablante y de caractersticas suprasegmentales como la entonacin,
el
acento (tnico, es decir por aumento de la intensidad y aggico,
por
aumento de la duracin). Cada uno de los sonidos abstractos
as
identificados es un fonema. Uno de los objetivos de la fonologa
es acotar al
mximo la cantidad de fonemas requeridos para representar cada
idioma de
una manera suficientemente precisa.
La Fontica estudia experimentalmente los mecanismos de produccin
y
percepcin de los sonidos utilizados en el habla a travs del
anlisis
acstico, articulatorio y perceptivo. Se ocupa, por consiguiente,
de las
realizaciones de los fonemas.
Fontica experimental
Es la que estudia los sonidos orales desde el punto de vista
fsico, reuniendo
los datos y cuantificando los datos sobre la emisin y la
produccin de las
ondas sonoras que configuran el sonido articulado. Utiliza
instrumentos como
los rayos X y el quimgrafo, que traza las curvas de intensidad.
El conjunto
de los datos analizados al medir los sonidos depende nicamente
de la
-
45
precisin del instrumental as como de otros conocimientos
conexos. Adems
se han descubierto diferencias importantes en cada sonido
oral.
Fontica articulatoria
Es la que estudia los sonidos de una lengua desde el punto de
vista
fisiolgico, es decir, describe qu rganos orales intervienen en
su
produccin, en qu posicin se encuentran y cmo esas posiciones
varan
los distintos caminos que puede seguir el aire cuando sale por
la boca, nariz,
o garganta, para que se produzcan sonidos diferentes. No se
ocupa de todas
las actividades que intervienen en la produccin de un sonido,
sino que
selecciona slo las que tienen que ver con el lugar y la forma de
articulacin.
Los smbolos fonticos y sus definiciones articulatorias son las
descripciones
abreviadas de tales actividades. Los smbolos fonticos que se
usan ms
frecuentemente son los adoptados por la Asociacin Fontica
Internacional
en el alfabeto fontico internacional (A.F.I.) que se escriben
entre corchetes.
Los rganos que intervienen en la articulacin del sonido son
mviles o fijos.
Son mviles los labios, la mandbula, la lengua y las cuerdas
vocales, que a
veces reciben el nombre de rganos articulatorios. Con su ayuda,
el hablante
modifica la salida del aire que procede de los pulmones. Son
fijos los dientes,
los alvolos, el paladar duro y el paladar blando. Los sonidos se
producen
cuando se ponen en contacto dos rganos articulatorios por
ejemplo el
bilabial (p), que exige el contacto entre los dos labios; tambin
cuando se
ponen en contacto un rgano fijo y otro articulatorio, y el
sonido se nombra
con los rganos que producen la juntura, o punto de articulacin,
como por
ejemplo el sonido labiodental (f) que exige el contacto entre el
labio inferior y
los incisivos superiores. Cuando es la lengua el rgano mvil no
se hace
referencia a ella en la denominacin del sonido, as el sonido (t)
que se
-
46
produce cuando la lengua toca la parte posterior de los
incisivos superiores
se llama dental.
El modo de articulacin se determina por la disposicin de los
rganos
mviles en la cavidad bucal y cmo impiden o dejan libre el paso
del aire.
Esta accin puede consistir en la interrupcin instantnea y
completa del
paso del aire para las implosivas; en dejar abierto el paso
nasal pero
interrumpido el oral para las nasales; en producir un contacto
con la lengua
pero dejar libre el paso del aire a uno y otro lado para las
laterales; en
producir una leve interrupcin primero y dejar el paso libre
despus para las
africadas; en permitir el paso del aire por un paso estrecho por
el que el aire
pasa rozando para las fricativas, y en permitir el paso libre
del aire por el
centro de la lengua sin friccin alguna para las vocales.
Se emiten diferentes clases de vocales segn vare la posicin de
la lengua,
tanto a partir de su eje vertical (alta, media y baja), como a
partir de su eje
horizontal (anterior, central y posterior). Por ejemplo, en
espaol son vocales
altas las vocales de la palabra huir, es decir, la [i] y la [u].
Son vocales
medias la [e] y la [o], es decir las vocales de la palabra pero
y es vocal baja
la [a] de la palabra va. As, la lengua va de abajo arriba para
pronunciar las
dos vocales seguidas de la palabra aire, pero desciende a una
posicin
media para pronunciar su ltima vocal. Hace el camino contrario
de arriba
abajo para pronunciar puerta. Son vocales anteriores del espaol
la [i] y la [e],
es decir las vocales seguidas de la palabra piel; las vocales
posteriores son
la [o] y la [u], es decir las vocales de la palabra puro; la [a]
es la vocal central.
La lengua se mueve de atrs hacia adelante para emitir las
vocales de la
palabra totales, hace el camino contrario para emitir las
vocales de la palabra
pilago. Las posiciones que mantiene la lengua para emitir las
vocales u, i y
a constituyen los vrtices del llamado esquema voclico uai.
-
47
Anatoma del aparato Fonador[34]
La voz humana se produce voluntariamente por medio del aparato
fonatorio.
ste est formado por los pulmones como fuente de energa en la
forma de
un flujo de aire, la laringe, que contiene las cuerdas vocales,
la faringe, las
cavidades oral (o bucal) y nasal y una serie de elementos
articulatorios: los
labios, los dientes, el alvolo, el paladar, el velo del paladar
y la lengua
(Figura 6). Las cuerdas vocales son, en realidad, dos membranas
dentro de la
laringe orientadas de adelante hacia atrs (Figura 8). Por
adelante se unen
en el cartlago tiroides (que puede palparse sobre el cuello,
inmediatamente
por debajo de la unin con la cabeza; en los varones suele
apreciarse como
una protuberancia conocida como nuez de Adn). Por detrs, cada
una est
sujeta a uno de los dos cartlagos aritenoides, los cuales pueden
separarse
voluntariamente por medio de msculos. La abertura entre ambas
cuerdas
se denomina glotis. Cuando las cuerdas vocales se encuentran
separadas,
la glotis adopta una forma triangular. El aire pasa libremente y
prcticamente
no se produce sonido. Es el caso de la respiracin. Cuando la
glotis
comienza a cerrarse, el aire que la atraviesa proveniente de los
pulmones
experimenta una turbulencia, emitindose un ruido de origen
aerodinmico
conocido como aspiracin (aunque en realidad acompaa a una
espiracin
o exhalacin). Esto sucede en los sonidos denominados ?aspirados?
(como la
h inglesa). Al cerrarse ms, las cuerdas vocales comienzan a
vibrar a
modo de lenguetas, producindose un sonido tonal, es decir
peridico. La
frecuencia de este sonido depende de varios factores, entre
otros del tamao
y la masa de las cuerdas vocales, de la tensin que se les
aplique y de la
velocidad del flujo del aire proveniente de los pulmones. A
mayor tamao,
menor frecuencia de vibracin, lo cual explica por qu en los
varones, cuya
-
48
glotis es en promedio mayor que la de las mujeres, la voz es en
general ms
grave. A mayor tensin la frecuencia aumenta, siendo los sonidos
ms
agudos. As, para lograr emitir sonidos en el registro extremo de
la voz es
necesario un mayor esfuerzo vocal. Tambin aumenta la frecuencia
(a
igualdad de las otras condiciones) al crecer la velocidad del
flujo de aire,
razn por la cual al aumentar la intensidad de emisin se tiende a
elevar
espontneamente el tono de voz.
FIGURA 6 Corte esquematico del aparato fonador humano
FIGURA 7 La glotis
-
49
Finalmente, es posible obturar la glotis completamente. En ese
caso no se
produce sonido. Sobre la glotis se encuentra la epiglotis, un
cartlago en la
faringe que permite tapar la glotis durante la deglucin para
evitar que el
alimento ingerido se introduzca en el tracto respiratorio.
Durante la respiracin
y la fonacin (emisin de sonido) la epiglotis est separada de la
glotis
permitiendo la circulacin del flujo de aire. Durante la
deglucin, en cambio,
la laringe ejecuta un movimiento ascendente de modo que la
glotis apoya
sobre la epiglotis. La porcin que incluye las cavidades farngea,
oral y nasal
junto con los elementos articulatorios se denomina genricamente
cavidad
supragltica, en tanto que los espacios por debajo de la laringe,
es decir la
trquea, los bronquios y los pulmones, se denominan cavidades
infraglticas.
Varios de los elementos de la cavidad supragltica se controlan a
voluntad,
permitiendo modificar dentro de mrgenes muy amplios los
sonidos
producidos por las cuerdas vocales o agregar partes distintivas
a los
mismos, e inclusive producir sonidos propios. Todo esto se
efecta por dos
mecanismos principales: el filtrado y la articulacin.
El filtrado acta modificando el espectro del sonido. Tiene lugar
en las cuatro
cavidades supraglticas principales: la faringe, la cavidad
nasal, la cavidad
oral y la cavidad labial. Las mismas constituyen resonadores
acsticos que
enfatizan determinadas bandas frecuenciales del espectro
generado por
las cuerdas vocales, conduciendo al concepto de formantes.
Formantes
Son una serie de picos de resonancia ubicados en frecuencias o
bandas de
frecuencia que, segn veremos, son bastante especficas para cada
tipo de
sonido.
-
50
FIGURA 8 Funcin de rea
FIGURA 9 Formantes de un sonido sonoro
-
51
FIGURA 10 Formantes de un sonido sordo
FIGURA 11 Corte esquematizo de la laringe segn un plano
horizontal
La articulacin es una modificacin principalmente a nivel
temporal de los
sonidos, y est directamente relacionada con la emisin de los
mismos y con
los fenmenos transitorios que los acompaan. Est caracterizada
por el
-
52
lugar del tracto vocal en que tiene lugar, por los elementos que
intervienen y
por el modo en que se produce, factores que dan origen a una
clasificacin
fontica de los sonidos que veremos luego.
FIGURA 12 Diagrama funcional del aparato fonador
Pulmones Laringe Faringe TractoVocal
TractoNasal
Funcin
Pulmones Laringe Faringe TractoVocal
TractoNasal
rganos
-
53
FIGURA 13 Diagrama funcional del aparato fonador
Clasificacin de los sonidos
Los sonidos emitidos por el aparato fonatorio pueden
clasificarse de acuerdo
con diversos criterios que tienen en cuenta los diferentes
aspectos del
fenmeno de emisin. Estos criterios son:
Segn su carcter voclico o consonntico.
Segn su oralidad o nasalidad
Segn su carcter tonal (sonoro) o no tonal (sordo)
Segn el lugar de articulacin e) Segn el modo de
articulacin
Segn la posicin de los rganos articulatorios
Intensidad Tono fundamental
Efectos Resultantes
Pulso GlotalPresin Subglotal
Modulacin
Modulacin
Modulacin
Traza deVoz
FonacinArticulacin
-
54
Segn la duracin
Vocales y consonantes
Desde un punto de vista mecanoacstico, las vocales son los
sonidos
emitidos por la sola vibracin de las cuerdas vocales sin ningn
obstculo o
constriccin entre la laringe y las aberturas oral y nasal. Dicha
vibracin se
genera por el principio del oscilador de relajacin, donde
interviene una
fuente de energa constante en la forma de un flujo de aire
proveniente de
los pulmones. Son siempre sonidos de carcter tonal
(cuasiperidicos), y por
consiguiente de espectro discreto. Las consonantes, por el
contrario, se
emiten interponiendo algn obstculo formado por los elementos
articulatorios. Los sonidos correspondientes a las consonantes
pueden ser
tonales o no dependiendo de si las cuerdas vocales estn vibrando
o no.
Funcionalmente, en el castellano las vocales pueden constituir
palabras
completas, no as las consonantes.
Oralidad y nasalidad
Los fonemas en los que el aire pasa por la cavidad nasal se
denominan
nasales, en tanto que aqullos en los que sale por la boca se
denominan
orales. La diferencia principal est en el tipo de resonador
principal por
encima de la laringe (cavidad nasal y oral, respectivamente). En
castellano
son nasales slo las consonantes ???, ???, ???
Tonalidad
Los fonemas en los que participa la vibracin de las cuerdas
vocales se
-
55
denominan tonales o tambin, sonoros. La tonalidad lleva implcito
un
espectro cuasi peridico.
Como se puntualiz anteriormente, todas las vocales son tonales,
pero
existen varias consonantes que tambin lo son: ???, ???, ???,
etc. Aquellos
fonemas producidos sin vibraciones glotales se denominan sordos.
Varios de
ellos son el resultado de la turbulencia causada por el aire
pasando a gran
velocidad por un espacio reducido, como las consonantes ???,
???, ???, ???.
Lugar y modo de articulacin (consonantes)
La articulacin es el proceso mediante el cual alguna parte del
aparato
fonatorio interpone un obstculo para la circulacin del flujo de
aire. Las
caractersticas de la articulacin permitirn clasificar las
consonantes. Los
rganos articulatorios son los labios, los dientes, las
diferentes partes del
paladar (alvolo, paladar duro, paladar blando o velo), la lengua
y la glotis.
Salvo la glotis, que puede articular por s misma, el resto de
los rganos
articula por oposicin con otro. Segn el lugar o punto de
articulacin se
tienen fonemas:
Bilabiales: oposicin de ambos labios
Labiodentales: oposicin de los dientes superiores con el labio
inferior
Linguodentales: oposicin de la punta de la lengua con los
dientes superiores
Alveolares: oposicin de la punta de la lengua con la regin
alveolar
Palatales: oposicin de la lengua con el paladar duro
Velares: oposicin de la parte posterior de la lengua con el
paladar blando
Glotales: articulacin en la propia glotis
-
56
A su vez, para cada punto de articulacin sta puede efectuarse
de
diferentes modos, dando lugar a fonemas:
Oclusivos: la salida del aire se cierra momentneamente por
completo
Fricativos: el aire sale atravesando un espacio estrecho
Africados: oclusin seguida por fricacin
Laterales: la lengua obstruye el centro de la boca y el aire
sale por los lados
Vibrantes: la lengua vibra cerrando el paso del aire
intermitentemente
Aproximante : La obstruccin muy estrecha que no llega a
producir
turbulencia
Los fonemas oclusivos (correspondientes a las consonantes ???
inicial o
postnasal, ???, ???, ???, ??? inicial, postnasal o
postlateral,???, ???) tambin se
denominan a veces explosivos, debido a la liberacin repentina de
la presin
presente inmediatamente antes de su emisin. Pueden ser sordos o
sonoros,
al igual que los fricativos (??? postvoclica, postlateral y
postvibrante, ???
postvoclica y post vibrante, ???, ???, ??? aspirada, ???, ???,
???). Slo existe un
fonema africado en castellano, correspondiente a la ?ch?. Los
laterales (???, ?ll?)
a veces se denominan lquidos, y son siempre sonoros. Los dos
fonemas
vibrantes del castellano (consonantes ???, ?rr?) difieren en que
en uno de
ellos (???) se ejecuta una sola vibracin y es intervoclico,
mientras que en el
otro (?rr?) es una sucesin de dos o tres vibraciones de la
lengua. Finalmente,
los fonemas aproximantes (la ??? y la ??? cerradas que aparecen
en algunos
diptongos) son a veces denominados semivocales, pues en realidad
suenan
como vocales. Pero exhiben una diferencia muy importante: son de
corta
duracin y no son prolongables.
En la tabla 2 se indican las consonantes clasificadas segn el
lugar y el
modo de articulacin, la sonoridad y la oronasalidad. En algunos
casos una
-
57
misma consonante aparece en dos categoras diferentes,
correspondiente a
las diferencias observadas.
TABLA 2 Clasificacin de las consonantes de la lengua castellana
segn ellugar y el modo de articulacin y la sonoridad
Posicin de los rganos articulatorios (vocales)
En el caso de las vocales, la articulacin consiste en la
modificacin de la
accin filtrante de los diversos resonadores, lo cual depende de
las
posiciones de la lengua (tanto en elevacin como en profundidad
o
avance), de la mandbula inferior, de los labios y del paladar
blando. Estos
rganos influyen sobre los formantes, permitiendo su control.
Podemos clasificar las vocales segn la posicin de la lengua como
se
muestra en la tabla 3.
-
58
TABLA 3 Clasificacin de las vocales castellanas segn la posicin
de lalengua.
Otra cualidad controlable es la labializacin, es decir el hecho
de que se haga
participar activamente los labios. Las vocales labializadas,
tambin definidas
como redondeadas, son las que redondean los labios hacia
adelante,
incrementando la longitud efectiva del tracto vocal. La nica
vocal labializada
en el castellano es la ???.
En otros idiomas, como el francs, el portugus, el cataln y el
polaco, as
como en lenguas no europeas como el guaran o el hindi, existe
tambin el
matiz de oralidad o nasalidad. En las vocales orales el velo
(paladar blando)
sube, obturando la nasofaringe, lo cual impide que el aire fluya
parcialmente
por la cavidad nasal. En las vocales nasalizadas (u oronasales)
el velo baja,
liberando el paso del aire a travs de la nasofaringe. Se
incorpora as la
resonancia nasal
Duracin
La duracin de los sonidos, especialmente de las vocales, no
tiene
importancia a nivel semntico en el castellano, pero s en el
plano expresivo,
a travs de la agogia, es decir el nfasis o acentuacin a travs de
la
duracin. En ingls, en cambio, la duracin de una vocal puede
cambiar
completamente el significado de la palabra que la contiene
-
59
El alfabeto fontico internacional
El castellano es un idioma cuya escritura es eminentemente
fontica, ya que
salvo pocos casos, hay correspondencia entre grafema y fonema.
No todos
los idiomas tienen esta caracterstica. El ingls es un caso quizs
extremo, a
tal punto que George Bernard Shaw ha creado posibles
ortografas
alternativas para algunas palabras basndose en la forma en que
sus
fonemas aparecen escritos en otras palabras. Estas extraas
ortografas y el
anlisis correspondiente se muestran en la tabla 4.
TABLA 4 Ortografas alternativas de George Bernard Shaw para
dospalabras inglesas
Se ha compilado un extenso conjunto de smbolos fonticos
conocido
como el Alfabeto Fontico Internacional (International Phonetic
Alphabet,
IPA) que contiene una gran cantidad de fonemas de los diversos
idiomas, y
que permite representar de una manera inequvoca los fonemas
independientemente del idioma. El subconjunto correspondiente al
idioma
castellano se indica en la tabla 5.
-
60
TABLA 5 Los fonemas del alfabeto fontico internacional
utilizados en lalengua castellana
Fontica Acstica[39]
Es la que estudia la onda sonora como la salida de un resonador
cualquiera;
esto es, equipara el sistema de fonacin con cualquier otro
sistema de
emisin y reproduccin de sonidos. En la comunicacin , las ondas
sonoras
tienen un inters mayor que la articulacin o produccin de los
sonidos, para
un determinado auditorio recibe y descodifica la impresin a
pesar de que
haya sido emitida por medio de una articulacin oral, o por medio
de un
determinado aparato emisor de sonidos o incluso por medio de una
cotorra.
Para grabar las caractersticas ms significativas de las ondas
sonoras y
para determinar el resultado de las distintas actividades
articulatorias se
puede emplear el espectrgrafo. De forma experimental, para poder
llegar a
saber cules son los rasgos necesarios y suficientes que
identifican los
sonidos de la lengua, se suprimieron partes de la grabacin de la
onda
sonora y se reprodujeron otras.
-
61
Unidades fonticas
Los alfonos
Los alfonos son cada uno de los sonidos propios de una lengua.
Alfonos
son las realizaciones concretas, fonticas, de los fonemas, de
acuerdo con
los elementos fnicos que entren en contacto. Son sonidos del
habla,
variantes fonticas de un sonido real. Por ejemplo, en castellano
la e inicial
de la palabra ejes es ms abierta que la segunda; sin embargo,
si
pronunciamos la e ms o menos abierta no cambiamos nunca el
significado de las palabras. Estas dos realizaciones concretas
son variantes
fonticas, alfonos, del fonema /e/.
Los fonemas
Se definen como el conjunto de alfonos con el mismo valor
fonolgico en
una lengua. Cada lengua tiene un nmero limitado de fonemas, que
son
iguales a todos los hablantes en un momento dado
(sincrnicamente) y que,
segn la eleccin y combinacin que se haga con ellos, constituyen
los
diferentes significantes de los signos lingsticos. Por
ejemplo:
/s/, /z/ casa, mismo
/n/, /N/ cana, tango
-
62
Caractersticas de la voz[46]
Los sonidos se clasifican en sonoros y no sonoros. En los
primeros se abren
y cierran las cuerdas vocales, cambiando el rea de la traquea y
originando
un tren de impulsos cuasi peridicos. El periodo o frecuencia
fundamental de
este tren de impulsos se conoce con el nombre de pitch, y su
valor esta
comprendido entre 50 y 400 Hz para los hombres y es superior en
mujeres y
nios. En los sonidos no sonoros el aire fluye libremente hasta
alcanzar el
tracto vocal al permanecer las cuerdas vocales. Posteriormente,
la variacin
voluntaria del tracto vocal, junto con el estado variante de las
cuerdas,
produce la voz.
El tracto vocal acta como una cavidad resonante para los sonidos
sonoros,
estando centradas las frecuencias de resonancia para la mayora
de la gente
en 500 Hz y sus armnicos pares. Esta resonancia causa grandes
picos en
el espectro resultante, a los cuales se les llama formantes.
Tambin la seal
tiene una naturaleza paso baja y a partir de unos 4KHz comienza
a
predominar el ruido.
En cambio, el segmento de voz no sonoro muestra una estructura
ruidosa
tanto en el dominio del tiempo como en el de la frecuencia, no
tenindose
formantes. Adems la energa de la seal es mucho menor que la de
los
sonidos sonoros.
Modelo del tracto voclico[36]
La voz se produce a partir de sonidos formados por la vibracin
de las
cuerdas vocales y posterior resonancia en la pared del tracto
voclico de la
seal producida. En los adultos, el tracto voclico es un tubo
de
-
63
aproximadamente 17cm de largo con un rea transversal que vara de
0 a 20
cm2.La figura 9 muestra un diagrama del tracto voclico. Los
pulmones
actan solamente como emisores de aire. Son las cuerdas vocales
las
encargadas de introducir una perturbacin cuasi peridica en el
flujo de aire.
FIGURA 14 Zonas del aparato fonadora) Tracto voclico. a)
articulaciones del habla: (1) cuerdas vocales; (2)faringe; (3)
velo; (4) paladar blando; (5) paladar duro; (6) alveolos; (7)
dientes;(8)labios; (9) punta de la lengua; (10) cuerpo lingual;
(11) dorso; (12) raz; (13)mandbula; (14) cavidad nasal; (15)
cavidad oral; (16) ventanas nasales; (17)traquea; (18) epglotis. b)
tipos de articulacin de voz: (1) labial; (2) dental; (3)alveolar;
(4) palatal; (5) velar; (6) uvular; (7) faringeal; (8) glotal.
Los sonidos que conforman la voz se pueden clasificar en
vocalizados
(sonoros, originados en las cuerdas vocales) y no vocalizados
(sordos,
originados por una friccin en el tracto voclico), en la prctica
la voz est
formada por una mezcla de ambos. Durante el proceso de generacin
de
sonidos vocalizados, las cuerdas vocales estn cerradas, pero la
presin
ejercida por el aire contenido en los pulmones fuerza su
apertura y su
posterior relajacin ocasionando la vibracin de las cuerdas a una
frecuencia
entre los 50 y 400 [Hz]. A esta frecuencia se le conoce como
pitch. La forma
-
64
de la seal que se produce en la vibracin con las cuerdas vocales
es
aproximadamente triangular. sta atraviesa el resto del tracto
voclico donde
la amplitud se ve alterada por el choque de la seal con las
paredes del
tracto. Durante el proceso de generacin de sonidos no
vocalizados, las
cuerdas vocales estn completamente abiertas, posibilitando la
circulacin
del aire por el tracto voclico, la que se ve ligeramente
obstaculizada por el
roce con las paredes del tracto, lo que produce un ruido
fricativo. Adems del
movimiento de las cuerdas vocales y del tracto voclico, para
modelar el
proceso de generacin de voz se debe considerar tambin los
movimientos
de la boca, la lengua, los labios y vibraciones nasales. Por
tanto, un modelo
bsico de este proceso debe considerar lo siguiente:
La voz es una seal que emerge de una fuente definida: los
pulmones
actan como emisores de aire y la seal se produce por la
vibracin
de las cuerdas vocales y la posterior resonancia con las paredes
del
tracto voclico.
La voz est formada por la mezcla de seales de excitacin
peridica
y ruido.
La variacin temporal de la seal en el tracto voclico produce
el
timbre caracterstico que diferencia los fonemas, ciertos fonemas
son
articulados sin la presencia de las cuerdas vocales (fonemas
sordos).
Antes de pasar por el tracto voclico, la onda sonora tiene un
espectro
relativamente plano (sin formantes).
La fuente emisora posee dos estados: generacin de sonidos
vocalizados y no vocalizados.
Si se toman intervalos de tiempos pequeos se puede modelar
el
rgano generador de voz a travs de la bsqueda de su funcin de
transferencia, que define relacin entre la entrada (excitacin
gltica) y
la salida (voz generada) por medio de filtros.
-
65
ANATOMIA DEL SISTEMA AUDITIVO HUMANO[48]
EL OIDO
El odo se encarga de recoger los sonidos, procesarlos y mandar
seales
sonoras al cerebro mediante el proceso de transduccin .Otra
funcin muy
importante del odo es la de mantener el sentido del
equilibrio.
FIGURA 15 El odo
El odo se divide entre partes que describiremos a
continuacin:
Odo externo
Odo medio
Odo interno
-
66
ELOIDO EXTERNO
La nica parte visible del odo es el pabelln auditivo (la
aurcula) que, debido
a su especial forma helicoidal, es la primera parte del odo en
reaccionar ante
el sonido. El pabelln auditivo funciona como una especie de
embudo que
ayuda a dirigir el sonido hacia el interior del odo. Sin la
presencia de este
embudo las ondas sonoras tomaran una ruta directa hacia el
conducto
auditivo. Esto hara que el proceso de audicin fuera difcil e
ineficaz ya que
gran parte del sonido se perdera y seria ms difcil escuchar y
comprender los
sonidos.
FIGURA 16 El Odo externo
El pabelln auditivo es imprescindible debido a la diferencia de
presin que
existe en interior y exterior del odo. La resistencia del aire
es mayor en el
interior que en el exterior del odo porque el aire en el
interior se encuentra
comprimido, y por ello, a mayor presin. Para que las ondas
sonoras penetren
en el odo de la mejor forma posible, la resistencia del aire no
debe ser
demasiado alta. El pabelln auditivo es esencial para ayudar a
vencer la
-
67
diferencia de presin en el interior y exterior del odo. El
pabelln auditivo
funciona como un vnculo intermedio que hace que esta transicin
sea ms
suave y menos brutal, permitiendo que penetren mayor numero de
sonidos en
el conducto auditivo (meatus).
Una vez que las ondas sonoras han superado el pabelln auditivo,
se
desplazan de dos a tres centmetros dentro del conducto auditivo
antes de
golpear el tmpano, tambin conocido como membrana timpnica.
El tmpano
El tmpano (membrana timpnica), el cual seala el inicio del odo
medio, es
extremadamente sensible. Para proteger al tmpano, el conducto
auditivo se
curva ligeramente haciendo ms difcil que por ejemplo, los
insectos puedan
alcanzarlo. Al mismo tiempo la cera del odo (cerumen) del
conducto auditivo
ayuda a mantener fuera