Top Banner
ANEXO I ANEXO I I.1. INTRODUCCIÓN El programa pcvox 5.0 es una herramienta para llevar a cabo fundamentalmente dos tareas, el marcado y la segmentación de una palabra o frase completa, (en general de un archivo de voz en diferentes formatos). Por lo general, esta información se suele utilizar posteriormente para generar las bases de datos en aplicaciones TTS (text to speech). El objetivo principal del marcado de una frase, es la obtención de la curva de frecuencia fundamental de la misma. Para ello el programa se vale de marcas que se generan automáticamente pero que luego suele ser necesario modificar manualmente. Dichas marcas se colocan buscando la periodicidad en los tramos sonoros, mientras que en tramos oclusivos, fricativos,... se suelen colocar más o menos equiespaciadas. Cuanto mas cerca estén las marcas, mayor será el tono local y viceversa. Por su parte la segmentación busca localizar y separar los diferentes fonemas de cada palabra. Este proceso es manual, y hay que valerse sobre todo del oído y de la búsqueda de las características diferenciadoras de cada fonema. Muchas veces resulta imposible determinar el punto exacto de separación entre GRUPO DE TECNOLOGÍA DEL HABLA
52

CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

Sep 21, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

ANEXO I

I.1. INTRODUCCIÓN

El programa pcvox 5.0 es una herramienta para llevar a cabo fundamentalmente dos tareas, el marcado y la segmentación de una palabra o frase completa, (en general de un archivo de voz en diferentes formatos). Por lo general, esta información se suele utilizar posteriormente para generar las bases de datos en aplicaciones TTS (text to speech).

El objetivo principal del marcado de una frase, es la obtención de la curva de frecuencia fundamental de la misma. Para ello el programa se vale de marcas que se generan automáticamente pero que luego suele ser necesario modificar manualmente. Dichas marcas se colocan buscando la periodicidad en los tramos sonoros, mientras que en tramos oclusivos, fricativos,... se suelen colocar más o menos equiespaciadas. Cuanto mas cerca estén las marcas, mayor será el tono local y viceversa.

Por su parte la segmentación busca localizar y separar los diferentes fonemas de cada palabra. Este proceso es manual, y hay que valerse sobre todo del oído y de la búsqueda de las características diferenciadoras de cada fonema. Muchas veces resulta imposible determinar el punto exacto de separación entre fonemas, por lo que se trata de algo aproximado. A cada fonema se le asigna una etiqueta.

La información que se genera con pcvox, es guardada automáticamente por el propio programa en un archivo con el mismo nombre que el del fichero de muestras, pero con la extensión .par. Este archivo contendrá la posición de cada marca referida al número de muestra en que se encuentra, su pitch local con respecto a la siguiente marca, y las posiciones de los fonemas etiquetados previamente. Es un archivo de texto convencional, que se puede

GRUPO DE TECNOLOGÍA DEL HABLA

Page 2: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

editar de las formas usuales. Si se abre un archivo de voz, y ya existe su correspondiente .par, el programa utilizará toda la información de dicho archivo, y aparecerá automáticamente en pantalla.

I.2. MENÚS Y MANEJO DEL PROGRAMA

El programa se maneja mediante una serie de menús que aparecen en la parte superior de la pantalla. Así mismo, basta con el ratón para llevar a cabo todas las tareas necesarias, aunque algunas teclas permiten un acceso rápido a los menús.

El programa dispone de dos ficheros de configuración de extensión .ini (se trata de gthmatlab.ini y raw.ini) que se leen del directorio en que se encuentran los archivos de voz que se vayan abriendo. Caso de no disponer de ellos, se utilizarán valores por defecto.

Lo primero que hay que hacer es cargar el archivo o archivos de voz con los que se va a trabajar, mediante la opción Open del menú File. Se obtiene una representación completa de la secuencia de voz como la de la figura I-1.

Sin activar ninguna función de los menús, manteniendo pulsado el botón izquierdo del ratón y desplazándolo, se selecciona una parte de la secuencia de voz. La parte seleccionada cambia su color de fondo del blanco al negro. Sobre esta sección se podrá aplicar un zoom, se podrá escuchar,... Para desactivar la zona anteriormente elegida, basta con pulsar una vez el botón derecho del ratón.

En general este comportamiento será similar en muchas funciones de los menús. El botón izquierdo sirve para seleccionar fragmentos de la señal, mientras que el botón derecho desactiva esta selección.

Conviene destacar en este punto la existencia de diversos modos de funcionamiento que se activan al seleccionar la opción adecuada de los

GRUPO DE TECNOLOGÍA DEL HABLA

Page 3: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

menús. Al pulsar cualquiera de las opciones del menú Tono, o la opción de poner o quitar etiquetas se activa el modo de funcionamiento correspondiente. El modo activo en cada caso no se refleja en pantalla. Para desactivar el modo, es necesario pulsar el botón derecho del ratón. El modo extraer tono es especial, pues para desactivarlo se debe pulsar la opción Finalizar revisión.

Figura I-1 Representación completa de la secuencia de voz

No todas las funciones de los menús son de utilidad al marcar y segmentar. Las características fundamentales de los mismos son las siguientes:

MENÚ INTÉRPRETE: Es un menú que sirve para modificar la energía de la señal cuando ello pueda resultar de utilidad.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 4: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Normaliza. Aumenta la energía de las muestras de la señal de entrada. En ocasiones, el marcado automático puede mejorar si se utiliza previamente esta opción.

Restaura. Realiza la operación complementaria de la anterior. Devuelve las muestras a su valor de energía original.

Atenúa. Introduce una atenuación en el valor de la energía de la señal. El valor de la atenuación es solicitado previamente por el programa, y se debe introducir en dB.

Comando. No es necesaria esta opción en el manejo general del programa.

MENÚ FILE: Sirve para las tareas básicas de abrir y salvar archivos, así como para cerrar el programa. Se compone de:

Open. Selecciona el archivo que se va a abrir. Si dicho archivo ya tiene un archivo .par creado, la información se reflejará en pantalla.

El programa trabaja sólo con un número limitado de formatos para los archivos. En concreto se puede trabajar con pcm, mst, ses, esa, raw y aho. En los formatos que tienen una cabecera previa no hay problema, pues el programa se encarga de leerla, pero en los que como pcm, raw o ses no hay cabecera, es necesario especificar antes de abrirlos la frecuencia de muestreo en el fichero de configuración raw.ini. Todos los anteriores son formatos de ficheros de muestras. (Pc-vox puede aceptar también ficheros ventana con formato vnt).

Close. Cierra el archivo con el que se ha estado trabajando, y guarda los parámetros en disco.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 5: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Salvar Parámetros. Guarda en disco toda la información que se ha ido generando. La primera vez que se ejecuta esta orden, crea el archivo .par. El resto de las ocasiones, se limita a actualizarlo. Conviene grabar la información cada cierto tiempo, pues de lo contrario esta podría perderse si se produce algún fallo del programa. Se puede ejecutar esta opción mediante la tecla F2, pero la tecla rápida no siempre funciona.

Exit. Termina la ejecución del programa.

MENÚ OÍR: Sirve para escuchar la secuencia de voz con la que se está trabajando.

Oír. Al ejecutar está función, si se ha seleccionado un fragmento de la señal mediante el botón izquierdo del ratón, sólo se escuchará dicho fragmento. Caso contrario, se oirá todo el archivo, independientemente de lo que se vea en pantalla. Es una opción muy útil a la hora de identificar los diferentes fonemas.

Oír Ventana. Si se ha aplicado un zoom de aumento, en pantalla sólo se verá una sección de la secuencia de voz completa. Al activar oír ventana, en lugar de escuchar todo el archivo, sólo se oirá la parte visible en pantalla.

MENÚ TONO: Se trata de un menú fundamental a la hora de marcar las frases que se estén estudiando. Sus principales funciones serán:

Extraer. Es la base fundamental de la labor de marcado. Al pulsar esta opción, el programa extrae automáticamente la curva de tono fundamental de todo el archivo de voz con el que se está trabajando. Esta curva se sobreimprime en pantalla en color rojo, junto a la forma de onda de la señal de voz completa. En general para poder ver donde están situadas las marcas, será necesario hacer un zoom de la zona de interés, ya que por norma la resolución en pantalla no será la

GRUPO DE TECNOLOGÍA DEL HABLA

Page 6: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

suficiente para mostrar cada marca. A continuación se podrán ajustar estas marcas con el resto de opciones de este menú.

El resto de opciones de este menú, se refieren a las labores de modificación manual de la curva de tono generada previamente por el ordenador. Para ello será necesario añadir, eliminar o desplazar marcas.

Quitar marcas. Esta opción borra todas las marcas asociadas al fichero de voz. Antes de llevar a cabo esta opción, el ordenador pedirá confirmación de la misma.

Poner marca. Al seleccionar esta opción, cada vez que se pulse el botón izquierdo del ratón se añadirá una marca en la posición en la que se encuentre el puntero del ratón. Para desactivar esta opción, se pulsara el botón derecho del ratón. Al ir añadiendo marcas, se podrá observar en la ventana superior derecha como el valor del pitch local irá aumentando.

Mover marca. Es probablemente la opción más útil y más utilizada, pues sirve tanto para mover como para borrar marcas sobrantes. Para corregir la posición de una marca, y una vez activada esta opción, se coloca el puntero del ratón junto a la marca que se desea desplazar. Se pulsa entonces el botón izquierdo del ratón, y se observará que la marca más próxima al puntero del ratón desaparece. Se tienen entonces dos opciones. Si se coloca el puntero del ratón en una nueva posición y se pulsa el botón izquierdo nuevamente, la marca reaparecerá en su nueva posición. Si por el contrario se pulsa el botón derecho, la marca habrá sido borrada y ya no reaparecerá. Para desactivar este modo de funcionamiento, se pulsará el botón derecho del ratón.

Borrar marca. Esta acción se puede realizar desde la opción mover marca o bien directamente desde aquí. Al activar esta función, cada vez que se pulse el botón izquierdo del ratón, se borrará la marca

GRUPO DE TECNOLOGÍA DEL HABLA

Page 7: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

que esté en pantalla más cerca del puntero del ratón. Se observará que la curva de tono irá disminuyendo en valor. Para desactivar este modo de funcionamiento se pulsará el botón derecho.

Aleatorio. Es una opción que no resulta de utilidad al marcar frases.

Desplazar Izquierda. Al activar esta opción, cada vez que se pulse el botón izquierdo del ratón, la marca más cercana al puntero del mismo se desplazará ocho muestras a la izquierda. Es una opción útil para llevar a cabo pequeños ajustes en las marcas, sobre todo cuando en la extracción automática de tono se haya producido una deriva pequeña a la derecha. Su principal inconveniente es que al ser un desplazamiento fijo de ocho muestras, no suele ofrecer la precisión necesaria. Para corregir en lo posible esta deficiencia, el valor del desplazamiento es modificable en el archivo de configuración .ini. Para desactivarlo, basta pulsar el botón derecho del ratón.

Desplazar Derecha. Su comportamiento es exactamente igual al anterior pero desplazando la marca a la derecha.

MENÚ REVISAR TONO: Una vez llevada a cabo la extracción automática del tono fundamental de una frase, es necesario hacer una revisión manual del mismo. Esta labor, se inicia y se da por finalizada desde este menú.

Inicializar revisión. Al pulsar esta opción, se entra en el modo de revisión, del que sólo se sale mediante la opción finalizar revisión, incluida en este mismo menú. En este modo, aparecen en pantalla ventanas consecutivas (y solapadas en el tiempo) ampliadas del archivo completo. En estas ventanas se va viendo la posición exacta de las marcas, para así poder proceder a su ajuste manual mediante las opciones del menú Tono.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 8: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Avanzar. Avanza una ventana en pantalla durante la revisión. Existe un ligero solapamiento entre ventanas consecutivas durante el proceso de revisión, para así poder dar continuidad al proceso de corrección manual.

Retroceder. Es la opción complementaria de la anterior. Retrocede una ventana en el proceso de revisión, manteniendo el mismo solape temporal.

Finalizar revisión. Concluido el proceso de revisión manual, se sale de este modo mediante la opción finalizar revisión. Al pulsarlo se volverá a ver en pantalla el archivo de voz completo, y la curva de tono fundamental modificada. En este punto resulta conveniente hacer uso de la opción de salvar, para guardar el archivo .par.

MENÚ FORMANTES: No es necesario para las labores de marcar y segmentar.

MENÚ ETIQUETAS: A través de este menú se realiza la segmentación de los fonemas que constituyen las frases con las que se está trabajando. La segmentación consiste fundamentalmente en poner etiquetas que determinan el intervalo de muestras en que está presente un fonema concreto en una palabra.

Poner. Mediante esta opción se lleva a cabo la tarea de segmentación propiamente dicha. Cuando esta opción está activada, al pulsar por primera vez el botón izquierdo del ratón se está determinando la posición de comienzo o fin de la etiqueta. Se observa entonces, que al desplazar el ratón, el intervalo entre esa primera pulsación y la posición actual del puntero del ratón cambia de color. Es el intervalo que se va seleccionando. Para poder escuchar dicho intervalo, basta con pulsar el botón derecho del ratón. De este modo se va ajustando manualmente hasta que se considere identificado el fonema. Finalmente se vuelve a pulsar el botón

GRUPO DE TECNOLOGÍA DEL HABLA

Page 9: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

izquierdo, y el ordenador nos pedirá una etiqueta para ese intervalo seleccionado. El proceso se puede volver a repetir tantas veces como sea necesario. Para desactivar la opción poner marca, basta con pulsar el botón derecho.

Es importante tener en cuenta que no está permitido que las etiquetas se solapen entre sí. Esto hace especialmente complicadas las transiciones entre fonemas.

Quitar. Sirve para eliminar etiquetas incorrectas. Basta con colocarse encima de la etiqueta que se desea borrar y pulsar el botón izquierdo del ratón. Es importante pulsar el botón derecho una vez se acabe de borrar las etiquetas, pues de lo contrario, está opción no estará desactivada.

Oír. Sirve para reproducir etiquetas previamente definidas. Es una opción útil cuando se desea comprobar que la segmentación ha sido realizada correctamente. Para ello sólo es necesario pulsar el botón izquierdo cuando se está situado encima de la etiqueta que se desea escuchar. Como siempre, para desactivar esta opción, se debe pulsar el botón derecho.

MENÚ ZOOM: Para realizar el marcado manual y la segmentación, muchas veces la resolución en pantalla del fichero de voz, no es la adecuada; es necesario ampliar las zonas concretas de la secuencia de voz en las que se está trabajando. Para ello se dispone del menú Zoom.

Zoom in. Para utilizar esta opción, es necesario seleccionar previamente la zona sobre la que se desea hacer una ampliación. Para ello, se pincha en el botón izquierdo del ratón, y se arrastra sin soltar hasta el final de la zona de interés. Se observa que esta zona aparece en negro. Se pulsa entonces Zoom in, y aparecerá en pantalla ampliada. Si la resolución es lo suficientemente grande pueden aparecer las posiciones concretas de las marcas (caso de que

GRUPO DE TECNOLOGÍA DEL HABLA

Page 10: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

ya se haya procedido al marcado); de lo contrario puede ser necesario hacer una nueva ampliación. Se pueden hacer hasta diez Zoom in si es necesario.

Zoom out. Deshace un nivel de ampliación, bajando al nivel anterior.

Ver todo. Independientemente del numero de “zoom in” realizados, esta opción los deshace todos, volviendo a verse en pantalla todo el archivo de voz completo.

MENÚ FICHERO: No usar.

MENÚ WINDOW: En ocasiones resulta de interés trabajar con varios archivos de voz a la vez. La función de este menú es facilitar el manejo de varias secuencias de voz.

Cascade. Muestra todos los archivos en cascada, solapados unos con otros (figura I-2).

GRUPO DE TECNOLOGÍA DEL HABLA

Page 11: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-2 Cascade

Tile Horizontal. Presenta en pantalla todos los archivos alineados horizontalmente (figura I-3).

GRUPO DE TECNOLOGÍA DEL HABLA

Page 12: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-3 Tile Horizontal

Tile. Presenta en pantalla todos los archivos alineados verticalmente (figura I-4).

Close all. Cierra a la vez todas las ventanas presentes en pantalla.

MENÚ HELP: Hasta el momento no está incluida la opción de ayuda en este programa, por lo que este menú carece de utilidad en la actualidad.

Además de los menús, existen cinco botones de acceso rápido, con algunas de las opciones más habitualmente utilizadas. Estos botones implementan de izquierda a derecha las opciones Oír, Zoom in, Zoom out, Avanzar, Amplificar y Atenuar.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 13: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-4 Tile

I.3. MARCADO

Es importante tener presente que las tareas de marcado y segmentación no son independientes entre sí, sino que la información que produce una puede ser muy útil para la otra. Así, a partir de la curva de frecuencia fundamental, se pueden identificar mejor los fonemas, si se conocen las peculiaridades de cada uno.

Al llevar a cabo el marcado de una frase, el primer paso es proceder a la extracción automática del tono fundamental. Para ello, en el menú Tono, se selecciona la opción Extraer. El programa presentará en pantalla la curva obtenida en rojo.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 14: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

A continuación es necesario proceder a un ajuste manual de la curva anterior. Se selecciona entonces la opción Inicializar revisión del menú Revisar tono. El ordenador irá presentando ventanas sucesivas en las que se podrán ir ajustando las marcas de forma individual. Para ir cambiando de ventanas se pulsa la opción avanzar. En ocasiones, sobre todo cuando el tono local es muy elevado, puede ser necesario hacer un “Zoom in” de la zona de interés.

El objetivo final es obtener una curva de tono fundamental lo más suave posible, intentando que el número de picos altos sea el menor.

Los fonemas, se pueden agrupar en función de su comportamiento, de modo que cada grupo tiene unas peculiaridades muy útiles a la hora de marcar y segmentar. Se presentan a continuación los diferentes grupos fonéticos.

a) OCLUSIVAS SORDAS. Constituyen un grupo muy sencillo de marcar y segmentar pues tienen unas propiedades que los distinguen claramente del resto. Las oclusivas sordas muestran un silencio más o menos largo, seguido de una explosión. A veces presentan un resto de sonoridad de la vocal anterior en el silencio, pero este efecto se debe despreciar al marcar. Además la explosión suele afectar en sus primeros periodos a la vocal posterior, que pueden presentar fuertes oscilaciones.

Pertenecen a este grupo la /p/, la /t/ y la /k/, fonemas muy comunes en todas las frases.

Al marcar este tipo de fonemas, en el silencio se suelen poner algunas marcas equiespaciadas y muy distanciadas entre sí. En la explosión se intenta que la curva de tono fundamental no presenta un gran pico, y que se conserve la continuidad en el tono de la vocal posterior. Se cumple por tanto que el efecto de una oclusiva sobre el valor de la frecuencia fundamental, es una caída en el valor de la misma.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 15: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

En la figura I-5 se muestra una oclusiva correctamente marcada. En concreto se trata de una /p/ entre dos vocales. Obsérvese como en la explosión, en lugar de buscar periodicidad, se intenta que la curva de tono fundamental sea lo más suave posible.

Figura I-5 Oclusiva

b) FRICATIVAS. Este grupo de sonidos también presenta unas características muy definidas que los hace fácilmente distinguibles del resto. En concreto, los sonidos fricativos presentan el aspecto de un ruido aleatorio, sin ningún tipo de periodicidad o regularidad. Las fricativas suelen afectar un poco a los primeros periodos del fonema consecutivo, de modo que aparecen algo ruidosos.

Pertenecen a este grupo fonético los fonemas siguientes: /s/, /f/, /z/, /x/ (es la jota en español).

GRUPO DE TECNOLOGÍA DEL HABLA

Page 16: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

La forma de marcar este tipo de sonidos es análoga a la del silencio de los fonemas oclusivos es decir, colocando marcas equiespaciadas y separadas entre sí. En general, en las transiciones entre fricativa y vocal, se suelen ignorar los primeros periodos de la vocal si estos son excesivamente ruidosos, y resulta imposible distinguir la periodicidad.

Se cumple por tanto que las fricativas, al igual que las oclusivas provocan una caída en la curva de frecuencia fundamental.

En la figura I-6 se puede observar un ejemplo de fricativa correctamente marcada. Se trata de una /s/ entre una /a/ y una /e/. Obsérvese como los últimos periodos de la /a/ sí se ven afectados por el ruido que incluye la fricación, pero aun así es posible marcar el periodo.

Figura I-6 Fricativa correctamente marcada

GRUPO DE TECNOLOGÍA DEL HABLA

Page 17: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

c) VOCALES. Las vocales constituyen el grupo fonético más habitual en cualquier dominio. Son fonemas sonoros, y que por tanto presentan periodicidad. Esa periodicidad es la que pretendemos caracterizar mediante las marcas.

Las vocales presentan muchos contextos diferentes, en función del entorno en que están incluidas. Así se habla de vocales nasalizadas, vocales más aproximantes, etcétera.

Al marcar una vocal, se suele buscar una referencia como puede ser un pico determinado o un mínimo. En general se elige aquella en que parezca haberse basado el marcado automático. Después se colocan las marcas siguiendo ese mismo criterio. Normalmente no presentan grandes complicaciones excepto cuando la energía es muy baja. Entonces resulta complicado encontrar la periodicidad. A veces resulta útil usar la opción de amplificar la señal, pero otras no merece la pena y se suelen colocar las marcas buscando suavidad en la curva de tono global.

El valor de la frecuencia fundamental en general y sobre todo en las vocales depende de cada hablante particular y de aspectos como los acentos (así las vocales acentuadas tienen mayor tono que el resto), el número de sílabas de la palabra que contenga a la vocal, la posición de cada vocal y los fonemas que la rodean entre otros.

Si los archivos acaban en vocal, ésta al final de frase suele mostrar una periodicidad residual que se va atenuando muy poco a poco. El criterio para marcar este tipo de vocales es colocar las marcas hasta un punto en que por su energía ya no merezca la pena, y entonces se suelen colocar equiespaciadas, o de modo que la curva de tono fundamental vaya descendiendo lentamente.

En la figura I-7 se muestra una /e/ correctamente marcada entre una /p/ y una /r/: Obsérvese como existen pequeñas irregularidades sin importancia:

GRUPO DE TECNOLOGÍA DEL HABLA

Page 18: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-7 Vocal correctamente marcada

Un ejemplo de vocal marcada al final de frase es la figura I-8.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 19: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

d) DIPTONGOS. Los diptongos y triptongos no presentan grandes dificultades durante la tarea de marcado, pues se comportan periódicamente como si fueran una sola vocal. La principal dificultad de esta agrupación de fonemas se encuentra en la fase de segmentación como se verá posteriormente.

Para marcar diptongos, basta con poner las marcas buscando la periodicidad como si de una única vocal se tratara.

El la figura I-9 se presenta un diptongo correctamente marcado. Se trata del grupo /ae/. Se puede comprobar que su aspecto es muy similar al de una vocal única. Ahí radica su dificultad a la hora de ser segmentados.

Figura I-8 Vocal marcada al final de frase

GRUPO DE TECNOLOGÍA DEL HABLA

Page 20: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-9 Diptongo correctamente marcado

e) APROXIMANTES. Existen determinados fonemas que en función del contexto en que se encuentren se comportan de un modo u otro. Tal es el caso de la /g/, /d/ y / b/. Estos fonemas cuando se encuentran entre vocales, actúan como una especie de transición entre una vocal y otra. Por ello se denominan aproximantes.

Los fonemas aproximantes se marcan por tanto de forma usual buscando la periodicidad. Además se pueden detectar por energía, ya que suelen tener un nivel menor que el de las dos vocales que le rodean. Téngase en cuenta además que en función de la calidad de la grabación y del locutor, puede ocurrir que la transición sea poco periódica, y exista mucha distorsión. El marcado en este caso puede complicarse notablemente.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 21: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Normalmente, el efecto de un fonema aproximante sobre la curva de tono es de un ligero descenso de su valor (una especie de “valle”) que luego vuelve a aumentar al llegar de nuevo a la siguiente vocal.

En la figura I-10 se muestra una /b/ entre dos vocales. Se puede comprobar que la energía es mucho menor en el fonema aproximante que en las dos vocales. Además el tono local disminuye ligeramente (en este caso, en general no tiene porqué).

Figura I-10 Fonema aproximante (I)

La figura I-11 muestra también un fonema aproximante, pero en esta ocasión con una periodicidad mucho más difícil de identificar. En este caso se colocan las marcas buscando cierta continuidad en la zona más atenuada:

GRUPO DE TECNOLOGÍA DEL HABLA

Page 22: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-11 Fonema aproximante (II)

f) OCLUSIVAS SONORAS. En este caso la /b/, /d/ y /g/ presentan un comportamiento muy similar al de las oclusivas. Así cuando uno de estos fonemas se encuentra en posición inicial, tras nasal o tras /l/ están constituidos por un silencio inicial seguido de una explosión. La principal diferencia con las oclusivas sordas, es que en este caso el silencio presenta una cierta sonoridad, difícil de marcar en ocasiones, pero que es evidente que existe.

Estos fonemas se suelen marcar en función de la sonoridad que presenten en su silencio inicial. Si es posible se marcan los periodos. Cuando sin embargo la periodicidad es muy difícil de detectar, se ponen las marcas equiespaciadas manteniendo cierta regularidad (Es decir se marca de forma análoga a una oclusiva sorda).

En la figura I-12 se presenta una /d/ de comienzo de frase, seguida de una /a/. Obsérvese como en este caso la periodicidad sí puede marcarse antes de la explosión oclusiva:

GRUPO DE TECNOLOGÍA DEL HABLA

Page 23: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-12 Oclusiva sonora

g) NASALES. Entre los sonidos nasales se incluyen fundamentalmente la /m/ la /n/ y la /ñ/. Se trata de sonidos sonoros que muestran periodicidad y que por lo tanto no presentan grandes dificultades a la hora de ser marcados. En general no se pueden detectar por energía. Este tipo de sonidos no varían demasiado el tono fundamental de su entorno. Es decir si se encuentran por ejemplo entre dos vocales, muestran un tono muy similar al de dichas vocales.

En función del contexto será más fácil o más difícil segmentar este tipo de fonemas como se verá posteriormente. Especialmente problemático es el caso de la /ñ/.

En la figura I-13 se presenta una /m/ entre dos vocales. En este caso el marcado no presenta mayores problemas, y además la /m/ es bastante

GRUPO DE TECNOLOGÍA DEL HABLA

Page 24: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

diferenciable de las vocales a simple vista. En general no tiene porque ocurrir así.

Figura I-13 Nasales

h) LATERALES. Los sonidos laterales son la /l/ y la /ll/. Son sonidos igualmente sonoros y por lo tanto la forma de marcarlos es la usual en estos casos. Normalmente se suelen detectar bien por energía aunque no siempre ocurre así.

Este tipo de fonemas suele presentar un tono muy parecido al de las vocales o sonidos sonoros que le rodean, por lo que provoca tramos de valor más o menos constante en la curva global.

Conviene hacer aquí una apreciación. Se trata de la diferencia entre el sonido /ll/ y el sonido /y/. La diferencia entre uno y otro fonema depende en

GRUPO DE TECNOLOGÍA DEL HABLA

Page 25: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente, por lo que en general estos dos fonemas tienden a fundirse en uno solo.

En la figura I-14 se muestra un ejemplo de un sonido lateral entre dos vocales. En concreto es una /l/ entre dos vocales /o/. Obsérvese como la curva de tono fundamental, pese a presentar las habituales pequeñas irregularidades es más o menos constante. Por lo demás, la forma de poner las marcas en estos sonidos no presenta una mayor dificultad.

Figura I-14 Laterales

h) SONIDOS VIBRANTES. Los sonidos vibrantes son básicamente la /r/ y la /rr/ (que se suele etiquetar como RR). Aunque ambos sonidos están incluidos en el mismo grupo presentan algunas características diferentes.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 26: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Tanto uno como otro tienen una especie de vibración en general con cierta periodicidad que permite marcarlos. Pero mientras que el sonido /r/ es como si se limitara a esa vibración, como transición entre por ejemplo dos vocales, el sonido /rr/ muestra lóbulos de vibración entre breves silencios. El segundo lóbulo es además muy influenciado por la vocal o sonido consecutivo, mostrando su mismo periodo e incluso una forma de onda muy similar.

El marcado del sonido /r/, trata de buscar la periodicidad en la vibración. Esto no siempre resulta sencillo porque en ocasiones es muy irregular, resultando muy difícil identificar la periodicidad.

En la figura I-15 se muestra un ejemplo de sonido /r/ entre dos vocales. Se observa una caída de tono así como ciertas irregularidades en la vibración:

Figura I-15 Sonidos vibrantes (I)

GRUPO DE TECNOLOGÍA DEL HABLA

Page 27: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

El sonido /rr/ sí presenta una mayor dificultad al ser marcado. El problema radica sobre todo en los silencios. Los lóbulos suelen ser muy cortos pero con periodicidad. Por lo general se intenta que las marcas de los silencios generen una curva de tono lo menos brusca posible. El resultado es una especie de “w” invertida.

La figura I-16 presenta una /rr/ entre dos vocales. Se comprueba que hay tres silencios separando las vocales de los dos lóbulos. Además estos lóbulos son muy breves, no más de cuatro periodos:

Figura I-16 Sonidos vibrantes (II)

Para completar el capítulo de marcado, se van a ofrecer por último algunos de los errores más habituales que suele cometer la extracción automática de la curva de tono, y la forma de corregir este error manualmente. Se mostrará la pantalla con la curva obtenida por el programa, y la versión corregida a posteriori.

• Marcado de fonemas con un tono muy elevado. Si el tono es muy alto, es habitual que el programa se salte muchas marcas, colocando sólo

GRUPO DE TECNOLOGÍA DEL HABLA

Page 28: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

unas pocas. Es necesario recurrir entonces a la opción poner marca y añadir las que sean necesarias de forma manual. Obsérvese en la figura I-17 la vocal marcada de forma automática por el programa.

Figura I-17 Marcado de fonemas con un tono muy elevado (I)

El programa ha colocado poquísimas marcas. Se debe por tanto buscar una referencia y marcar la periodicidad. Una vez corregido manualmente, el resultado debería ser similar a la figura I-18.

• Derivas en el marcado automático. Cuando se obtiene el marcado automático, otro problema muy habitual, es una pequeña desviación que se va acumulando en las marcas. Es un error sencillo de resolver, pues sólo hace falta recolocar las marcas en su posición exacta. Así, en la figura I-19 se puede comprobar cómo el marcado automático ha ido añadiendo una ligera desviación a las marcas que sobre todo al final es muy apreciable.

Una solución más correcta se consigue rápidamente con sólo reposicionar las marcas del final del tramo de voz. Como es lógico, la curva de tono es ahora mucho más suave que la que entregó el programa mediante el marcado automático (figura I-20).

GRUPO DE TECNOLOGÍA DEL HABLA

Page 29: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-18 Marcado de fonemas con un tono muy elevado (II)

Figura I-19 Derivas en el marcado automático (I)

GRUPO DE TECNOLOGÍA DEL HABLA

Page 30: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-20 Derivas en el marcado automático (II)

• Transición de mínimos a máximos. Es un error que el marcado automático comete en ocasiones cuando hay dos fonemas sonoros consecutivos. Ocurre que el criterio utilizado para marcar uno de ellos no coincide con el utilizado en el otro, por lo que sobre todo en la transición suele haber picos o caídas muy grandes en la curva de tono fundamental. Un ejemplo podría ser la figura I-21.

Se trata de una /d/ seguida de una /a/. El programa ha marcado automáticamente la consonante utilizando como criterio los máximos, mientras que para la vocal eligió la máxima pendiente positiva. Ello conduce a que en la transición haya una gran caída en la curva de tono.

Para solucionar este problema, existen dos alternativas. Por un lado, se pueden unificar los criterios, escogiendo sólo uno y corrigiendo todas las marcas del otro fonema. En principio es la solución óptima, pero exige un esfuerzo mucho mayor, y por ello se suele optar por la segunda opción. Ésta

GRUPO DE TECNOLOGÍA DEL HABLA

Page 31: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

consiste en intentar colocar alguna marca intermedia de transición, de modo que la curvasea lo más continua posible. Se evita con ello tener que modificar muchas marcas obteniéndose un resultado muy aceptable.

Figura I-21 Transición de mínimos a máximos

Se presenta en la figura I-22 una posible solución utilizando esta segunda opción. Sólo ha sido necesario añadir una marca y desplazar ligeramente las consecutivas para suavizar la curva. Obsérvese como el valle de la frecuencia fundamental ha desaparecido, y la curva es mucho más suave.

En general estos son los problemas más comunes que suele presentar el marcado automático. Otros ya tratados pueden ser la explosión de las oclusivas, las marcas en señales muy atenuadas o el exceso de marcas en las fricativas (este último recientemente corregido). En general conviene revisar

GRUPO DE TECNOLOGÍA DEL HABLA

Page 32: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

todo el archivo mediante las opciones adecuadas, y corregir manualmente todas las anomalías que se detecten.

Figura I-22 Transición de mínimos a máximos. Posible solución

I.4. SEGMENTACIÓN DE FONEMAS

El proceso de segmentación suele realizarse a continuación del de marcado, aunque no tiene porqué. No es necesario segmentar todo el archivo de voz. Por lo general sólo nos suele interesar una palabra o palabras, que son las que contienen la información de interés.

El procedimiento habitual para segmentar una palabra consiste en aplicar en primer lugar un zoom sobre ella. Normalmente con un solo Zoom no

GRUPO DE TECNOLOGÍA DEL HABLA

Page 33: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

suele ser suficiente. Existen determinados sonidos como los oclusivos o fricativos que son muy fáciles de segmentar, puesto que se diferencian mucho del resto. Éstos son los que se suelen etiquetar los primeros. Para ello basta con seleccionar la opción poner del menú etiquetas; pulsar el botón izquierdo donde comience (o termine ) el fonema, desplazar el puntero hasta el punto donde se considere que termine (o comience) dicho fonema. Si se quiere comprobar que se han escogido los puntos correctos, se puede escuchar la sección seleccionada (que habrá cambiado de color) mediante el botón derecho. Finalmente se vuelve a pulsar el botón izquierdo y el programa solicitará una etiqueta. Las etiquetas utilizadas habitualmente se presentan en un apéndice al final del manual. Si se ha cometido un error, se puede seleccionar la opción cancelar y volver a iniciar el proceso.

Para aquellos fonemas difíciles de distinguir, se suelen aplicar sucesivos Zoom y escuchar. No obstante hay casos como los diptongos o la /ñ/ en los que resulta imposible determinar el punto exacto de separación entre fonemas, por lo que se trata más bien de encontrar una solución aceptable que no cometa un error apreciable.

Las características básicas de cada grupo fonético al marcar son las siguientes:

a) OCLUSIVAS SORDAS Y OCLUSIVAS SONORAS. Se agrupan ambos tipos porque al ser segmentadas presentan un comportamiento muy similar. En general son sonidos sencillos de segmentar, muy fácilmente identificable.

Tan solo presentan dos pequeñas dificultades. Sobre todo si son posteriores a sonidos sonoros el silencio de las oclusivas puede presentar una sonoridad residual que al segmentar complica la determinación del comienzo del fonema. Se suele optar por incluir en la oclusiva aquella sonoridad que esté tan atenuada que apenas se pueda apreciar al escuchar.

El segundo problema se encuentra en la explosión que normalmente precede a una vocal. Suele ocurrir que los primeros periodos posteriores a la

GRUPO DE TECNOLOGÍA DEL HABLA

Page 34: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

explosión, presenten irregularidades. A pesar de ello, estas irregularidades no se incluyen en el fonema oclusivo al marcarlo, limitándolo a la explosión.

En la figura I-23 se presenta una /p/ segmentada.

Figura I-23 Oclusivas sordas y oclusivas sonoras

b) FRICATIVAS. Los sonidos fricativos también resultan muy fáciles de identificar, pues sus características los hacen a simple vista muy diferentes del resto. Por ello se suelen segmentar en primer lugar.

Los fonemas fricativos, afectan ligeramente a los sonidos adyacentes provocando una especie de ruido en sus periodos adyacentes. En general, haciendo uso de la opción oír se trata de delimitar la separación más correcta entre fonemas.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 35: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Se presenta en la figura I-24 una /s/ segmentada. Se comprueba que al principio del fonema, existe cierta periodicidad residual que procede de la vocal anterior. El punto de delimitación del final de la /s/ resulta más sencillo de identificar, pues la transición desde la /s/ hasta la siguiente vocal es bastante brusca, pasándose de un silencio ruidoso a un periodo sonoro de forma clara.

Figura I-.24 Fricativas

c) SONIDOS SONOROS. La dificultad a la hora de segmentar un fonema sonoro se encuentra no tanto en el propio fonema como en el contexto en que se encuentre dicho sonido. Así, separar una vocal entre dos fricativas es muy sencillo. Por el contrario, cuando la vocal forma parte de un diptongo, o junto al fonema /ñ/, resulta casi imposible determinar los puntos exactos que delimitan el fonema vocálico.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 36: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Cuando se encadenan de forma consecutiva varios fonemas sonoros, en general será muy importante utilizar repetidas veces la opción de oír, para determinar lo mejor posible las zonas de separación entre unos sonidos y otros. Además existen ayudas adicionales, en función de la forma de onda que pueden presentar ciertos grupos de sonidos.

De este modo conviene saber que los fonemas aproximantes y los laterales se detectan muy bien por energía. En efecto, estos sonidos suelen presentar una energía bastante menor que la del entorno que le rodea.

De igual modo, los sonidos vibrantes tienen una forma muy característica, tanto la /r/ como la /rr/, que permite su segmentación de forma sencilla. Dichas propiedades ya han sido vistas en el apartado anterior.

El contexto más complejo es el de los diptongos y las nasales (especialmente problemático es el caso de la /ñ/) seguidas o precedidas de vocales. En estos últimos casos resulta imposible separar perfectamente unos fonemas de otros. Se intenta entonces proponer una solución que no cometa demasiado error.

Se presentan por último una serie de ejemplos de este apartado y comentarios acerca de dichos ejemplos.

• Diptongos. En la figura I-25 se muestra el diptongo /ae/. Como se puede comprobar fácilmente, resulta muy difícil segmentar este tipo de difonemas, pues la forma de onda de ambas vocales es similar, y su transición es muy suave. En estos casos, la única solución es escuchar repetidas veces diferentes secciones del diptongo, y buscando un poco de distinción en las formas de onda, intentar determinar el punto de separación. A veces resulta útil empezar a segmentar por el final del fonema, y escuchar mediante el botón derecho hasta que se aprecie el fonema anterior. Es decir, no es necesario marcar comenzando siempre por el principio. También se puede marcar por detrás.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 37: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

• Fonema /ñ/ junto a vocal. Se trata de otra combinación que resulta muy difícil de separar. Ello se debe a que la vocal queda muy nasalizada por la /ñ/, no pudiendo determinarse el punto de separación ni por la forma de onda,ni por el oído. Se intenta simplemente encontrar el punto que parezca más adecuado aceptando que resulta imposible encontrar la solución exacta.

Figura I-.25 Diptongos

En la figura I-26 se presenta el fonema /ñ/ entre dos vocales (dos /e/). Se ve que el comienzo de la forma de onda de la primera vocal y el final de la segunda vocal se diferencian claramente de la zona intermedia, (lo que sería la /ñ/). El problema radica en los puntos de separación entre uno y otro, que es lo fundamental a la hora de segmentar. La solución presentada es sólo una de entre varias posibles.

GRUPO DE TECNOLOGÍA DEL HABLA

Page 38: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

• Vocal más lateral. Se presenta por último la segmentación de un fonema lateral entre dos vocales. En concreto se trata de una /l/ entre dos /a/. No constituye un caso excesivamente complejo, pues como se puede observar en la figura I-27, la /l/ se puede detectar por energía, y además se distinguen en su forma de onda.

Figura I-.26 Fonema /ñ/ junto a vocal

GRUPO DE TECNOLOGÍA DEL HABLA

Page 39: CAPITULO 1: INTRODUCCIÓN · Web viewLa diferencia entre uno y otro fonema depende en cada caso del hablante. Pero hoy en día es raro que el interlocutor los pronuncie de forma diferente,

ANEXO I

Figura I-.27 Vocal más lateral

GRUPO DE TECNOLOGÍA DEL HABLA