Top Banner
INTRODUCCIÓN A LA INGENIERÍA EPSC UPC INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 1 de 23 TEMA 3 DIGITALIZACIÓN DE SEÑALES: CONVERSIÓN ANALÓGICA/DIGITAL. 1 Etapas principales: Muestreo, cuantificación y codificación 1.1 Selección de la frecuencia de muestreo. Teorema del muestreo 1.2 Aliasing y filtros antialiasing 1.3 Selección del paso de cuantificación y el número de bits 1.4 Codificación. Ejemplo: PCM 1.5 Conversión de las palabras código a muestras analógicas 2 Ventajas e inconvenientes de la codificación digital de las señales 3 Ejemplos. Especificaciones para la digitalización de señales de audio y video. 3.1 Selección de la frecuencia de muestreo en sistemas de audio. 3.2 Frecuencias de muestreo en vídeo digital. 3.3 Formatos reducidos. 3.4 Selección del número de bits en sistemas de audio. 3.5 Selección del número de bits en sistemas de vídeo. En las prácticas de la asignatura se considera cómo los cambios de una magnitud física en el tiempo (por ejemplo tensión) pueden utilizarse para transmitir o almacenar información de vídeo o audio. El proceso de convertir las ondas acústicas o los espectros visibles en señales de tensión y viceversa se conoce con el nombre genérico de transducción y su complejidad así como el número de subsistemas involucrados en la codificación depende en gran medida de las características del sistema: transmisión a larga o corta distancia, tipo de medio de transmisión o almacenamiento, etc. Todas las señales que se han considerado hasta este momento son analógicas. Un sistema analógico es aquel en que la magnitud física que se transmite puede tomar cualquier valor numérico dentro del margen de trabajo del propio sistema. En la mayor parte de los casos, éste valor es directamente proporcional a la magnitud física que se desea transmitir. Así, en el caso del un sistema de megafonía, la tensión que se transmite por el cableado de la instalación es directamente proporcional a las variaciones de presión que se capturan en la proximidad del micrófono. En otros casos, la magnitud física original puede haber sido transformada para adaptarla a las características del medio de transmisión o almacenamiento. En la figura 1 se representa esquemáticamente una señal de tensión analógica donde se indica que, desde un punto de vista formal, puede considerarse como una función real (tensión) de variable real (tiempo). El margen de valores que toma la función se denomina margen dinámico y suele estar acotado entre un valor mínimo y uno máximo que dependen de las limitaciones físicas de los sistemas de transducción.
22

Tema3 digitalizaci-3253-

May 16, 2023

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 1 de 23

TEMA 3

DIGITALIZACIÓN DE SEÑALES: CONVERSIÓN ANALÓGICA/DIGITAL.

1 Etapas principales: Muestreo, cuantificación y codificación

1.1 Selección de la frecuencia de muestreo. Teorema del muestreo 1.2 Aliasing y filtros antialiasing 1.3 Selección del paso de cuantificación y el número de bits 1.4 Codificación. Ejemplo: PCM 1.5 Conversión de las palabras código a muestras analógicas

2 Ventajas e inconvenientes de la codificación digital de las señales 3 Ejemplos. Especificaciones para la digitalización de señales de audio y video.

3.1 Selección de la frecuencia de muestreo en sistemas de audio. 3.2 Frecuencias de muestreo en vídeo digital. 3.3 Formatos reducidos. 3.4 Selección del número de bits en sistemas de audio. 3.5 Selección del número de bits en sistemas de vídeo.

En las prácticas de la asignatura se considera cómo los cambios de una magnitud física en el tiempo (por ejemplo tensión) pueden utilizarse para transmitir o almacenar información de vídeo o audio. El proceso de convertir las ondas acústicas o los espectros visibles en señales de tensión y viceversa se conoce con el nombre genérico de transducción y su complejidad así como el número de subsistemas involucrados en la codificación depende en gran medida de las características del sistema: transmisión a larga o corta distancia, tipo de medio de transmisión o almacenamiento, etc. Todas las señales que se han considerado hasta este momento son analógicas. Un sistema analógico es aquel en que la magnitud física que se transmite puede tomar cualquier valor numérico dentro del margen de trabajo del propio sistema. En la mayor parte de los casos, éste valor es directamente proporcional a la magnitud física que se desea transmitir. Así, en el caso del un sistema de megafonía, la tensión que se transmite por el cableado de la instalación es directamente proporcional a las variaciones de presión que se capturan en la proximidad del micrófono. En otros casos, la magnitud física original puede haber sido transformada para adaptarla a las características del medio de transmisión o almacenamiento. En la figura 1 se representa esquemáticamente una señal de tensión analógica donde se indica que, desde un punto de vista formal, puede considerarse como una función real (tensión) de variable real (tiempo). El margen de valores que toma la función se denomina margen dinámico y suele estar acotado entre un valor mínimo y uno máximo que dependen de las limitaciones físicas de los sistemas de transducción.

Page 2: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 2 de 23

Tensió

real devariable real

Señal analógica

Tensión

Valores reales

Tiempo

Valores reales

Función real devariable real

Margen

dinámico

Fig. 1 Representación esquemática de una señal analógica como función real de variable real.

Sin embargo existe un conjunto muy importante de señales denonimadas digitales, que implica un conjunto discreto tanto en el dominio del tiempo como para la amplitud. Obsérvese que podría considerarse al telégrafo, sistema pionero en telecomunicaciones, como primera versión de sistema de comunicaciones digitales. Siendo algo más heterodoxos, también las señales de humo o navales responderían a este concepto. De forma más matemática, atendiendo a la continuidad del eje de abscisas u ordenadas, las señales pueden clasificarse en:

o Analógicas, x(t): Amplitud y Tiempo continuos. o Muestreadas, x[n]: Tiempo Discreto, Amplitud continua. o Cuantizada, xC(t): Tiempo Continuo, Amplitud discreta. o Digital, xQ[n]: Tiempo y Amplitud discretos.

El proceso de digitalización de una señal analógica parece, en principio, algo natural. De hecho, la representación de la señal analógica que se ha realizado en la figura 1 no es más que una digitalización previa de la función real. En este caso, la digitalización consiste en tomar un número elevado de muestras de la función en el eje temporal. Si éste número es suficientemente elevado el ojo no será capaz de distinguir entre una representación realmente analógica (como la que obtendríamos representando la función utilizando un lápiz y un papel) y su equivalente digital. El procedimiento de representación gráfica también supone una discretización del eje de ordenadas. En efecto, los valores de tensión mostrados han sido aproximados por el valor más cercano dentro de la retícula de representación del dispositivo gráfico, por lo que tampoco se corresponden exactamente con los valores analógicos. Esta misma idea es la que se utiliza para representar la información asociada a una señal analógica de forma digital, que tampoco es tan nueva, puesto que tenemos ejemplos centenarios de equivalentes esfuerzos por “digitalizar” imágenes, como los bordados, las cristaleras, etc. 1 ETAPAS PRINCIPALES: MUESTREO, CUANTIFICACIÓN Y CODIFICACIÓN. El concepto básico de la digitalización de señales se muestra en la figura 2. La señal analógica original se aproxima mediante la ayuda de una retícula rectangular. La separación entre los elementos de la retícula en el eje de abcisas es constante y se conoce como el periodo de muestreo de la señal. Intuitivamente, parece que cuanto menor sea el valor del periodo de muestreo mejor representada quedará la señal analógica. No obstante, veremos que el

Page 3: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 3 de 23

teorema del muestreo establece, en función de las características de la señal, un límite al valor del periodo de muestreo. Si se verifica éste requisito mínimo, la señal analógica puede ser recuperada exactamente a partir de sus muestras sin ningún tipo de ambigüedad. Bajo estas condiciones, la representación digital de la señal no mejora aunque reduzcamos el intervalo de muestreo en el eje temporal. Analizaremos con algo más de detalle las condiciones que establece el teorema del muestreo más adelante.

Tensión

Tiempo

Funció real devariable realRetícula de muestreo

Señal analógica

Paso de cuantificación

Paso de cuantificación

Periodo de muestreoPeriodo de muestreo Fig. 2 Proceso genérico de conversión de una señal análogica a digital

El intervalo de separación en el eje vertical se denomina paso de cuantificación y en este caso en términos generales se considera que su reducción siempre mejora la representación de la señal. No obstante, desde el punto de vista conceptual podría darse el caso en que disminuir el paso de cuantificación no aportara ninguna ventaja, como sería el caso de dispositivos cuánticos, donde incluso la magnitud física a medir (cuantos de flujo magnético, por ejemplo) ya está cuantizada de por sí. En el otro extremo, un paso de cuantificación excesivamente elevado introduce un error significativo en la representación de la señal que, a efectos prácticos, se traduce en la presencia de efectos indeseados que se conocen como ruido.

En la práctica, el paso de cuantificación idóneo viene determinado por las características del receptor final, que para señales de audio y vídeo suele ser el ser humano. Consideremos como ejemplo la digitalización de una señal de audio para aplicaciones de reproducción de sonido en alta fidelidad. En este caso, las características del sistema auditivo humano son las que determinan el paso de cuantificación máximo para que la señal pueda reproducirse sin que se aprecie ninguna diferencia en relación con la señal original. El valor del paso de cuantificación óptimo se determina realizando pruebas exhaustivas de calidad subjetiva obtenidas con distintos oyentes e intervalos de cuantificación. El principio básico es que no tiene sentido reducir el paso de cuantificación más allá de las capacidades del sistema auditivo.

En el caso de que el destinatario final de la información no sea el ser humano el procedimiento es parecido. Consideremos como ejemplo un sistema de visión artificial que debe realizar el reconocimiento óptico de matrículas de automóvil. Ahora, el criterio para determinar el paso de cuantificación es que las capacidades de reconocimiento del sistema no se vean reducidas por el hecho de utilizar un número excesivamente reducido de niveles. El paso de cuantificación óptimo es, nuevamente, el máximo valor que permite mantener las prestaciones de reconocimiento de caracteres del sistema.

Page 4: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 4 de 23

Evidentemente, en los dos casos considerados, las prestaciones del sistema no se reducen si se utiliza un paso de cuantificación menor que el que hemos definido como óptimo. No obstante, veremos que el paso de cuantificación está íntimamente ligado con el número de bits que debe soportar el sistema, ya que los niveles discretos resultantes deben codificarse en palabras binarias para su tratamiento digital. Reducir el paso de cuantificación supone aumentar el número de bits, lo que en general representa un incremento en el coste económico o tecnológico del sistema. Finalmente, ese continuo que es el conjunto de los números reales, en amplitud y tiempo, queda acotado a un conjunto de bits para instantes temporales determinados, es decir, a un vocabulario poderosamente estándar y fácilmente manejable por ordenadores y todo tipo de dispositivos digitales. Cualquier fenómeno físico susceptible de ser medido puede traducirse en señales a través de los adecuados sensores, y éstas en bytes, al digitalizarlas, sentando las bases de ese mundo virtual tan atractivo para el mundo de la ciencia ficción.

1.1 SELECCIÓN DE LA FRECUENCIA DE MUESTREO. TEOREMA DE MUESTREO De forma general, la selección de los puntos de muestreo para una señal dependerá fuertemente del conocimiento previo que tengamos de dicha señal. En términos matemáticos, sería equivalente al número de puntos necesarios para determinar de forma unívoca una curva. Así, para una función (señal) continua nos bastará con un único punto (de muestreo), pues no evoluciona con el tiempo y nuestra única incógnita es el valor de la amplitud. En el caso de tratarse de una recta (una señal puramente creciente), entonces nos bastarían dos puntos. No obstante, nótese que la determinación de los parámetros de una señal cuadrada (amplitud y periodo), lo cual implica dos incógnitas, no resulta de la simple recogida de dos puntos de muestreo, salvo que se dispusiera de alguna información previa sobre su frecuencia. En el otro extremo, para una señal de la que se carece de información, es decir, de dinámica imprevisible incluyendo discontinuidades, el número teórico de puntos de muestreo que se precisa se hace infinito.

En la mayoría de los casos nos bastará con disponer de información sobre el dominio de actuación de la señal, es decir, sobre su margen dinámico o rango de amplitudes, y sobre su frecuencia, que tiene una influencia directa en la determinación de los puntos de muestreo. Estas limitaciones pueden corresponderse con la señal en sí o bien con los propios requerimientos del receptor o usuario. Así, un ejemplo ilustrativo de señal con rango frecuencial limitado por su propia naturaleza sería el ruido que produce un motor, cuya frecuencia es consecuencia directa del número de revoluciones por minuto al que gira. El otro caso sería el de los sistemas de audio, cuyo rango de frecuencias queda limitado a menos de 20 KHz, pues dichos armónicos superan los límites de percepción del oído humano.

Page 5: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 5 de 23

Nótese que en este último caso la fuente (por ejemplo una orquesta) podría generar armónicos de mayor frecuencia, que si se registraran no tendrían utilidad para el melómano pero, por el contrario, “consumirían” potencia y, lo que es incluso peor como se irá viendo a lo largo de la materia, también ancho de banda. La señal de audio únicamente requiere disponer de contenido espectral hasta esta frecuencia máxima de 20 KHz para que pueda ser reproducida con total fidelidad. Para evitar la inclusión de frecuencias inservibles, las señales se limitan en banda, es decir, se anulan por encima de un determinado valor de frecuencia. Se dice que una señal es de banda limitada cuando su contenido espectral es nulo a partir de una determinada frecuencia W. En la figura 3 se representa esquemáticamente el espectro de una señal de banda limitada. Si la señal es paso bajo, la frecuencia que actúa como límite del contenido espectral de la señal se denomina ancho de banda.

W

f

Señal de banda limitada W

W

f

Señal de banda limitada W

Fig. 3 Señal paso bajo de banda limitada con ancho de banda W.

Así, la frecuencia de muestreo depende de las características de la señal y su estadística de variación en el tiempo. Evidentemente, cuanto más rápidos son los cambios temporales que experimenta la señal, más elevada debe ser la frecuencia de muestreo a fin de evitar que se produzca una pérdida de información significativa. La relación entre las variaciones temporales de la señal y la frecuencia de muestreo mínima se establece mediante el teorema del muestreo o criterio de Nyquist. Como se verá, el teorema del muestreo establece que sólo puede realizarse un muestreo sin pérdida de información cuando la señal es de banda limitada. Las señales de audio y de vídeo son de banda limitada por lo que admiten representaciones digitales. Como ya se ha comentado, en el caso de las señales de audio es el propio oído humano el que establece el límite de ancho de banda de la señal. La capacidad para la detección de frecuencias y tonos depende de cada individuo y de la edad pero está establecido entre los 15 KHz y los 20 KHz. Las señales con una frecuencia superior a los 20 KHz se consideran inaudibles para el oído. Otro ejemplo es la telefonía analógica convencional, donde el ancho de banda de la señal de voz es de unos 3.4 KHz. Este ancho de banda proporciona suficiente información como para que los mensajes telefónicos puedan ser correctamente interpretados y pueda reconocerse el interlocutor. El hecho de que en telefonía no se utilice todo el ancho de banda de la señal de audio está ligado a un problema tecnológico y económico para la optimización de los recursos de ancho de banda. En efecto, cuanto menor es el ancho de banda de cada una de las señales individuales que deben encaminarse a lo largo de la red telefónica mejor podrán aprovecharse los recursos, transmitiendo más canales en paralelo (multiplexación) por las mismas conexiones físicas.

Page 6: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 6 de 23

1.1 Selección de la frecuencia de muestreo. Teorema del muestreo. Desde el punto de vista intuitivo, si deseamos tener una representación de una señal mediante un conjunto finito de puntos de muestreo, nos basta con cumplir dos condiciones:

a) que la señal original pase por los puntos de muestreo; b) que no exista otra señal que pase por los mismos puntos de muestreo;

tTm

t

T0Tm

T1

Fig. 4 Posible ambigüedad entre dos señales para el mismo conjunto de puntos de muestreo. La figura 4 muestra la principal problemática al seleccionar los puntos de muestreo: que representen una única señal. Nótese que tanto la señal representada por la curva azul como la que viene dada por la curva roja proporcionarían los mismos valores si se muestrearan con un periodo Tm. Si se repite el ejercicio con sinusoides, es decir, en su componentes frecuenciales, la problemática se mantiene, como también se ilustra en la figura 5. ¿Cómo determinar si las muestras se corresponden con la señal representada en rojo o en azul? Resulta evidente que se necesita algún tipo más de información. Imagínese que, por ejemplo, se supiera que la señal está compuesta por armónicos de frecuencia inferior a f1=1/T1, entonces podría descartarse la señal representada en rojo. De forma más rigurosa, el teorema del muestreo establece que cuando una señal es de banda limitada puede muestrearse sin que se produzcan pérdidas de información utilizando una frecuencia de muestreo mayor que el doble de su ancho de banda.

WT

fmuestreo

muestreo ⋅>= 21

Esta relación entre la frecuencia de muestreo y el ancho de banda de la señal también se conoce con el nombre de criterio de Nyquist. De acuerdo con este teorema, la frecuencia de muestreo mínima para poder trabajar con señales de audio de alta fidelidad estaría situada por encima de los 40 KHz (20 KHz de ancho de banda). En la figura 5 se ilustra el proceso de muestreo sobre una componente sinusoidal. En este ejemplo se toman un total de 10 muestras por periodo por lo que se verifica, sin ningún tipo de problemas, el teorema del muestreo.

Page 7: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 7 de 23

Señal sinusoidal

10 muestras por periodo

t

x(t) Señal sinusoidal

10 muestras por periodo

t

x(t)

Fig. 5 Muestreo de una componente sinusoidal con una frecuencia

de muestreo que verifica el criterio de Nyquist. Es importante notar que el criterio de Nyquist establece un valor de frecuencia de muestreo estrictamente mayor, pues si el valor tomado se corresponde con la igualdad, la frecuencia máxima será suprimida. Es particular, para un tono de frecuencia f0, y periodo T0=1/f0, si se emplea una frecuencia de muestreo 2·f0, que impica un periodo de muestreo Tm=T0/2, NO podríamos recuperar la información, es decir, perderíamos el tono a frecuencia f0. De hecho, y como puede verse en la figura 6, para esa frecuencia de muestreo, los valores recogidos serían todos 0.

t

T0

s(t)=sin(2 f t)π 0

s(t)

ff0 fm

Tm

t

T0

s(t)Tm

Tm Fig. 6 Importancia de la desigualdad estricta para el criterio de Nyquist. Por ello, la frecuencia de muestreo debería ser estrictamente mayor a f0 y Tm estrictamente menor a T0/2, valor para el que puede demostrarse matemáticamente que la señal se reconstruye completamente. En este apartado bastará con observar gráficamente que los puntos muestreados ofrecen un valor no nulo por el que, además, resulta imposible dibujar cualquier otra señal de menor frecuencia. Sin embargo, no resulta inusual que para el cálculo habitual de la frecuencia de muestreo se emplee el valor igual al doble del ancho de banda, ya que se suele trabajar con señales de espectro frecuencial continuo, que implica que aunque matemáticamente se “pierda” el armónico f0, se mantiene el armónico f0-δf, a todos los efectos de mismo valor a f0. 1.2 Aliasing y filtros antialiasing. Para garantizar que el proceso de muestreo de una señal analógica verifica el criterio de Nyquist es necesario realizar un filtrado previo de la señal que garantice que no existen componentes de señal con una frecuencia superior a la mitad de la frecuencia de muestreo, es decir, que la señal es de banda limitada. Este filtro paso bajo se denomina filtro antialiasing y debe ser incorporado en cualquier sistema que realice

Page 8: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 8 de 23

la digitalización de señales. En la figura 7 se representa un diagrama de bloques en el que se indica la presencia del filtro antialiasing precediendo al subsistema de muestreo de la señal.

FiltroAntialising

Subsistemade muestreo

FiltroAntialising

Subsistemade muestreo

Señal analógicaBanda > W

Señal muestreada

Señal filtradaBanda < W

T <m 2W1

Fig. 7 Filtrado paso bajo previo de la señal analógica: filtro antialiasing.

1.3 Selección del paso de cuantificación y el número de bits. El paso de cuantificación define la precisión con la que se codifican las muestras de la señal, como si fueran a representarse en un display, es decir en un visor con un número de decimales fijo, y está directamente relacionado con el número de bits asignado a cada muestra. La figura 8 muestra el proceso de discretización de la amplitud de la señal e indica como se introduce un error entre el valor real de la señal analógica y el valor con que se codificará la muestra una vez digitalizada.

Tensión analógica

Periodo de muestreoCuantificación.Número de bits

Valor real

Valor cuantificado

error Tensión analógica

Periodo de muestreoCuantificación.Número de bitsCuantificación.Número de bits

Valor real

Valor cuantificado

error

Fig. 8 Cuantificación y ruido de cuantificación.

El proceso de digitalización introduce por tanto un error aleatorio en la amplitud de la señal que es equivalente a la adición de una componente de ruido. En efecto, podemos suponer que el valor cuantificado corresponde al de la señal original más un ruido ‘virtual’, que se ha superpuesto con la señal, dando lugar al valor que realmente adquiriremos. El ruido puede ser tanto positivo como negativo y su valor máximo es igual a la mitad del paso de cuantificación. La figura 9 muestra la diferencia entre una señal que recorre todo su margen dinámico y su correpondiente señal cuantificada, así como la diferencia entre ambas, es decir, el error o ruido de cuantificación para el continuo del tiempo.

Page 9: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 9 de 23

s (t)Q

0

2∆

3∆

−3∆

−∆

−4∆

−2∆

t

t0 t1 t2 t3 t4 t6t5 t7

s(t)Vmax

Vmin

s (t)Q

0

−∆/2

∆/2

t0 t1 t2 t3 t4 t6t5 t7

s(t)

Fig. 9 Diferencia entre una señal que recorre todo su margen dinámico, s(t), en rojo, y la señal

cuantificada sQ(t), en azul, es decir, el ruido o error de cuantificación, en verde. Disminuir el paso de cuantificación reduce el nivel de ruido existente en la señal digitalizada. Por otro lado, para que la versión digital de la señal reproduzca con fidelidad el contenido de la información analógica deberemos ajustar el paso de cuantificación a las necesidades del sistema. Para señales de audio y de vídeo el paso de cuantificación puede definirse cuando como aquel para el que las capacidades del sistema auditivo o visual no pueden distinguir entre la señal original y la digitalizada.

El margen dinámico de la señal está directamente relacionado con el paso de cuantificación de manera que si uno de los dos aumenta el otro también debe aumentar en la misma proporción. Como ejemplo, para dos señales de audio de idéntico contenido, pero una de ellas contenida entre valores de tensión de +/-1 mVolts y la otra entre +/- 5 mVolts, si se desea escuchar las dos señales en las mismas condiciones será necesario amplificar la primera de ellas en un factor 5 veces mayor que la segunda (véase la figura 10). Por ello, para que los pasos de cuantificación produzcan el mismo efecto auditivo, el de la primera señal deberá ser 5 veces menor que el de la segunda. Es decir, el factor realmente significativo en cuanto a la fidelidad de la señal digitalizada es la relación entre el margen dinámico y el paso de cuantificación, es decir, el número de niveles o valores cuantificables.

t

s(t)

t

s(t)

0

2∆

3∆

−3∆

−∆

−4∆

−2∆

t

s(t)

0

3∆2

−4∆2

∆2=∆/5

V p1

V p2

V2p=V /5p

1

Fig. 10 Si se desea mantener la misma fidelidad en señales de diferente margen dinámico, el número de

pasos de cuantificación se debe mantener, pero ajustando sus valores máximos y mínimos.

Page 10: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 10 de 23

1.4 Codificación. Ejemplo PCM. La codificación PCM (Pulse Code Modulation) consiste en asignar un código binario a cada nivel de cuantificación de la señal. Con ello, cada una de las muestras queda codificada con una palabra de un número de bits fijo. Este tipo de codificación se utiliza en el sistema Compact Disc Digital Audio y en diversos sistemas de vídeo digital no comprimidos. En formatos de audio y vídeo comprimidos (ADPCM, Minidisc, MP3, MPEG) la codificación de la señal en PCM suele constituir la primera fase del proceso de compresión. Una vez la señal se ha convertido a PCM se analiza y procesa con el objeto de reducir el número total de bits con el que se representa, codificándola en formatos alternativos que pueden resultar más o menos complejos y/o eficientes. En cualquier caso, para reproducir una señal comprimida también es habitual pasarla previamente al formato PCM y posteriormente convertirla a una señal analógica que pueda aplicarse a los altavoces o al sistema de representación gráfica. En la figura 11 se muestran los códigos binarios que serían asignados a un cuantificador del tipo uniforme, es decir, que divide el margen dinámico en divisiones del mismo valor. La codificación utilizada se conoce como codificación en complemento a 2 y es la más utilizada en la codificación de audio y vídeo. Los códigos binarios de los niveles de cuantificación positivos empiezan siempre por cero y a continuación indican el número de pasos de cuantificación asignados. De este modo, para codificar el nivel de cuantificación 3∆ utilizaremos el código 011; donde el primer 0 indica que el nivel es positivo y los otros dos dígitos codifican el número 3 (1x21+1x20).

Tensión de entrada

Vmax

-Vmax

Margen dinámico2 Vmax

Códigos en Complemento a 2

000 = 0∆

001 = 1∆

010 = 2∆

011 = 3∆

111 = -1∆

110 = -2∆

101 = -3∆

100 = -4∆

Tensión de entrada

Vmax

-Vmax

Margen dinámico2 Vmax

Códigos en Complemento a 2

000 = 0∆

001 = 1∆

010 = 2∆

011 = 3∆

111 = -1∆

110 = -2∆

101 = -3∆

100 = -4∆

Fig. 11 Codificación PCM en complemento a dos.

La codificación de los niveles negativos es un tanto más compleja. Para codificar el nivel –k ∆ debemos expresar el de K en binario natural, posteriormente cambiar todos los 1’s por 0’s y viceversa (complementar a 1) y posteriormente sumar 1 al número resultante (complemento a 2). De este modo, todos los códigos asociados a números negativos empiezan por 1. Consideremos como ejemplo como quedaría codificado el nivel –2 ∆: el código binario correspondiente al nivel 2 es 010, que complementado a 1 resulta 101 y que finalmente, sumando la unidad, obtenemos 110. La tabla adjunta muestra los niveles asignados correspondientes a un código en complemento a 2 de 3 bits.

Page 11: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 11 de 23

Código binario

011 010 001 000 111 110 101 100

Nivel 3 2 1 0 -1 -2 -3 -4

Níveles y códigos binarios de 3 bits en complemento a 2

La ventaja de la codificación de datos en complemento a dos es que pueden realizarse las operaciones de suma entre niveles positivos y negativos sin tener en cuenta el signo. En efecto, si sumamos los códigos correspondientes a 2 (010) y al –3 (101) directamente obtenemos el código (111=010+101) que corresponde al nivel –1 (2-3). En la gráfica de la figura 12 se representa esquemáticamente el proceso de codificación de una señal. A cada muestra se le asigna el código binario correspondiente que representará el nivel de amplitud de la señal. Los datos resultantes pueden almacenarse en una memoria para su posterior tratamiento, transmitirse por algún medio adecuado o registrarse en un soporte de almacenamiento masivo.

001010010011011011001000111110110101101101101110000001011011010110101101110101

t000

001

010

011

111

110

101

100

Códigos

Secuencia temporal de las muestras codificadas

001010010011011011001000111110110101101101101110000001011011010110101101110101

t000

001

010

011

111

110

101

100

Códigos

Secuencia temporal de las muestras codificadas Fig. 12 Ejemplo de codificación de una señal.

En el caso de almacenarse en una memoria RAM para su tratamiento inmediato (efectos, ecualización digital, etc) los datos se registran tal cual en un buffer a la espera de ser procesados. La figura 13 muestra de forma muy simplificada como un procesador puede tomar los datos de una memoria de entrada y depositarlos, una vez transformados en la memoria de salida. Nuevamente, los datos existentes en el buffer de salida pueden ser reproducidos (conversión de PCM a señal analógica), almacenados en soporte masivo o transmitidos. Como ejemplo, se ha supuesto que el procesador toma la señal mostrada en la figura 12 y le introduce un retardo, de forma que a la salida se tenga un sistema con reverberación o eco. Obsérvese que desde el punto de vista informático es una tarea tan sencilla como la de desplazar los valores de la señal en el tiempo. Del mismo modo se podrían haber potenciado los graves o los agudos (ecualizado), eliminar un ruido conocido (como el de un motor, identificado por una determinada secuencia de 1’s y 0’s que puede ser restada), y un largo etcétera.

Page 12: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 12 de 23

Fig. 13 Tratamiento de datos numérico en formato PCM.

Para transmitir o registrar los datos lo más usual es agrupar varias palabras código en una misma trama en la que se incorporan bits adicionales de sincronismo que facilitan la recuperación de la secuencia. Las palabras se transmiten en formato serie, un bit detrás de otro, insertando las posibles palabras adicionales de sincronismo. En algunos casos, las palabras código se protegen con palabras adicionales que permiten detectar la presencia de errores e incluso corregirlos. El formato de trama utilizado en sistemas reales como el Compact Disc o la transmisión telefónica digital vía RDSI son complejos y sus detalles se expondrán en asignaturas más avanzadas. En el gráfico de la figura 14 se ilustra un esquema simplificado de una posible configuración de trama de datos.

CódigoInicio trama Palabra código 1 Palabra código N Palabra detección

erroresFinalización

tramaCódigo

Inicio trama

Trama de datos

CódigoInicio trama Palabra código 1 Palabra código N Palabra detección

erroresFinalización

tramaCódigo

Inicio trama

Trama de datos

Fig. 14 Transmisión de los datos PCM en forma de trama.

1.5 Conversión de las palabras código a muestras analógicas. Una vez que la señal es tratada (filtrada, transmitida, almacenada...), puede interesar convertirla de nuevo en señal analógica para, por ejemplo, escucharla mediante altavoces o visualizarla mediante un sistema de video. Se trata del proceso inverso al estudiado en los apartados precedentes. Este proceso de conversión de las palabras digitales a señales analógicas se realiza mediante conversores D/A (digital/analógico) y filtros paso bajo. Desde un punto de vista puramente funcional (no electrónico) los conversores digital analógico se encargan de convertir a valores de tensión los códigos binarios correspondientes a cada una de las muestras y mantienen este valor en la salida durante todo el periodo de muestreo. Los códigos binarios de las muestras deben presentarse al conversor con la misma cadencia con la que ha sido muestreada la señal. En el supuesto de que las frecuencias de muestreo de grabación y reproducción no coincidan se produce un efecto parecido al cambio de velocidad de reproducción en un disco de vinilo o en una cinta magnética. El filtro paso bajo situado en la salida del conversor se encarga de suavizar esta señal, es decir, de eliminar las componentes frecuenciales altas, que se corresponden con los saltos producidos por el empleo de señales cuantificadas. En algunos circuitos integrados, el conversor y el filtro reconstructor de salida están integrados en el mismo sistema. En la figura 15 se representa un diagrama de bloques del sistema de conversión D/A y las formas de onda representativas.

ConversorD/A

Códigos binarios

de entrada

0 1 1 0

Tm

FiltroPaso bajo

ConversorD/A

Códigos binarios

de entrada

0 1 1 0

Tm

FiltroPaso bajo

Fig. 15 Diagrama de bloques de un sistema de conversión D/A

Page 13: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 13 de 23

2 VENTAJAS E INCONVENIENTES DE LA CODIFICACIÓN DIGITAL DE LAS SEÑALES. En los apartados anteriores se ha descrito con cierto detalle el proceso de digitalización de las señales de audio o vídeo. Hemos visto que si los parámetros de la digitalización no se eligen en la forma adecuada pueden deteriorar la calidad de las señales. Es, por tanto, el momento de considerar con cierto detalle las muchas ventajas y algún inconveniente que nos proporciona la posibilidad de trabajar con señales en formato digital y así valorar la conveniencia de utilizar estos sistemas en el diseño de aplicaciones. En los siguientes subapartados se consideran brevemente y sin ánimo de ser exhaustivos algunas de las características de los sistemas digitales. Inmunidad al ruido.

Cualquier señal digitalizada sólo admite unos valores predefinidos válidos (dos niveles de amplitud en banda base, las representaciones de los bits). Este hecho nos permite detectar la presencia de ruido en la señal y si éste no tiene un nivel de amplitud excesivo corregirlo. Véase la figura 16.

t

Información digitalBanda base

Ruido

t

Información digitalBanda base

Ruido Fig. 16 Inmunidad al ruido de las señales digitalizadas en banda base.

Del mismo modo, las derivas temporales pueden ser rápidamente detectadas y corregidas pues no responden al patrón de valores binarios. En ambos casos, la limpieza que se realiza sobre la señal contaminada es tal que no existe diferencia con la original, es decir, pueden realizarse múltiples copias sin degradación. Además, gracias a la potencia de los procesadores y de los programas que operan con ellos, las señales pueden manipularse como cualquier otra secuencia de valores digitales, es decir: Posibilidad de encriptar la información. Procesado y tratamiento de señales de gran versatilidad. Control de errores. Edición de las señales.

Como aspecto menos ventajoso se encuentra el ruido de cuantificación que es sólo característico de las señales digitales y que ya ha sido definido. Existe, además, otro aspecto clave a tener en cuenta en las señales digitales y que las diferencia significativamente respecto a las analógicas: el ancho de banda. Ancho de banda de las señales digitales.

En los sistemas de telecomunicación el ancho de banda supone una importante consideración de diseño, pues repercute directamente en el número de canales a transmitir y en la calidad de la señal, por citar dos de los aspectos más importantes.

Page 14: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 14 de 23

Por ello es muy importante conocer cómo afecta al ancho de banda la digitalización de las señales, ¿aumenta o disminuye? A priori la respuesta intuitiva parece indicar que las señales digitales presentan componentes frecuenciales de mayor valor que las analógicas, debido a los bruscos flancos de subida y bajada de los pulsos con que se representa. No obstante esta representación es falsa, dado que los bits, las secuencias de unos y ceros, no necesariamente responden a señales cuadradas, y perfectamente podrían codificarse mediante sinusoides que doblan su frecuencia o cambian su fase. De hecho, la manera correcta de estimar el ancho de banda de una señal digital es, en primer lugar, midiendo el número de bits que deben transmitirse por segundo y, a continuación, incluyendo el ancho de banda necesario por cada uno de esos bits. Para ilustrar el cálculo completo, considérese como ejemplo el flujo de bits por segundo que requiere el sistema Compact Disc Digital Audio. Tal y como se verá con mayor detalle en el apartado 3, el número de bits por segundo debidos a la información de audio puede estimarse como:

sbitsmuestrabits

segcanalmuestrascanales /1041,116441002 6⋅=××

×

Es decir, que para escuchar música en tiempo real empleando las redes ADSL comerciales se debe acudir a las conexiones de gama alta (2 ó 4 Mbps), mientras que NO es posible hacerlo con las más convencionales de 128 kbps, 256 kbps o 512 kbps1. A este flujo de información deben añadirse todavía los bits adicionales asociados a los códigos correctores de errores, las palabras para la sincronización de los datos, los códigos de tiempo, los códigos para acondicionar los datos a las características del soporte, etc. Todo ello significa que la tasa mínima real a la que deben leerse los bits del soporte es unas 4 veces superior a la calculada. De todos modos, aún suponiendo que no se introdujeran códigos de protección, sincronización y acondicionamiento, la tasa de 1,41 Mbps es muy elevada para una información que en su formato analógico original sólo ocupaba 40 KHz (20 KHz cada canal). Evidentemente, el ancho de banda necesario para transmitir este flujo de bits (sin errores) depende del tipo de modulación digital que se utilice. Como primera aproximación podemos suponer que se requiere aproximadamente 0,5 Hz de ancho de banda por cada bit que deseemos transmitir. Esta aproximación proviene de suponer que los bits se transmiten en banda base, uno detrás de otro y asignando un valor de tensión positivo para los 1’s y uno negativo para los 0’s. Según esta aproximación, la frecuencia máxima de la señal que obtendremos corresponde a una secuencia de 1’s y 0’s alternados (101010101), que a razón de 1,4 Mbps da lugar a una frecuencia fundamental de unos 700 KHz. En la práctica existen formas de codificar la información (modulaciones) que pueden reducir ligeramente esta frecuencia máxima. De todos modos, en primera aproximación, podemos concluir que si deseáramos transmitir los bits resultantes después del proceso de digitalización necesitaríamos un ancho de banda muy superior a los 40 KHz, del orden de los 700

1 A fecha de Octubre 2004 y para los operadores domésticos

Page 15: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 15 de 23

KHz. Existe por tanto un incremento del ancho de banda de la señal en formato digital de, aproximadamente, un factor 20. Los cables que interconectan equipos de audio digital (CD, Minidisc, DAT, etc) deben ser capaces de proporcionar este ancho de banda para que las señales no se deterioren en el proceso de intercambio de información. Por ello, se utilizan cables coaxiales o de fibra óptica. El caso de la señal de vídeo es parecido. Consideremos la transmisión o intercambio directo de señales digitales con una calidad parecida al PAL en el estándar ITU-601 y el formato 4:2:2. La cantidad de bits asociados a la información de luminancia de un fotograma puede determinarse como:

fotogramaYbitspixelbitscolumnasfilas /)(10317,3/8)(720)(576 6⋅=×× Además de la información de luminancia deben incorporarse las señales diferencia de color U y V. En el formato 4:2:2 cada una de estas componentes se codifica con la mitad de muestras que la señal de luminancia. Por tanto, el número total de bits asociados a un fotograma será:

fotogramabitsVUbitsYbits /10635,6)/(10317,3212)(10317,3 666 ⋅=⋅⋅

⋅+⋅

Finalmente, teniendo en cuenta que deben transmitirse un total de 25 fotogramas por segundo obtenemos:

segbits /1088,16510635,625 66 ⋅=⋅× Realizando la misma aproximación que hemos efectuado para el caso de las señales de audio resulta que son necesarios 82,94 MHz de ancho de banda para transmitir este flujo de información. Teniendo en cuenta que la señal PAL tiene un ancho de banda aproximado de 5 MHz, el incremento de ancho de banda en este caso es de un factor 16. Evidentemente, aunque se usen códigos y modulaciones digitales de gran eficiencia espectral, el ancho de banda necesario para transmitir esta tasa de bits es muy superior a los 5 MHz que requiere el sistema analógico. Por esta razón, los formatos digitales derivados del ITU 601 se han mantenido como estándares digitales para el intercambio de información entre equipos y terminales en estudios de grabación y producción de vídeo y no se han extendido a sistemas de radiodifusión de la señal de vídeo. El incremento de ancho de banda asociado al proceso de digitalización de las señales de audio y vídeo representa, sin ninguna duda, el inconveniente principal de los sistemas digitales. La radiodifusión directa de señales de voz, audio o vídeo no resulta posible en formato PCM debido a que un canal digital ocuparía, como mínimo, un espacio en el espectro de radiofrecuencia de unos 10 canales analógicos, saturando rápidamente el número de posibles canales que podrían distribuirse. Los sistemas actuales de radiodifusión de señales de vídeo y audio por vía terrena, satélite o cable (DAB, DVB, GSM) sólo ha sido posible debido a la posibilidad tecnológica de implementar potentes algoritmos de compresión de información en tiempo real y a bajo coste. Algunos de estos algoritmos proporcionan una excelente calidad de imagen y sonido (prácticamente indistinguible de las señales sin comprimir) con unos factores de compresión superiores a los factores de extensión del ancho de banda debidos al proceso de digitalización. Con ello, el ancho de banda efectivo de las

Page 16: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 16 de 23

señales comprimidas consigue ser inferior al ancho de banda de sus equivalentes analógicos, pudiendo acomodar varios canales digitales en el espacio espectral que anteriormente ocupaba un canal analógico. Los métodos matemáticos y algoritmos utilizados para la compresión de audio y vídeo son extremadamente complejos y su comprensión exige un cierto dominio de diversas técnicas de procesado digital de señales en el dominio del tiempo y de la frecuencia. 3 EJEMPLO DE APLICACIÓN. ESPECIFICACIONES PARA LA DIGITALIZACIÓN DE SEÑALES DE AUDIO Y VIDEO. 3.1 Selección de la frecuencia de muestreo en sistemas de audio. El valor de la frecuencia de muestreo en un sistema de audio o voz depende de la calidad final de la señal que desee reproducirse o almacenarse y de la aplicación a la que se destina el sistema. Cuando se definió el sistema CD-Digital Audio se tomó como estándar una frecuencia de 44.1 KHz que permite trabajar con todo el espectro audible (20Hz a 20 KHz). El valor elegido verifica el criterio de Nyquist para la banda de audio aunque, como ya hemos comentado, siempre es necesario realizar un filtrado previo de las señales antes de proceder a su muestreo. Los filtros antialiasing están incorporados en los propios sistemas de digitalización. Así, cualquier grabador multipista para audio profesional incorpora unos filtros antialising que cumplen con los requisitos marcados por el estándar de audio digital utilizado. La selección de la frecuencia de 44.1 KHz no es casual y se debe a los primeros sistemas de registro de señales de audio en formato digital que aparecieron en la década de los 60. Estos primeros sistemas fueron desarrollados por la BBC, utilizando sistemas de vídeo modificados para almacenar la información de audio en formato digital. El sistema elegido almacenaba 3 muestras de audio digital en el espacio de cinta que debería haber correspondido a una línea de la señal de televisión. Esta tasa de registro de datos da lugar, para el sistema NTSC empleado en aquella época en Gran Bretaña, a una frecuencia de muestreo de 44.1 KHz. Cuando se desarrollo el sistema CD Digital Audio se tomó esta misma frecuencia de muestreo como un tributo a los primeros sistemas digitales. La frecuencia de 44.1 KHz no es la única frecuencia de muestreo utilizada en audio digital. Cuando se definió el sistema DAT (Digital Audio Tape) para el registro de audio en cintas magnéticas se definieron varias frecuencias de muestreo alternativas (32 KHz, 44.1 KHz y 48 KHz). El objetivo original de estos cambios en la frecuencia de muestreo era dificultar las copias piratas de CD’s en formatos de cintas magnéticas. Los primeros Minidisc y DCC que salieron al mercado registraban la información utilizando frecuencias de muestreo de 32 KHz. Estas frecuencias de muestreo exigen utilizar un filtro antialiasing que recorte la banda de audio útil entre los 15 KHz y los 16 KHz. Evidentemente, la calidad se reduce ligeramente aunque sólo un número reducido de melómanos es capaz de apreciarlo. Actualmente, los Minidisc registran y reproducen la información utilizando frecuencias de muestreo que admiten toda la banda de audio hasta los 20 KHz. Los sistemas actuales de DVD-Audio prevén la posibilidad de realizar registros de audio con frecuencias de muestreo de 96 KHz y 192 KHz. De este modo, la banda de audio queda ampliamente cubierta, con lo que se espera acabar con la polémica de que las frecuencias de muestreo actuales no permiten reproducir sonidos que sí se reproducían con los discos de vinilo.

Page 17: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 17 de 23

Los sistemas de telefonía digital utilizan frecuencias de muestreo más reducidas puesto que la banda de la señal de voz es más reducida que la musical y tampoco se pretende obtener calidades de reproducción de audio digital. La frecuencia de muestreo utilizada en la RDSI para la voz es de 8 KHz. Veremos que esta frecuencia de muestreo exige un flujo de datos considerable (64 kbps – transmitir 64000 bits cada segundo) que no es posible acomodar en los sistemas de telefonía móvil digital ni en las comunicaciones de audio a través de internet. Por ello, se han introducido diversos estándares para la compresión/descompresión de la información de audio que intentan reducir el flujo total de datos con el que se trabaja sin afectar excesivamente la calidad de la señal. Las frecuencias de muestreo de partida de estos sistemas se sitúan entre los 6 KHz y los 20 KHz. 3.2 Frecuencias de muestreo en vídeo digital. El proceso de digitalización de la señal de vídeo es bastante más complejo que el de la señal de audio puesto que estamos tratando con una información con diversas peculiaridades:

a) La información de vídeo depende de tres variables independientes que son el tiempo y las dos coordenadas espaciales x e y.

b) Si deseamos codificar una señal de color debemos aportar información de tres componentes diferentes. Estas componentes pueden ser las tres componentes de color básicas R, G y B o tres combinaciones linealmente independientes de ellas (como por ejemplo las componentes de luminancia y las señales diferencia de color).

En la práctica, la mayoría de sistemas de digitalización de la señal de vídeo parten de una señal de vídeo analógica (p.ej. una señal PAL) en la que ya se han realizado los muestreos tanto en el eje temporal como en el eje vertical (componente x – filas). Los criterios utilizados para realizar el muestreo en estas dos variables han sido expuestos en apartados anteriores donde, al menos aparentemente, no se ha tenido en cuenta el teorema del muestreo. En efecto, el muestreo de las imágenes en la variable tiempo se realiza a razón de 25 imágenes por segundo, subdividiendo cada imagen en dos campos. La selección de esta frecuencia de muestreo se basa en las características del sistema visual humano para la percepción de un movimiento continuo y sin parpadeo. Por otra parte, la señal de vídeo debe aportar información sobre las tres componentes de color. El proceso de muestreo depende del formato de partida de la señal de vídeo analógica. En el caso de señales de vídeo en blanco y negro, basta con tomar muestras de la luminancia sobre la forma de onda de la señal temporal. El proceso se ilustra esquemáticamente en la figura 17.

Page 18: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 18 de 23

Luminancia línea k

Luminancia línea k+1

Sincronismohorizontal

t

0 V

Nivel de blanco

Nivel sincronismos

Nivel de negro

70 %

30 %

Luminancia línea k

Luminancia línea k+1

Sincronismohorizontal

t

0 V

Nivel de blanco

Nivel sincronismos

Nivel de negro

70 %

30 %

Luminancia línea k

Luminancia línea k+1

Sincronismohorizontal

t

0 V

Nivel de blanco

Nivel sincronismos

Nivel de negro

70 %

30 %

Fig. 17 Muestreo de la información de luminancia de una señal de vídeo.

La digitalización de una imagen da lugar a un conjunto de muestras que pueden ordenarse de forma matricial. En cada fila y columna de la matriz hemos obtenido el valor de luminancia de la imagen. Las filas de esta matriz se corresponden a las líneas visibles de la señal de televisión mientras que las columnas se asocian a las muestras que hemos tomado en cada línea. Es importante mantener un buen sincronismo entre los impulsos de inicio de línea y campo con la señal de muestreo a fin de que las muestras se correspondan con las de una retícula rectangular como la que se ilustra en la figura 18. Esta matriz se correspondería con los valores numéricos de la luminancia en un instante de tiempo.

Muestras

filas

columnas

u(n,m)

Muestras

filas

columnas

u(n,m)

Fig. 18 Representación de una imagen digital como una matriz.

La digitalización de toda la secuencia de vídeo genera, a su vez, una secuencia de matrices que es la que deberemos almacenar, transmitir o procesar (ver figura 19). Los equipos dedicados a la codificación, transmisión o almacenamiento de vídeo digital suelen disponer de un ‘buffer’ de memoria en el que pueden almacenarse las últimas imágenes digitalizadas. Estas imágenes se procesan y posteriormente se transmiten o almacenan en un soporte masivo de forma continua con lo que se libera la memoria para la incorporación de las nuevas imágenes. El flujo medio de salida de datos del buffer de memoria debe ser superior al flujo de entrada con objeto de no rebasar la capacidad del sistema durante el funcionamiento continuo. Al disponer de un conjunto de imágenes correspondientes a distintos instantes de tiempo es posible realizar

Page 19: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 19 de 23

operaciones de compresión de datos o de tratamiento de imágenes que tengan en cuenta no sólo las características espaciales de cada imagen sino también la evolución temporal de la escena.

Fig. 19 Secuencia de matrices obtenida al digitalizar la señal de vídeo.

Para finalizar con el proceso de digitalización de la señal de vídeo debemos definir el número de muestras que se toman para cada una de las líneas. Para señales de televisión digitales con definición convencional existe un estándar aceptado internacionalmente que se conoce como el ITU-601. Según este estándar, el número de muestras visibles en cada línea de la imagen de televisión es de 720. Este número de muestras es común tanto para el formato de televisión europeo (PAL) como el americano o japonés (NTSC) y se obtiene utilizando una frecuencia de muestreo de 13.5 MHz. De acuerdo con este estándar el número de filas y columnas en el que se descompone una imagen de televisión digital en el sistema PAL es de 576x720 (filas x columnas). El número 576 proviene de que el sistema PAL dispone de 625 líneas de las cuáles sólo son activas (visibles) 575. Estas líneas se dividen en dos campos de modo que en cada campo se visualizan un total de 575/2 = 287,5 líneas. Al digitalizar cada uno de los dos campos la media línea analógica se convierte en una línea digital completa (en la que la mitad de los píxeles son negros) obteniendo un total de 288x2 = 576 líneas por imagen. En el sistema NTSC el número de píxeles de la imagen de televisión digital es de 480x720 (filas x columnas). En este caso el número de líneas activas del NTSC analógico es de 479. El formato ITU-601 está ampliamente extendido en sistemas de vídeo y televisión digital (MPEG-2, DVD, etc). 3.3 Formatos reducidos. En algunas aplicaciones donde no resulta necesaria una excesiva calidad de la imagen de vídeo digital suelen emplearse reducciones sobre el tamaño de la imagen. Con ello, se consigue una importante reducción respecto a la tasa de bits original, que puede hacer factible la codificación de la señal en soportes de baja densidad o canales de reducido ancho de banda. Un ejemplo típico de aplicaciones que utilizan formatos reducidos son los ficheros de vídeo para Windows AVI. Otro ejemplo es el MPEG-1, diseñado para codificar señal de vídeo sobre un soporte CD-ROM, que en principio fue diseñado sólo para almacenar información de audio. Todas estas aplicaciones suelen partir de una reducción del tamaño de las imágenes y, además, suelen aplicar codificadores que comprimen la información de vídeo. 3.4 Selección del número de bits en sistemas de audio. La codificación de los niveles del cuantificador como palabras binarias implica que el número de bits y el número de niveles están directamente relacionados. En efecto, si se utilizan palabras código de N bits, es lógico utilizar un número de niveles igual a M = 2N, lo que significa que se aprovechan todas las palabras código de que se dispone. Evidentemente, podría utilizarse un número menor de niveles de cuantificación pero no resultaría eficiente. Para seleccionar el número de niveles de cuantificación (o el número de bits por muestra) en un sistema de audio suelen realizarse pruebas de calidad subjetiva que indican en que grado los oyentes son capaces de apreciar el ruido de cuantificación

Page 20: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 20 de 23

introducido por el proceso de digitalización. Cuando se definió el estándar Compact Disc se realizaron numerosas pruebas de este tipo con el fin de definir un estándar de calidad digital aceptado de forma global. La mayor parte de los oyentes que realizaron las pruebas aceptaron que una codificación PCM con palabras código de 14 bits era totalmente indistinguible de la grabación analógica original. Al definir el estándar se eligió utilizar palabras de 16 bits, que garantizaban una reproducción con una calidad superior a la determinada en las pruebas subjetivas. Además, la ventaja de las palabras de 16 bits era que la mayoría de memorias y procesadores están orientados a trabajar con palabras que son múltiplos de 8 bits (1 byte) por lo que podía aprovecharse gran parte de la tecnología existente. Es curioso observar que algunos de los primeros reproductores de Compact Disc sólo utilizaban los 14 bits más significativos para reproducir la información registrada en el disco compacto. El problema era debido a que a mediados de la década de los ochenta el coste de los conversores D/A que podían trabajar con 16 bits era bastante elevado y de esta forma podían reducirse los costes del equipo reproductor. Asimismo, aunque no fue tan habitual, algunas de las primeras grabaciones digitales también se realizaron con 14 bits, asignando a cero los dos bits menos significativos. No obstante, actualmente es posible encontrar muchos conversores económicos que pueden trabajar hasta con 24 bits. Evidentemente, de acuerdo con el estándar, los discos compactos sólo contienen palabras código de 16 bits por lo que únicamente puede aprovecharse la gran precisión de estos conversores. 3.5 Selección del número de bits en sistemas de vídeo. El criterio para determinar el número de bits con el que debe digitalizarse la señal de vídeo también se basa en pruebas de calidad subjetiva y aceptación por parte del usuario. Consideraremos en primer lugar la digitalización de imágenes en blanco y negro y posteriormente extenderemos los conceptos a las imágenes en color. El procedimiento para determinar el número de niveles necesarios para codificar las muestras consiste en presentar distintos tipos de imágenes a espectadores que deben valorar cuál es el número mínimo de niveles a partir del que no se aprecia ninguna mejora en la calidad de las imágenes. Esta experiencia suele dar que el número de niveles de gris se sitúa entre los 45 y 60, lo que indica que se requiere alrededor de unos 6 bits para obtener una calidad muy aceptable. En la figura 20 se muestra una misma imagen representada con distintos números de niveles.

Fig. 20 Representación de una misma imagen utilizando 2, 3 y 8 bits para cuantificar la luminancia En la práctica, debido a que toda la estructura de las memorias están basadas en palabras de 8 bits, se decidió cuantificar los niveles de luminancia con 8 bits, con lo que se obtiene un total de 256 niveles posibles, que cubren perfectamente las necesidades del sistema visual. Uno de los aspectos en los que difiere la codificación de la señal de vídeo en blanco y negro respecto a la señal de audio es que la señal de luminancia sólo puede tomar valores positivos. Esto significa que todos los posibles niveles del cuantificador se dedican a codificar la parte positiva de la señal obteniendo una curva de cuantificación como la representada en la figura 21 para el caso de 3 bits. Ahora la codificación de los niveles es en binario natural (no en complemento a 2), asignando el valor nulo (000) al nivel de luminancia mínimo y el valor 111 a la luminancia máxima. Los diferentes niveles de cuantificación también se denominan niveles de gris y en el caso

Page 21: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 21 de 23

de 8 bits se asocia el nivel de gris 0 al negro y el nivel 255 al blanco. El nivel de gris 128 sería un gris neutro.

0∆ = 0000 Ymax

luminancia

código

1∆ = 0012∆ = 0103∆ = 0114∆ = 1005∆ = 1016∆ = 1107∆ = 111

0∆ = 0000 Ymax

luminancia

código

1∆ = 0012∆ = 0103∆ = 0114∆ = 1005∆ = 1016∆ = 1107∆ = 111

Fig. 21 Codificación en binario natural de los niveles de gris de una imagen.

La codificación de imágenes en color mediante componentes RGB es parecida a la de las imágenes en blanco y negro. En este caso, la imagen está representada por 3 matrices, cada una asociada a una de las componentes. Los valores de las componentes R, G y B son siempre positivos por lo que puede utilizarse una representación en binario natural como la utilizada para la luminancia. En este caso, el nivel 0 representa el negro y el nivel máximo la máxima luminancia asociada con cada componente. La figura 23 ilustra la descomposición de la imagen en estas tres matrices. En sistemas multimedia e informáticos se utilizan varias representaciones alternativas que se describirán con algún detalle más adelante al tratar las tarjetas de digitalización de vídeo. La representación más habitual es la representación de color de 24 bits que se corresponde con la cuantificación de cada una de las componentes con 8 bits (8x3 = 24). En este caso, el número total de colores que pueden representarse puede calcularse contando todas las posibles combinaciones de colores que pueden obtenerse al combinar las 3 palabras de 8 bits (2563=16.777.216).

Fig. 22 Representación de una matriz u[n,m]mediante niveles de luminancia

Fig. 22b Representación de la misma matriz u[n,m]como una superficie.

Fig. 23 Representación de imágenes en color utilizando las combinación de las tres matrices de color. La configuración de color en 32 bits, que admiten muchas tarjetas gráficas actuales es esencialmente la misma que la de 24 bits. En este modo, cada una de las componentes RGB se codifican con 8 bits y se proporciona una componente adicional de 8 bits (24+8 = 32) para codificar la transparencia de la imagen. Esta componente toma, normalmente, el valor nulo que indica que la imagen es totalmente opaca. Valores diferentes de cero indican como deben combinarse la imagen con el fondo para obtener el nivel de transparencia deseado. Así, un código igual a 128 indicará que cada elemento de imagen se representa como el promedio entre el color de la imagen y el color del fondo. Un nivel 255 indicaría que sólo aparece el fondo en la representación gráfica.

Page 22: Tema3 digitalizaci-3253-

INTRODUCCIÓN A LA INGENIERÍA – EPSC – UPC

INTRODUCCIÓN A LA INGENIERÍA - Tema 3 Digitalización de señales: Conversión analógica/digital - Pàgina 22 de 23

La configuración de color de 16 bits reduce el número de bits con el que se codifica cada componente, dedicando 6 bits para la componente de verde (la que el sistema visual presenta una mayor sensibilidad) y 5 para las de rojo y azul. El número de posibles colores representados se reduce a (64x32x32 = 65536). Este número de colores suele proporcionar representaciones de las imágenes en color bastante aceptables. La representación de imágenes con 256 colores es un tanto más compleja y se utiliza en algunos ficheros de mapas de bits y sistemas informáticos muy simples, ya sea por su antigüedad o tamaño.