Indice
Realizzazione di una camera dascolto per la riproduzione della
realt virtuale acustica
Aurore della ricerca: Daniele Brini
Scopo della ricerca:
La seguente trattazione si occupa dellottimizzazione della
qualit acustica delle sale dascolto e dei sistemi per la
registrazione e riproduzione del suono in tre dimensioni. Questi
sistemi devono avere la capacit di captare un fenomeno acustico
tridimensionale, in cui gli stimoli sonori possono provenire da
tutte le direzioni, e riprodurlo in un ambiente diverso, mantenendo
tutte le caratteristiche spaziali del fenomeno acustico
originale.
Questo significa realizzare la realt virtuale in campo
sonoro.
La realizzazione di questi sistemi stata possibile grazie a uno
studio approfondito della percezione uditiva delluomo e in
particolare dellascolto direzionale.
Lobiettivo di questa trattazione mettere in rilievo una
tecnologia chiamata Ambisonic, che per le sue solide basi teoriche
permette unespansione futura del sistema con una crescita
significativa delle prestazioni.
Lascolto delle registrazioni effettuate con questo sistema,
necessita di un ambiente con caratteristiche acustiche particolari:
la camera dascolto.
Oggetto di questo lavoro la realizzazione di una sala dascolto,
con particolare riferimento alla spazialit del campo sonoro.
Il presente lavoro stato diviso in due parti, nelle quali la
prima preliminare alla seconda e necessariamente pi teorica.
La prima parte illustra le caratteristiche della percezione
direzionale delludito ed esamina con sguardo critico i sistemi
elettroacustici di registrazione e riproduzione sonora, dai primi
esperimenti significativi fino agli sviluppi tecnologici pi
recenti.
La seconda parte descrive il trattamento acustico effettuato e
rappresenta lapplicazione pratica delle teorie esposte in
precedenza.
Avvalendosi delle pi moderne teorie acustiche, che permettono di
valutare la qualit del suono percepito in base ai risultati di una
serie di parametri, si cercato di migliorare la qualit acustica
dellambiente a nostra disposizione, indirizzando il lavoro verso la
diminuzione del tempo di riverberazione attraverso un trattamento
acustico.
La scelta di utilizzare il programma di simulazione acustica
Ramsete ha consentito di valutare le possibilit di intervento
acustico attraverso numerose simulazioni, prima di procedere con
lapplicazione dei materiali alle pareti e al soffitto.
Una volta confrontati i parametri acustici con quelli precedenti
al trattamento, sono state effettuate le prove dascolto.
La realizzazione della camera dascolto stata portata a termine
secondo le modalit previste e lintervento di fonoassorbimento stato
veramente efficace.
Il tempo di riverberazione stato abbassato fino a soddisfare e
persino migliorare i valori previsti inizialmente (0,3 0,4 sec.
intorno alla regione di frequenze di 1000 Hz), e presenta un
andamento lineare.
Sono assolutamente soddisfacenti le prove dascolto effettuate
con la riproduzione dei brani di musica classica, in cui si pu
avvertire con una grande sensazione di realismo, lampiezza del
palcoscenico e la dislocazione spaziale degli strumenti
dellorchestra.
Lascoltatore pu godere pienamente della sensazione di realismo
offerta dal sistema Ambisonic.
Indice
Prefazione ....1
Introduzione ....2
1 Il suono lo spazio e ludito direzionale .41.1 I meccanismi
delludito direzionale ....4
1.2 La differenza interaurale dei tempi .6
1.3 La differenza interaurale dampiezza 7
1.4 Le modificazioni dellorecchio esterno ...8
1.5 Capacit direzionale del singolo padiglione auricolare
...9
1.6 Altri fattori ...11
1.7 La legge del primo fronte acustico ..11
1.8 Precisione direzionale del sistema uditivo ...12
2 Modelli danalisi spaziale dei sistemi elettroacustici .142.1
Il modello binaurale .15
2.2 Il modello geometrico 16
2.3 Il modello delle armoniche sferiche .19
3 I sistemi elettroacustici binaurali ..223.1 La simulazione
binaurale e la conversione transaurale ..24
3.2 I sistemi elettroacustici ibridi 28
3.3 I limiti dei sistemi basati sul modello binaurale 32
4 I sistemi elettroacustici geometrici ...35
4.1 I sistemi elettroacustici con un canale dinformazione 36
4.2 Sistemi elettroacustici a due canali dinformazione ..37
4.2.1 La registrazione stereofonica coincidente .38
4.2.2 La registrazione stereofonica non coincidente ..40
4.2.3 La registrazione stereofonica polimicrofonica ..42
4.2.4 Apprezzamenti soggettivi delle registrazioni
stereofoniche44
4.2.5 Il trattamento del segnale stereofonico ..45
4.3 Sistemi elettroacustici a pi canali dinformazione ..47
4.3.1 Il Dolby Stereo e il Dolby Surround .50
4.3.2 La codidfica microfonica per il Dolby Surround ..54
4.3.3 I processori numerici dambiente ..56
4.3.4 La registrazione e la riproduzione tetraedrica ... 58
5 Il sistema Ambisonic ...615.1 Il microfono di tipo Soundfield
.66
5.2 Manipolazione del segnale attraverso il sistema Ambisonic
70
5.3 Manipolazione digitale dei campi sonori Ambisonic 76
5.4 Performance del sistema Ambisonic 78
5.5 Un assemblaggio esaedrico per la riproduzione
sonora tridimensionale ..80
5.6 Un sistema di registrazione tridimensionale
con microfoni ultradirezionali ...82
5.7 Compatibilit tra i sistemi di spazializzazione
sonora tridimensionale ..87
5.7.1 La conversione dellinformazione tra i sistemi .89
5.7.2 Le installazioni multi-sistema ...94
6 Caratteristiche del suono della sala da concerto ..96
6.1 Principi psicoacustici fondamentali nel realismo
della riproduzione sonora ...97
6.2 Principi psicoacustici delle sale da concerto ..98
6.3 Interaural Cross Correlation (IACC) .....101
6.4 La riverberazione ...105
6.5 IRT e EDT ......107
6.6 La percezione della profondit ...107
7 La ricostruzione dellambiente ..109
7.1 La diafonia .........109
7.2 Head-Related Transfer Function (HTRF) ..113
7.3 La percezione direzionale alle frequenze acute .116
7.4 Lo Stereo Dipole 119
7.5 Ricostruzione dellambiente attraverso la risposta allimpulso
..
122
7.6 La convoluzione .123
7.7 Il sistema di Klayman .126
7.8 Sviluppi recenti sulla creazione di riverberazione .128
8 Il sistema Ambiophonic ...130
8.1 Principi fondamentali del metodo Ambiophonic ...130
8.2 Requisiti del sistema Ambiophonic ...134
8.3 Ottimizzazione della camera dascolto per Ambiophonic
.136
9 Trattamento acustico della camera dascolto ...138
9.1 Le riflessioni della stanza ..138
9.2 Lambiente acustico: stanza e altoparlanti 139
9.3 I pannelli fonoassorbenti ...141
9.4 Muri inclinati verso lesterno
142
9.5 Il tempo di riverberazione .142
9.6 Il rumore di fondo .143
9.7 Comportamento della basse frequenze ..144
9.8 Sistemi di correzione della stanza .145
10 Misure sperimentali e
Simulazioni acustiche .148
10.1 Misurazioni sperimentali .14810.2 Modelli numerici .154
10.3 Metodologia utilizzata .155
10.4 Taratura del modello ...157
11 Realizzazione della camera dascolto .....161 11.1 Descrizione
del materiale e della stanza ......
161
11.2 Confronto delle misure effettuate prima e dopo
lintervento acustico 166
11.3 Prove dascolto 170
Conclusioni .173
Sviluppi futuri ...175
Ringraziamenti 176
Bibliografia 177
Prefazione
La seguente trattazione si occupa dellottimizzazione della
qualit acustica delle sale dascolto e dei sistemi per la
registrazione e riproduzione del suono in tre dimensioni.
In primo luogo questi sistemi devono avere la capacit di captare
e simulare un fenomeno acustico tridimensionale, dove gli stimoli
sonori possono provenire da tutte le direzioni attorno ad un
ascoltatore reale o virtuale.
In secondo luogo questi sistemi devono riprodurre in un ambiente
diverso, il fenomeno acustico originale in tutte le sue
caratteristiche spaziali.
La realizzazione di questi sistemi stata possibile grazie a uno
studio approfondito della percezione uditiva delluomo e in
particolare dellascolto direzionale. Il nostro sistema uditivo
permette di determinare con diversi gradi di precisione la
direzione e la distanza delle sorgenti sonore nello spazio
tridimensionale che ci circonda.
Sono stati stabiliti due modelli di descrizione spaziale dei
fenomeni acustici.
Il modello binaurale si basa sulla capacit e sulla modalit della
percezione uditiva umana. Il modello geometrico si basa sullo
studio, attraverso la geometria euclidea, dellutilizzo di
trasduttori nei sistemi di registrazione e riproduzione sonori
tridimensionali. Questi due modelli permetteranno un insieme di
differenti tecniche di registrazione, simulazione e riproduzione
sonora, e unanalisi oggettiva delle loro capacit riguardo alla
spazializzazione del suono. Lobiettivo illustrare quali sono i
principi teorici su cui si fonda la realizzazione e il
funzionamento delle tecnologie esistenti che quindi si adattano ai
due modelli studiati.
Il risultato di questa trattazione mettere in rilievo una
tecnologia chiamata Ambisonic, che risponde perfettamente al
modello geometrico e che per le sue solide basi teoriche, permette
unespansione futura del sistema con una crescita significativa
delle prestazioni.
Lascolto delle registrazioni effettuate con questo sistema,
necessita di un ambiente con caratteristiche acustiche particolari:
la camera dascolto.
Introduzione
Oggetto di questo lavoro la realizzazione di una camera
dascolto, con particolare riferimento alla spazialit del campo
sonoro.
Il presente lavoro stato diviso in due parti, nelle quali la
prima preliminare alla seconda e necessariamente pi teorica. La
prima parte illustra le caratteristiche della percezione
direzionale delludito e i principi teorici su cui si fonda la
realizzazione e il funzionamento delle tecnologie esistenti.
La seconda parte descrive il trattamento acustico effetttuato e
rappresenta lapplicazione pratica delle teorie esposte in
precedenza.
Avvalendosi delle pi moderne teorie acustiche, che permettono di
valutare la qualit del suono percepito in base ai risultati di una
serie di parametri, si cercato di migliorare la qualit acustica
dellambiente a nostra dispozizione, indirizzando il lavoro verso la
diminuzione del tempo di riverberazione attraverso un trattamento
acustico.
stato possibile prevedere il tipo di intervento pi idoneo,
utilizzando il computer per effettuare delle simulazioni acustiche,
prima di procedere con lapplicazione dei materiali
fonoassorbenti.
Una volta confrontati i parametri acustici con quelli precedenti
al trattamento, sono state effettuate le prove dascolto.
La camera dascolto dotata di 8 casse ed attrezzata per
utilizzare la tecnologia Ambisonic, che permette di realizzare una
fedele riproduzione della spazializzazione del campo sonoro.
Contrariamente a quello che si constatato per la percezione
visiva, che emisferica, il nostro campo di percezione uditiva molto
pi vasto: esso totalmente sferico. Sembra che gli attuali sistemi
elettroacustici non tengano in considerazione questa caratteristica
della nostra percezione uditiva e offrendo allascoltatore una
parziale riproduzione dello spazio sonoro.
I microfoni e i sistemi di altoparlanti, uniti agli ambienti in
cui essi sono inseriti, costituiscono gli elementi pi critici
dellintera catena di ripresa-riproduzione sonora.
In gran parte ci dovuto al fatto che entrambi sono dei
trasduttori, dei dispositivi, cio, aventi il compito di trasformare
una forma di energia in unaltra: da sonora in elettrica i microfoni
e viceversa gli altoparlanti. La tecnologia ha fatto molto per
minimizzare tali cause di distorsione, tuttavia, allo stato attuale
dellarte, i risultati allascolto, pur essendo giunti a livelli
credibili, non convincono ancora completamente.
In particolare, ottimizzate la timbrica, la dinamica, le
distorsioni lineari e non, il compito pi difficile rimane quello di
ricreare unimmagine sonora che, confrontata con levento reale, non
sia semplicemente unillusione del posizionamento originario degli
esecutori e degli strumenti.
Tuttavia ora possibile registrare un evento acustico nelle tre
dimensioni dello spazio cartesiano e riprodurre levento originale
con le sue tre dimensioni in un altro luogo. Questa riproduzione
cerca di soddisfare la percezione uditiva sferica dellascoltatore.
Prima necessario esaminare i vari aspetti che concernono la nostra
sensibilit uditiva dello spazio sonoro tridimensionale e i sistemi
di registrazione e riproduzione acustica in tre dimensioni.
fondamentale studiare quali sono le nostre capacit di
riconoscere la direzione di emissione della sorgente sonora, in un
universo in cui i suoni provengono da tutte le direzioni.
Esistono due modelli di descrizione sonora spaziale che
permettono di valutare e comparare tutti i sistemi elettroacustici.
Questi due modelli sono il modello binaurale e il modello
geometrico. Si dimostrer in seguito che i sistemi basati sul
modello geometrico comportano un certo numero di vantaggi rispetto
ai sistemi basati sul modello binaurale.
Esiste un sistema elettroacustico chiamato Ambisonic che
risponde il pi fedelmente possibile al modello geometrico.
Il sistema Ambisonic pi di un sistema ad architettura aperta:
permette di intravedere le possibilit di espansione e utilizzazione
futura offerte dal sistema. Con la guida dei due modelli sopra
citati verranno esaminati con sguardo critico i sistemi
elettroacustici di registrazione e riproduzione sonora, dai primi
esperimenti significativi fino agli sviluppi tecnologici pi
recenti.CAPITOLO 1
IL SUONO, LO SPAZIO E L UDITO DIREZIONALE
Luniverso attorno a noi ci presenta degli stimoli sonori che
possono provenire da tutte le direzioni. Ugualmente nello spazio
sonoro limitato e controllato di una sala da concerto, gli stimoli
sonori provenienti direttamente dalla sorgente e dalle riflessioni
delle pareti, presentano agli ascoltatori un insieme di direzioni,
ampiezze e frequenze varie, costituendo cos uno spazio veramente
tridimensionale.
La letteratura scientifica sullascolto direzionale concorda
nellaffermare che la percezione spaziale delluomo pu essere
rappresentato come un campo di percezione sferico in cui il centro
la testa. A diversi gradi di precisione noi possiamo identificare
la posizione di una sorgente sonora attorno a noi.
La capacit delludito umano di riconoscere la direzione e la
posizione di una fonte sonora, giustificano la creazione di un
sistema di riproduzione sonora tridimensionale.
1.1 I meccanismi delludito direzionale
Ludito direzionale delluomo dipende da molteplici meccanismi che
sono difficili da riassumere in un solo modello; questo perch
ludito direzionale il risultato di due o tre meccanismi principali
che contribuiscono maggiormente al processo di localizzazione
sonora. Verranno ora descritti nei dettagli questi meccanismi.
Il sistema di riferimento spaziale che sar utilizzato in questa
descrizione e illustrato dalla Figura 1.1.
Figura 1.1 Sistema di rappresentazione sferico dello spazio in
rapporto
alla testa, dove r la distanza, langolo di elevazione e
lazimut
Noi vediamo che le tre dimensioni nel posizionamento spaziale in
rapporto alla testa sono le seguenti: lasse x descrive le posizioni
dal davanti al dietro, lasse y descrive le posizioni da sinistra a
destra e lasse z descrive le posizioni dallalto al basso.
In questo sistema le direzioni dei suoni in rapporto alla testa
saranno date in coordinate polari.
1.2 La differenza interaurale dei tempi
La distanza che separa i due orecchi il fattore fisico
principalmente responsabile della differenza, nel momento della
percezione di un dato suono. Questa differenza temporale varier a
seconda dellazimut della sorgente sonora. Non ci sar differenza
temporale se la fonte situata a 0 o 180 dazimut, cio se
perfettamente davanti o dietro lascoltatore.
Se la sorgente si sposta dal piano orizzontale a partire da 0 o
180, la differenza temporale aumenter progressivamente e raggiunger
il suo massimo allazimut 90 o 270.
Per questi valori dell azimut, stabilendo una distanza tra i due
orecchi di 21,5cm e la velocit del suono di 344m/s, la massima
differenza temporale sar approssimativamente di 630 microsecondi.
Questo valore non assoluto poich la distanza tra gli orecchi varia
da un individuo allaltro e la velocit del suono cambia con la
temperatura dellaria.
La differenza interaurale dei tempi sar pi o meno importante
nella qualit della localizzazione a seconda dellinviluppo del suono
e delle armoniche che lo costituiscono. Cos per i suoni che hanno
attacchi rapidi, la differenza dei tempi potr essere direttamente
utilizzata dal cervello per la localizzazione spaziale, ma nel caso
di un suono continuo o avente un attacco lento la differenza di
fase che sar interpretata per localizzare la fonte sonora.
La qualit dellinterpretazione della differenza di fase decresce
rapidamente a partire da 180 fino a 360. Ad esempio per una
differenza di fase di 360, non si pu stabilire se si tratta di una
differenza di 0, 360 o 720, e cos per tutte le differenze superiori
a 360.
La massima differenza di fase di 180 esister solo con la pi alta
frequenza utile determinata dalla sua mezza lunghezza donda,
corrispondente alla distanza tra i due orecchi o determinata dal
suo semiperiodo che corrisponde alla differenza temporale massima
tra i due orecchi. Per le frequenze la cui mezza lunghezza donda
21,5cm o pi, e cio le frequenze al di sotto degli 800 Hz, ci sar
una differenza di fase che varia tra 0 e 180.
Queste frequenze saranno utili per determinare il posizionamento
orizzontale delle sorgenti sonore. Al di sopra degli 800 Hz ci sar
una differenza che varia tra 180 e 360 e la qualit
dellinterpretazione decresce rapidamente per diventare
assolutamente nulla per le frequenze la cui lunghezza donda uguale
o inferiore alla distanza tra gli orecchi e cio al di sopra dei
1600 Hz.
1.3 La differenza interaurale dampiezza
Per le frequenze al di sopra dei 2000 Hz la testa si presenta
gradualmente come un ostacolo acustico sempre maggiore e lassenza
di diffrazione per queste frequenze d luogo a differenze dampiezza
tra i due orecchi, che variano col variare dellazimut della
sorgente sonora. Come nella differenza interaurale dei tempi, la
differenza interaurale dampiezza nulla quando la fonte sonora
situata agli azimut 0 e 180. Nello stesso modo la differenza
interaurale dampiezza raggiunge il suo massimo quando la sorgente
situata agli azimut 90 e 270. difficile dare cifre precise su
questa differenza dampiezza, per la semplice ragione che la
distanza della sorgente diventa anchessa un fattore. Infatti la
legge del quadrato inverso spiega che lampiezza di una sorgente
sonora sferica decresce di 6dB per ogni raddoppio di distanza.
Quindi ci sar minore differenza interaurale dampiezza per una
sorgente lontana, rispetto a una vicina con lo stesso azimut.
Una differenza di circa 15-20dB dar limpressione di uno
spostamento laterale completo che corrisponde agli azimut 90 e
270.
Queste cifre rappresentano un caso estremo ottenuto in
laboratorio con dei suoni sinusoidali di alta frequenza. La
maggioranza delle ricerche sulludito direzionale sono state
compiute utilizzando suoni sinusoidali che rappresentano un caso
estremo; la maggioranza dei suoni sono onde complesse formate
dallinsieme dei suoni costituenti e raramente il riconoscimento
della direzione dovuto unicamente alla differenza interaurale dei
tempi o alla differenza interaurale dampiezza. Tuttavia anche nelle
migliori condizioni questi due meccanismi non sono sufficienti per
spiegare la nostra capacit di decretare laltezza (langolo di
elevazione) di una fonte sonora.
1.4 Le modificazioni dellorecchio esternoDopo la seconda met del
XX secolo le ricerche sulludito direzionale hanno prestato
unattenzione particolare alla funzione dellorecchio esterno nella
valutazione direzionale di un suono. Acusticamente il padiglione
funziona come un filtro lineare la cui funzione di trasferimento
dipende dalla direzione e dalla distanza della sorgente sonora. Il
padiglione decodifica le caratteristiche spaziali del campo sonoro
in caratteristiche temporali e spettrali. Per le frequenze
superiori a circa 2000 Hz ogni variazione angolare nel piano
meridiano risulta dalla modificazione della risposta in frequenza
dovuta alle creste e alle gobbe del padiglione.
Per esempio nel caso in cui il suono provenga direttamente
davanti o dietro lascoltatore (0 o 180 dazimut) con unelevazione
arbitraria, non ci sar alcuna differenza di interaurale di tempo o
dampiezza e ci sar solo lorecchio esterno a fornire informazioni
sulla posizione della fonte sonora rispetto al piano meridiano.
Per descrivere in maniera pi visuale il funzionamento del
padiglione dellorecchio, nella localizzazione sonora, immaginiamo
di dividere il piano meridiano con tante rette passanti per il
centro. Consideriamo queste rette le direzioni delle possibili
sorgenti sonore e costatiamo che gli ostacoli che ciascuna di esse
incontrer, da una parte allaltra del centro non saranno mai
simmetrici. La discriminazione angolare avviene a 360 e non si avr
mai confusione con lelevazione di una fonte sonora data e la sua
elevazione collineare corrispondente a 180. Quindi il padiglione
concorre anche nella localizzazione avanti-dietro, che una
conseguenza della discriminazione angolare dellelevazione.
Essendo un cacciatore-predatore, per l'animale ha la massima
importanza sentire la direzione dello spezzarsi di un ramoscello,
il sibilo di un serpente, il barrito di un elefante, il richiamo
degli uccelli, ecc. e probabilmente ha meno importanza sentire la
direzione di frequenze pi basse come il tuono, il sospiro del vento
o la direzione dei tamburi.
La dimensione della testa umana mostra chiaramente che luomo
maggiormente sensibile ai suoni di frequenza superiore a 700
Hz.
La complessit della struttura non-lineare dell'orecchio esterno
implica che la sua esatta funzione troppo complessa e troppo
soggettiva per essere spiegata con formule matematiche. Le creste e
le cavit dell'orecchio sono cos numerose e cos differenziate da
assicurare una grande sensibilit alle frequenze acute. Non importa
da quali frequenze acute un suono sia costituito e da che direzione
provenga, il padiglione e la testa insieme, o anche il singolo
padiglione, produrranno un modello distintivo che il cervello pu
imparare a riconoscere per localizzare un determinato suono.
L'orecchio esterno essenzialmente un convertitore meccanico che
individua le direzioni di arrivo dei suoni in base a dei modelli di
risposta in frequenza prestabiliti.
1.5 Capacit direzionale del singolo padiglione auricolare
Un esperimento molto semplice dimostra labilit del singolo
padiglione auricolare di sentire la direzione nel piano orizzontale
alle frequenze acute. Basta sistemare un metronomo direttamente di
fronte a se. Chiudere gli occhi e localizzare la sorgente del suono
usando entrambe le orecchie. Poi tenendo gli occhi chiusi, chiudere
il pi possibile unorecchio e stimare quanto si spostata la
posizione apparente del suono, nella direzione dellorecchio ancora
aperto. Molti esperti di audio si aspetterebbero che il suono
sentito solo nellorecchio destro sembri provenire dallestrema
destra, ma in questo esperimento lo spostamento raramente pi di 5
gradi, e se si ha un grande padiglione auricolare la sorgente
potrebbe non muoversi per niente.
Una variante di questo esperimento girare attorno con gli occhi
chiusi e poi vedere quanto si arriva vicino alla collocazione della
sorgente sonora.
In questo caso leffetto dellombra acustica della testa aiuta il
padiglione auricolare nel processo finch non ci si trova di fronte
alla sorgente.
Questi sono i casi in cui il singolo sistema di ricerca
direzionale del padiglione dellorecchio pi forte della differenza
interaurale dellintensit e spiega perch individui che sentono da un
solo orecchio possono ancora individuare le posizioni delle
sorgenti sonore.
Se adesso passiamo a una sorgente di musica con tutta le
frequenze, come una piccola radio, e si ripete lesperimento
descritto sopra, si sente una grande immagine che si sposta, dal
momento che lorecchio esterno e la testa sono meno importanti per
la localizzazione del suono, quando esso scende sotto i 400 Hz.
Ci sono state molte discussioni nella letteratura se labilit
umana di localizzazione per primo un fenomeno monaurale o
binaurale. Probabilmente il cervello identifica e fa stime della
posizione del suono attraverso ogni singolo input uditivo e poi
combina il risultato monaurale con i meccanismi binaurali.
Ogni sistema di riproduzione che non tiene conto della
sensibilit del padiglione auricolare alla direzione dellincidenza
della musica non produrr un suono naturale o realistico. Due
localizzazioni sentite non sono superiori a una localizzazione
sentita; entrambe devono accordarsi a tutte le frequenze per una
riproduzione realistica.
1.6 Altri fattori
Ci sono altri fattori che entrano in gioco in ci che concerne
ludito direzionale. In particolare sono importanti i movimenti
della testa che hanno la funzione di riposizionare la sorgente
sonora in un settore della percezione spaziale in cui la precisione
direzionale sar maggiore e di diminuire cos lincertezza della
localizzazione di tale sorgente.
Questi movimenti della testa sono riflessi involontari.
importante considerare anche la conduttivit della struttura ossea
del corpo, specialmente della testa e delle riflessioni sonore
causate principalmente dal torace.
Gli indici di localizzazione forniti da questi meccanismi non
sono necessariamente di buona qualit: per esempio i vestiti che noi
portiamo modificano probabilmente la capacit riflessiva del torace,
avendo cos una buona riflessione invece che lassorbimento totale di
certe frequenze alte.
Tra tutti i meccanismi delludito direzionale essi sono i pi
vulnerabili alle variabili esterne.
1.7 La legge del primo fronte acustico
Questo un fenomeno che stato osservato quando ci sono due
sorgenti sonore fisse e identiche, ma non simultanee. Se la
differenza temporale tra le due sorgenti non superiore a
37millisecondi il nostro il nostro sistema uditivo interpreter la
direzione del fenomeno acustico come quella della prima sorgente
udita.
Al di sopra del limite di 37ms, la seconda sorgente non si
fonder pi con la prima e sar chiaramente percepita come un eco.
Questo un processo di interpretazione mentale indipendente dalla
differenza interaurale dei tempi.
Ad esempio due sorgenti che si trovano in una posizione
speculare di azimut rispetto al piano frontale, creano una
differenza interaurale dei tempi identica luna rispetto
allaltra.
In questo caso entrer in causa la legge del primo fronte
acustico e la sorgente che ha la priorit temporale sar la sola ad
essere percepita nella valutazione direzionale.
1.8 Precisione direzionale del sistema uditivo
Laccuratezza della precisione direzionale del nostro sistema
uditivo dipende generalmente dalla larghezza della banda spettrale
della sorgente sonora.
Pi questa banda sar ampia e pi la direzione dellevento udito sar
corrisponder alla direzione reale della sorgente sonora.
Cos i suoni complessi che coprono diverse ottave saranno sempre
facilmente localizzabili. Questi suoni faranno appello alla
differenza interaurale dei tempi, alla differenza interaurale
dampiezza e alle modificazioni del padiglione auricolare per
consentire la localizzazione.
Questa congiunzione di meccanismi porter una ridondanza di
informazioni di localizzazione e creer un evento uditivo in cui la
corrispondenza spaziale rispetto alla sorgente originale sar assai
elevata.
Al contrario, nel caso dei suoni puri, come le onde sinusoidali
senza attacco preciso, sar utilizzato un solo meccanismo di
localizzazione.
Lassenza di ridondanza nelle informazioni di localizzazione
contribuisce ad aumentare limprecisione nella spazializzazione
dellevento udito.
La zona critica di frequenze dove limprecisione maggiore,
attorno ai 2000 Hz. Poich la differenza interaurale di fase
diminuisce gradualmente di efficacia a partire da 800 Hz e poich la
differenza interaurale dampiezza non veramente funzionale sopra i
2000 Hz, c una mancanza di sovrapposizione di zone coperte
efficacemente da questi meccanismi di localizzazione. La nostra
mancanza di discriminazione direzionale attorno ai 2000 Hz, spiega
in parte la nostra maggiore sensibilit allampiezza acustica che si
trova proprio in questo settore di frequenze.
Questo confermato dalle curve isofone adottate dallInternational
Organization for Standardization (ISO) nel 1987.
CAPITOLO 2
MODELLI DANALISI SPAZIALE
DEI SISTEMI ELETTROACUSTICI
Noi abbiamo la capacit di registrare e riprodurre i suoni da
circa un centinaio danni. Durante questo periodo, una moltitudine
di tipi di supporto sono stati utilizzati per la trasmissione e la
conservazione dellinformazione sonora, i cambiamenti di tecnologia
erano generalmente giustificati per laumento della fedelt nel
sistema. Riguardo alla fedelt spettrale e dinamica, abbiamo
raggiunto un altissimo livello di realismo.
La fedelt spaziale s progredita, ma coloro che si occupano del
settore e il grande pubblico non hanno i mezzi per apprezzare,
comparare e descrivere le capacit di spazializzazione dei
differenti sistemi.
Si distinguono due filosofie di concepimento dei sistemi
elettroacustici riguardo alla loro capacit di spazializzazione
sonora. Tutti i sistemi che utilizzano dei trasduttori di ricezione
e di riproduzione nascono da una o dallaltra di queste due
filosofie. Quando si tratta di registrazione e riproduzione
tridimensionale, esse non sono realmente in contrasto poich
procedono dalla stessa constatazione di partenza: la stereofonia
attuale non soddisfacente per ci che concerne la spazializzazione e
il posizionamento tridimensionale dei suoni.
Il primo approccio considera il sistema uditivo umano come
lultimo anello della catena elettroacustica. La conseguenza
principale di questa presa di posizione che non si pu concepire
altro che un sistema elettroacustico che pu utilizzare solo due
canali dinformazione, sostenendo che in una condizione normale
dascolto il cervello ottiene una quantit e una qualit sufficienti
di informazioni, per il posizionamento spaziale dei suoni, con un
massimo di due canali.
La seconda filosofia, che, in certi casi, deriva dallesperienza
pratica, pi che da una vera riflessione scientifica, considera come
punto finale della catena elettroacustica, la sala, lo spazio
acustico in cui ha luogo levento sonoro. Questo approccio, che
resta per il momento il pi sfruttato, non ha tuttavia stimolato la
pratica scientifica necessaria.
Da queste due filosofie derivano due modelli di registrazione e
riproduzione sonora. Questi due modelli serviranno allanalisi
comparativa delle differenti teorie dei differenti sistemi. Il
primo modello, basato sulla filosofia del sistema uditivo come
punto finale della catena, sar chiamato modello binaurale.
Il secondo modello, basato sulla filosofia dello spazio di
riproduzione come punto finale della catena, sar chiamato modello
geometrico.
Un sistema unidimensionale potr captare e riprodurre i suoni su
un asse dato. Un sistema bidimensionale potr captare e riprodurre i
suoni su piano dato e un sistema tridimensionale potr captare e
riprodurre i suoni in uno spazio o in un volume dato.2.1 Il modello
binaurale
Sviluppato dalle ricerche sulludito direzionale, il modello
binaurale di registrazione e riproduzione sonora cerca di ottenere
una replica dei fattori fisici pi significativi che sono
responsabili delludito direzionale umano. Due trasduttori disposti
ai lati di un separatore chiamato generalmente baffle, di volume
considerevole (simula lostacolo rappresentato dalla testa) e dei
filtri acustici, fisicamente asimmetrici, adiacenti ai trasduttori
(come i padiglioni auricolari) formano la struttura portante di
questo modello.
necessario utilizzare, per la riproduzione meccanica o
elettronica del modello, due canali dinformazione che producano dei
segnali analogici che stimolino i nostri timpani. Se il modello
rispettato, questi canali producono delle differenze fra loro di
tempo e dampiezza, per la codifica delle differenze direzionali
verticali.
Poich il timpano un trasduttore che risponde ai cambiamenti
assoluti di pressione, i trasduttori di un microfono binaurale
devono essere dello stesso tipo per seguire fedelmente il modello.
Dallaltra parte della catena, i trasduttori di riproduzione devono
portare direttamente ai due canali uditivi linformazione
decodificata, in modo che sia convertita dal nostro sistema uditivo
interno e codificata in maniera appropriata dal cervello.
2.2 Il modello geometrico
Il modello geometrico ha una genesi un po meno definita del
modello binaurale e solo tardivamente, verso la fine degli anni
settanta, stato esposto chiaramente.
Nel modello geometrico, i trasduttori audio, microfoni e
altoparlanti, sono considerati come punti di ricezione e di
emissione nello spazio.
Questa riduzione dei trasduttori a dei punti una convenzione
generalmente accettata e fa evidentemente riferimento alle
caratteristiche fisiche e elettriche dei microfoni e degli
altoparlanti, oltre che alle caratteristiche di ricezione e di
emissione sonora.
Questi trasduttori sono quindi considerati come punti nello
spazio tridimensionale e interpretati secondo le leggi della
geometria euclidea.
Un punto nello spazio definito dalla sua posizione; cos un
microfono nella registrazione e un altoparlante nella riproduzione
sono definiti dalla loro posizione nello spazio. Due punti
definiscono una retta; due microfoni e due diffusori definiscono
una dimensione dello spazio. Tre punti non allineati possono
definire un piano; tre microfoni e tre altoparlanti non allineati
possono definire due dimensioni dello spazio. Infine quattro punti
che non si trovano sullo stesso piano possono definire un volume e
ugualmente quattro microfoni e quattro diffusori situati non sullo
stesso piano, possono definire le tre dimensioni dello spazio.
Nella geometria analitica quattro punti equidistanti che non si
trovano sullo stesso piano, formano il tetraedro, il pi semplice
poliedro regolare inscrivibile nella sfera, come si vede nella
Figura 2.1.
Figura 2.1Riassumendo, il numero e la posizione dei trasduttori
gli uni rispetto agli altri, alla registrazione e alla
riproduzione, avr una conseguenza diretta sulle possibilit di
codifica e decodifica delle caratteristiche spaziali del fenomeno
acustico originale.
Il modello geometrico nato dagli esperimenti compiuti
indipendentemente in Francia, in Inghilterra e negli Stati Uniti
dopo gli anni cinquanta.
Nel 1952, Pierre Scheaffer si dedic a una serie di esperimenti
per la riproduzione tridimensionale della musica elettroacustica,
proponendo di disporre i diffusori in modo che formassero un
tetraedro. Alla fine degli anni sessanta si fecero esperimenti,
soprattutto in Inghilterra, sulla registrazione basata sul
tetraedro.
Il modello geometrico fu proposto negli Stati Uniti da Peter
Scheiber, ma illustrato solo in modo teorico, spiegando la codifica
bidimensionale a tre canali e la codifica tridimensionale a quattro
canali.
In Inghilterra, il matematico Michael Gerzon speriment
lintegrazione della registrazione bidimensionale e tridimensionale
nello stesso modello geometrico. Fece test sulla registrazione e
riproduzione bidimensionale a tre trasduttori e quella
tridimensionale a quattro trasduttori.
Gerzon afferm in seguito, che le conclusioni alle quali giunse
erano basate sulle ricerche del matematico inglese Stokes nel 1952
e del matematico francese Poincar nel 1892.
Le caratteristiche direzionali dei trasduttori nel modello
geometrico, possono essere omnidirezionali, unidirezionali o
bidirezionali. Nella riproduzione, i diffusori unidirezionali o
bidirezionali, devono essere avere il campo di emissione con
polarit positiva, diretto verso il centro di massa della figura
geometrica che essi delineano.
Lo spazio di riproduzione deve essere il meno riverberante
possibile, fino a essere idealmente anecoico. Infatti in uno spazio
riverberante, le diverse riflessioni sulle pareti pregiudicano la
qualit della riproduzione direzionale. In una camera anecoica o con
poca riverberazione, gli altoparlanti unidirezionali sono
preferibili.
Per la registrazione, lutilizzo di microfoni omnidirezionali
esige una certa distanza o lutilizzo di un baffle tra i microfoni.
La distanza o il baffle creer le differenze tra i canali, dampiezza
e di tempo, necessari per la codifica direzionale. Se si utilizzano
dei microfoni unidirezionali, bisogna calcolare lorientamento verso
lesterno della figura geometrica disegnata dalla disposizione dei
trasduttori, le rette definite dal centro di massa e i vertici
della figura. Inoltre necessaria la coincidenza spaziale dei
microfoni, cio la pi grande vicinanza possibile tra loro. Una
registrazione che utilizza dei microfoni unidirezionali descrive lo
spazio attraverso la variazione assoluta di pressione e attraverso
i gradienti di pressione; i microfoni cardioidi sono un misto tra
gli omnidirezionali e i bidirezionali. Se una registrazione
utilizza solamente dei microfoni bidirezionali coincidenti, la
descrizione dello spazio sar incompleta perch includer solo dei
gradienti di pressione.
Per essere bidimensionale o tridimensionale, una registrazione
con microfoni bidirezionali dovr includere anche la variazione
assoluta di pressione. Questo sar assicurato dalla presenza di un
microfono omnidirezionale coincidente ai microfoni bidirezionali.
Inoltre i microfoni bidirezionali devono essere idealmente disposti
in modo da fare una registrazione ortogonale dello spazio acustico.
Un ultimo caso, un po particolare e complesso, di microfoni
bidirezionali, che introduce un altro modello, che si pu
considerare una variante del modello geometrico: il modello delle
armoniche sferiche.
2.3 Il modello delle armoniche sferiche
Finora abbiamo parlato della direzionalit dei trasduttori in
termini generali, classificandoli come omnidirezionali,
unidirezionali, o bidirezionali.
Se storicamente queste caratteristiche sono state ottenute in
maniera empirica, esiste tuttavia, un modello matematico che
permette di spiegare e immaginare caratteristiche direzionali
ancora pi complesse. Per comprendere meglio fermiamoci a riflettere
su unanalogia. Si pu scomporre lo spettro in frequenza di un
fenomeno sonoro complesso, nelle componenti di frequenza
(armoniche) che lo costituiscono.
I suoni complessi sono formati da un insieme di armoniche,
legate tra loro da una relazione matematica. Allo stesso modo, la
direzionalit nello spazio di tutti i fenomeni demissione e
ricezione sonora pu essere scomposta nelle sue componenti primarie,
chiamate armoniche sferiche.
Il modello delle armoniche sferiche si applica si applica a un
insieme di fenomeni fisici elettromagnetici, elettrodinamici,
atomici e acustici. Osserviamo i primi tre ordini di armoniche
sferiche semplici, come mostrato in Figura 2.2.
Il microfono che corrisponde allarmonica di ordine zero
conosciuto con il nome di omnidirezionale e il microfono che
corrisponde allarmonica di primo ordine chiamato bidirezionale o
figura otto. Le due sfere dellarmonica sferica di primo ordine,
avranno una polarit differente.
La polarit dei lobi alterner sempre da un lobo allaltro: un lobo
positivo sar sempre seguito da un lobo negativo, che a sua volta
sar seguito da un lobo positivo e cos via.
Figura 2.2
Nellarmonica di secondo ordine, i lobi che puntano a 0 e 180
saranno positivi, mentre il lobo che si trova sullasse 90-270 sar
negativo.
La funzione matematica che descrive larmonica di ordine zero
e
lEq. (1), la funzione dellarmonica sferica di primo ordine lEq.
(2) e la funzione dellarmonica sferica di secondo ordine lEq.
(3).
(1) Y0 (q) = 1
(2) Y1 (q) = cos
(3) Y2 (q) = cosq2 1
Le armoniche sferiche semplici possono combinarsi linearmente
per creare quelle che chiameremo armoniche sferiche complesse. Si
possono combinare per semplice addizione i segnali dei microfoni
alle propriet sferiche semplici e ottenere dei microfoni virtuali
alle propriet sferiche complesse.
Per ottenere risultati che implicano una previsione matematica
semplice, bisogna assicurare la coincidenza spaziale dei microfoni
di base e lallineamento delle loro assi di rotazione, cio lasse
perpendicolare al diaframma passante per il centro. Si deve
assicurare la coincidenza spaziale su due assi, X e Y per esempio,
in modo da garantire lintegrit della risposta direzionale del
microfono virtuale nel piano determinato dai due assi.
Il microfono virtuale avr, sempre nel piano dove c la
coincidenza, le qualit di risposta in frequenza dei microfoni che
lo costituiscono.
Per esempio combinando in un rapporto 1:1 il segnale di un
microfono di ordine zero coincidente a un microfono di primo ordine
semplice, in modo che i loro guadagni rispettivi siano identici per
lazimut 0, si ottiene un microfono di primo ordine complesso. Il
guadagno uguale e con la stessa polarit di ogni microfono a 0 avr
ampiezza doppia per questo valore dellazimut a causa della
combinazione dei rispettivi segnali. Cos il guadagno uguale, ma con
polarit opposta a 180, creer lannullamento completo per questo
valore dellazimut a causa della combinazione dei segnali. Allo
stesso modo per tutti i valori dellazimut, il segnale risultante
dovuto alla combinazione dei segnali dei rispettivi microfoni. Il
microfono virtuale cos ottenuto viene chiamato unidirezionale o
cardioide.
Affinch il modello geometrico sia valido, la codifica della
direzionalit acustica deve sempre includere un ordine dato di
armoniche sferiche e tutti gli ordini che gli sono inferiori.
Quindi se si riprende lo spazio con dei microfoni bidirezionali, si
tratta di una registrazione di primo ordine; si deve allora
includere lordine zero, cio lomnidirezionale. per questa ragione
che una registrazione con dei cardioidi di primo ordine completa
poich questi microfoni sono una combinazione lineare dellarmonica
di ordine zero e di primo ordine.
CAPITOLO 3
I SISTEMI ELETTROACUSTICI BINAURALI
La distinzione tra un sistema stereofonico convenzionale e un
sistema binaurale non evidente e si fa spesso confusione tra i due,
quando non c una totale ignoranza riguardo al secondo
procedimento.
In un sistema che segue il modello binaurale, dobbligo lutilizzo
di due canali poich si tratta di un processo di simulazione del
sistema uditivo umano. La produzione di un segnale audio binaurale
si effettua con la registrazione attraverso la testa di un
manichino.
I tratti generali del manichino possono essere una grossolana
approssimazione, ma le orecchie devono essere una replica esatta
del padiglione auricolare per poter ottenere dei risultati
soddisfacenti.
I microfoni sono posizionati generalmente allinizio del canale
uditivo. Poich le modificazioni dellorecchio esterno saranno gi
incluse nel segnale audio registrato dal procedimento binaurale,
necessario lutilizzo di un casco dascolto. Infatti il segnale audio
sar modificato una seconda volta dal padiglione auricolare, se la
registrazione binaurale viene ascoltata tramite degli
altoparlanti.
Figura 3.1
Il microfono binaurale Neumann KU 100 e il microfono binaurale
Bruel & Kjaer 4128
Le prestazioni di questo sistema possono essere stupefacenti, ma
queste dipendono molto dallintegrit spettrale di tutta la catena di
registrazione e riproduzione. Poich il padiglione dellorecchio
apporta delle modificazioni spettrali che vengono utilizzate dal
cervello per riconoscere la posizione della fonte sonora, il
filtraggio non desiderato produce delle aberrazioni spaziali.
Inoltre lutilizzo di un casco dascolto costituisce un problema
nella riproduzione delle frequenze basse.
La piccola superficie dei diaframmi e la loro zona descursione
piuttosto limitata costituiscono le ragioni principali nella
mancanza dampiezza di queste frequenze.
Un altro inconveniente lassenza di trasmissioni meccaniche del
suono sulle altre parti del corpo: lo schiocco di certi inviluppi
di suoni dagli attacchi molto rapidi, come certi strumenti a
percussione, che vengono percepiti in maniera quasi tattile, e la
trasmissione delle basse frequenze attraverso la struttura interna
del corpo.
3.1 La simulazione binaurale e la conversione transaurale
Nelle migliori dimostrazioni, sembra che ci sia un certo
consenso sulla qualit dellillusione tridimensionale ottenuta con
una buon registratore binaurale, a patto che si utilizzi un casco
dascolto. Questo successo ottenuto, ma le sue frustranti
limitazioni, pongono due quesiti fondamentali sui sistemi
binaurali: possibile codificare dei segnali sonori monofonici, che
provengono da un nastro multitraccia o da una presa polimicrofonica
ad esempio, per conferire loro un carattere binaurale?
possibile codificare un segnale binaurale per rendere
compatibile il suo ascolto attraverso degli altoparlanti?
Le ricerche su questi due aspetti hanno avuto uno sviluppo
indipendente e apparentemente senza fini commerciali. Alcune
imprese hanno comunque nutrito un certo interesse nellunire questi
due aspetti della ricerca sulla registrazione binaurale, per
sviluppare dei prodotti che rispondano alle esigenze dellindustria
della musica. Il missaggio stereofonico di nastri multitraccia
esiste gi da un certo periodo di tempo e diventa spontaneo
chiedersi se il missaggio di questi nastri si possa fare con
tecniche binaurali. La conoscenza delle caratteristiche della
percezione direzionale delludito umano e lo sviluppo tecnologico
dei calcolatori lasciano intravedere la possibilit che si
costruiscano apparecchi che apportano su suoni monofonici, un certo
numero di modificazioni parametriche che simulano la registrazione
binaurale. La documentazione pubblicata dalle compagnie di ricerca
rimane per il momento piuttosto scarsa. Un gruppo di ricerca delle
NASA in California ha studiato il procedimento dividendo il campo
sferico di ricezione in 144 posizioni. Il metodo di misurazione
delle posizioni di riferimento molto semplice, ma molto noioso e
ripetitivo.
Si diffondono in condizioni anecoiche degli impulsi di rumore
rosa nelle posizioni predeterminate. Questi impulsi saranno captati
da un sistema di microfoni binaurali basati su un modello
statistico medio di misurazione delle orecchie, della testa e del
tronco.
Per ogni posizione, si misura la differenza interaurale dei
tempi e dampiezza e si confronta la modificazione spettrale
assoluta di ogni orecchio.
Queste misure sono immagazzinate in un calcolatore che, a
seconda delle capacit e dellinterfaccia usata, applicher le
modificazioni binaurali ai suoni monofonici. Idealmente queste
modificazioni dovrebbero essere compiute in tempo reale, e
permettere delle modificazioni dinamiche nella localizzazione dei
suoni, cio la dislocazione dei suoni. La dislocazione, permettendo
allascoltatore di confrontare le posizioni in tempo reale, rinforza
la certezza di impressione della spazializzazione. Se si desidera
simulare un suono dato, senza dislocazione del suono, non pi
possibile avere il confronto delle caratteristiche che indicano la
posizione del suono. Risulta un aumento del flusso di
localizzazione e cio una direzione completamente errata. La
condizione implicita dei sistemi binaurali che lintera catena di
trasmissione dellinformazione sia neutra quanto allintegrit della
risposta in frequenza dei diversi suoni. Il problema che non si pu
garantire questa neutralit e che certe modificazioni spettrali,
volute o no, possono causare un posizionamento spaziale non
desiderato.
Un modo di risolvere questo problema sarebbe quello di prendere
come punto di partenza le misure individuali del posizionamento
spaziale. Il gruppo di ricerca della NASA ha utilizzato un
simulatore binaurale, ma per ogni soggetto che lha testato, sono
state prese delle misure binaurali individuali.
Solo cos il sistema efficace e attualmente non possibile la sua
commercializzazione, ma questa squadra di ricercatori spera
tuttavia di riuscire a sviluppare un modello statistico medio
soddisfacente.
Per quel che concerne la questione di adattare una registrazione
binaurale allascolto su degli altoparlanti, bisogna innanzitutto
ricordare che la caratteristica fondamentale del segnale binaurale
la funzione di trasferimento da un sistema uditivo esterno (le
orecchie, la testa e il torace). La conseguenza evidente che questo
segnale non pu subire unaltra modificazione da parte dellorecchio
esterno e questo spiega incompatibilit con lascolto attraverso dei
diffusori.
Inoltre, poich il segnale binaurale deve stimolare direttamente
i timpani, esso non pu tollerare alcuna forma di diafonia: quando
un segnale binaurale ascoltato attraverso degli altoparlanti, una
parte dellinformazione destinata esclusivamente allorecchio
sinistro verr udita anche da quello destro e viceversa. Si ha
quindi, diafonia acustica tra i canali.
I problemi principali, che rendono incompatibile lascolto del
segnale binaurale con gli altoparlanti, sono due: la
reinterpretazione da un sistema binaurale di un segnale che ha gi
stato modificato da questa funzione di trasferimento e la diafonia
acustica.
Per risolvere questi problemi necessaria una trasformazione del
segnale in modo da renderlo compatibile con lascolto mediante dei
diffusori.
Questo processo di trasformazione del segnale binaurale chiamato
conversione transaurale.
La soluzione al problema della reinterpretazione del segnale
relativamente semplice da realizzare. Lascolto mediante diffusori
sempre realizzato pressappoco nella stessa maniera: gli
altoparlanti sono angolati di circa 30 da ogni lato rispetto
allasse dascolto, sono idealmente alzate a un metro dal suolo e
sono posizionate di fronte allascoltatore.
Il suono che proviene dai diffusori interpretato dal sistema
binaurale come due sorgenti discrete a posizione fissa. Misurando
le modificazioni binaurali per le posizioni abituali degli
altoparlanti in ascolto stereofonico, si pu calcolare una funzione
di trasferimento binaurale media per questo tipo dascolto
stereofonico mediante diffusori. Si pu allora applicare linverso di
questa funzione al segnale binaurale, prima che esca dagli
altoparlanti.
La funzione di trasferimento inverso e quella di trasferimento
dellascoltatore si annullano e il suono recupera la sua neutralit
frequenziale.
David Griesinger della compagnia Lexicon, suggerisce di
utilizzare una funzione di trasferimento media molto pi globale e
parla di rendere lineare la risposta in frequenza media per
lemisfero frontale.
I risultati degli esperimenti compiuti da Lexicon sono stati
utilizzati nella costruzione di certi modelli di processori audio
di calcolo numerico prodotti da questa compagnia.
La soluzione al problema della diafonia acustica, teoricamente
non pi complessa, ma necessita di una elaborazione dellinformazione
in tempo reale molto pi importante. Come sappiamo, il segnale
destinato esclusivamente a un orecchio in particolare udito anche
dallorecchio opposto, ma con un certo ritardo e una certa
diminuzione dampiezza. Se si diffonde nellaltoparlante
corrispondente allorecchio opposto un segnale identico a quello
della diafonia, cio con lo stesso ritardo e diminuzione dampiezza,
ma con polarit inversa, questo nuovo segnale dovrebbe eliminare la
diafonia. Evidentemente il segnale dannullamento sar udito anche
dallorecchio opposto a quello a cui il segnale era destinato; noi
abbiamo cos un nuovo problema di diafonia e un nuovo segnale
dannullamento deve essere generato per eliminare il primo segnale
dannullamento. Questo processo deve essere ripetuto il numero di
volte necessario e in maniera continua in tempo reale sui canali
sinistro e destro per funzionare adeguatamente. La mole del
processo di elaborazione del segnale enorme.
Problematica la posizione dascolto: alle frequenze alte una
dislocazione di qualche centimetro rovina leffetto, poich la
simmetria del rapporto tra i diffusori e lascoltatore non pi
assicurata. Le frequenze basse sono molto meno sensibili alla
posizione dascolto: la loro grande lunghezza donda assicura una
certa tolleranza. Esperimenti compiuti negli Stati Uniti e in
Europa, dimostrano che pi la sala dascolto riverberante e pi grande
la quantit di elaborazione necessaria. In condizioni dascolto
anecoico, in cui si pu ridurre la mole di trattamento, sono stati
ottenuti risultati eccellenti duranti gli anni ottanta.
La simulazione binaurale e la conversione transaurale, si
articolano attorno a due punti: trovare un modello statistico medio
soddisfacente della funzione di trasferimento del sistema uditivo
umano e aumentare la quantit di elaborazione informatica, per
permettere una migliore definizione del campo uditivo e
uneliminazione della diafonia pi efficace.
Da qualche anno c una crescente comparsa di sistemi di
simulazione binaurale: il CAP-340M dellAKG, il Qsound della Qsound
Corporation, il Roland Sound Space (RSS) e i differenti apparecchi
di Spatializer Audio Laboratories, per nominarne alcuni. La Roland
afferma che i meccanismi di funzionamento dellRSS sono basati sui
risultati della ricerca psicoacustica in ci che concerne ludito
direzionale. E interessante constatare che lapparecchio diviso in
due blocchi: il simulatore binaurale e il convertitore transaurale.
La revisione di uno solo dei due settori sar sempre possibile e
migliorer senza alcun dubbio la performance globale del
sistema.
3.2 I sistemi elettroacustici ibridi
Da qualche anno, sono nati nuovi strumenti di registrazione e la
loro classificazione diventa difficile. In effetti i loro principi
di funzionamento e la metodologia di elaborazione del segnale fanno
riferimento sia al modello binaurale che al modello geometrico.
Appartengono a questa categoria di sistemi di registrazione ibridi
il Stereo Ambient Sampling System (SASS) della compagnia americana
Crown e la Sfera della compagnia tedesca Schoeps, come mostrato in
Figura 3.2.
Figura 3.2 Il SASS della Crown e la Sfera della Schoeps
Questi sistemi utilizzano un baffle di forma complessa e di
volume considerevole, per simulare certe caratteristiche della
testa umana.
La presenza di questo baffle risponde alla prima esigenza del
modello binaurale. Nello stesso tempo lassenza di filtri acustici
adiacenti ai trasduttori, che simulano il padiglione dellorecchio,
si rif al modello geometrico.
La sfera stata sviluppata in seguito allelaborazione del modello
teorico di Gunther Theile che afferma che si deve inserire in una
registrazione stereofonica delle modificazioni di segnale
corrispondenti a quelle apportate dal sistema uditivo umano, in
particolare a quelle conseguenti agli effetti acustici della testa.
La sfera costituita da un baffle sferico di 200 mm di diametro, sul
quale sono montati ai due antipodi due capsule omnidirezionali. Si
ottiene dunque una codifica quasi binaurale; evitando
volontariamente le modificazioni spettrali e temporali del
padiglione dellorecchio, il segnale stereofonico prodotto dalla
Sfera, non ha i problemi di compatibilit delle registrazioni
binaurali con lascolto con gli altoparlanti. Il baffle attenua
sufficientemente le frequenze acute degli stimoli sonori opposti
(captati direttamente da una delle due capsule e per diffrazione
dallaltra) affinch il problema del filtraggio a pettine (comb
filtering) delle onde in opposizione di fase venga attenuato. Tutte
le altre particolarit importanti di codifica direzionale prodotte
dalla testa sono ugualmente prodotte dalla Sfera.
Le caratteristiche fisiche della Sfera la rendono conforme al
modello Spectral Stereo di Cooper, che un modello dascolto basato
su un baffle sferico.
Non si pu pretendere di produrre un informazione spaziale
completa con la Sfera; la sua ricezione completa negli assi X
(avanti/dietro) e Z (alto/basso).
La ricezione della Sfera, essendo discriminante solo sullasse Y
(sinistra/destra), unidimensionale. Poich questa codifica
direzionale sullasse Y avviene rispettando il modello
dassociazione, si pretende che produca un segnale stereofonico pi
soddisfacente riguardo allimpressione spaziale, senza perdere gli
attributi di sensibilit con i suoni coincidenti. Osserviamo che la
Sfera ha un antenato francese, il registratore che lingegner
Charlin ha sviluppato alla fine degli anni cinquanta. Questa palla
ricoperta da una fasciatura aveva anchessa due microfoni
omnidirezionali posizionati in maniera identica alla Sfera. La
compatibilit mono/stereo determin il successo di questo sistema che
non rendeva obsoleti i giradischi monofonici. Pi recentemente, con
le ricerche di Theile, il registratore con un baffle sferico ha
trovato le sue giustificazioni teoriche e unincarnazione
commerciale pi valida.
Le qualit di registrazione della Sfera si trovano anche nel
SASS. Sviluppato includendo certi meccanismi binaurali per
contrastare i difetti di presa di posizione dei suoni stereofonici
coincidenti, ma con la cura della compatibilit del suono monofonico
e dascolto con i diffusori, il SASS un vero sistema di
registrazione ibrido.
I suoi inventori hanno ricordato che il SASS risponde
perfettamente alle esigenze dei modelli di Cooper e Theile. Il modo
in cui il SASS risponde a queste esigenze leggermente diverso da
quello della Sfera. La differenza maggiore nelle caratteristiche
del baffle: di forma pi complesssa, lanalisi visuale della
simmetria delle traiettorie delle rette collineari sul baffle, ci
fa notare che il SASS permette una codifica direzionale sia
sullasse Y (sinistra/destra) che sullasse X (avanti/dietro).
Lefficacia della codifica sullasse Y sperimentata, ma non si pu
sapere a priori se la codifica sullasse X sar di una qualit
soddisfacente con lascolto con gli altoparlanti o almeno con il
casco dascolto.
Malgrado la differente costruzione, la Sfera e il SASS
utilizzano gli stessi meccanismi per la codifica sullasse Y. I due
sistemi utilizzano delle capsule omnidirezionali; a basse frequenze
il baffle non efficace e la diffrazione avr pertanto una pressione
acustica quasi uguale sui due diaframmi, qualunque sia la direzione
del suono.
invece la distanza tra le due capsule e la differenza di fase
che sar cos introdotta che permette di codificare la direzione a
basse frequenze. Al di l di una certa zona di frequenze, circa 1000
Hz, a causa della presenza del baffle, la direzionalit delle
capsule aumenta e la differenza dampiezza tra i canali assicura la
codifica direzionale.
Nelle frequenze acute la grandezza del baffle abbastanza
importante per prevenire il filtraggio a pettine nella somma
monofonica. Lassenza totale di discriminazione sullasse Z assicura
un ascolto compatibile con i diffusori.
Parliamo infine di un altro sistema, non commercializzato, che
pu essere aggiunto a questa categoria di registratori stereofonici
ibridi. Si tratta del Matrixed Pressure Triplet (MPT) del belga
Andr Defossez. Tre capsule omnidirezionali sono disposte in maniera
equidistante sulla superficie curva di un baffle cilindrico, avendo
cos una differenza di 120 tra loro. La capsula A diretta a 0, la
capsula B a 120 a sinistra e la capsula C 120 a destra.
I segnali per i diffusori sono prodotti da un decodificatore
matrix, cio attraverso un missaggio prestabilito di canali discreti
di una console. La capsula A alimenta congiuntamente i canali
sinistro e destro, la capsula B alimenta il canale sinistro e, con
un attenuazione di 18dB e con inversione di polarit, il canale
destro. Avviene la stessa cosa con la capsula C che alimenta
direttamente il canale destro e, con lattenuazione di 18dB e
inversione di polarit, quello sinistro.
Linventore dellMPT piazza la sua invenzione in un settore ancora
inesplorato: la registrazione stereo non coincidente con un
decodificatore matrix. Se questa tecnica pu sembrare a prima vista
temeraria, bisogna ricordare che il baffle assicura unattenuazione
sufficiente delle frequenze acute e controlla il filtraggio a
pettine.
LMPT risponde sicuramente a un certo numero di criteri del
modello di associazione di Theile, ma ragionevole credere che il
rispetto del modello sarebbe sicuramente pi completo se il baffle
fosse di forma sferica piuttosto che cilindrica. Il cilindro
rappresenta un ostacolo acustico differente dalla sfera o dalla
testa e pu portare delle modificazioni spettrali che possono essere
falsate al momento della riproduzione. Linformazione spaziale
codificata su due assi, X e Y, e lMPT potrebbe essere considerato
come un registratore bidimensionale.
3.3 I limiti dei sistemi basati sul modello binaurale
Per aspirare alla commercializzazione, i sistemi basati sul
modello binaurale fanno fronte ad importanti insidie tecnologiche.
Delle ricerche recenti hanno sviluppato dei modelli teorici di
riproduzione binaurale con pi di due altoparlanti e per pi di un
ascoltatore, ma non sono ancora stati pubblicati risultati
sperimentali.
Per il momento non si pu fare altro che estrapolare
sullapplicazione della transauralit per pi ascoltatori. Altro
problema che la riproduzione binaurale pu essere interpretata solo
da una posizione fissa. Questo accade anche con il casco dascolto:
se lascoltatore gira la testa, tutto il campo sonoro segue il
movimento.
In una situazione acustica reale, quando si gira la testa, i
suoni cambiano posizione nel nostro campo di percezione.
Solo il sistema della NASA permette lo spostamento
dellascoltatore allinterno dello spazio in cui ha luogo levento
sonoro.
La registrazione originale multitraccia e ad ogni elemento
sonoro che costituisce levento, viene assegnata una posizione
assoluta nello spazio in cui ha luogo lesperienza e una relativa
alla posizione dellascoltatore.
Questultimo, con il suo casco dascolto, pu posizionarsi nello
spazio sonoro virtuale mentre il calcolatore aggiusta il segnale a
seconda dei suoi spostamenti. Questa filosofia di riproduzione
binaurale molto simile al concetto di realt virtuale nel mondo
informatico.
Non si possono che ammirare i numerosi sforzi per migliorare la
tecnologia, ma bisogna interrogarsi davanti alla possibilit di
sfruttamento commerciale di un tale sistema.
I metodi che esige la registrazione si adattano abbastanza bene
se ci si occupa di musica pop, ma non corrispondono a pratiche
usuali nella musica classica o in manifestazioni musicali
acustiche. Inoltre la registrazione multitraccia non pu essere
mixata: ogni elemento sonoro deve rimanere discreto perch gli si
possa applicare il trattamento binaurale adeguato per lascolto.
Si parla di un formato per consumatori da almeno venti piste.
pur vero che con i continui e rapidi sviluppi tecnologici difficile
prevedere il futuro, ma un formato di questo tipo non pu essere
preso in considerazione se non tra una decina danni.
Il problema principale di tutti i sistemi basati sul modello
binaurale che essi devono tendere verso la formulazione di un
archetipo delludito direzionale.
Questo archetipo, definendo le caratteristiche standard fisiche
della testa e delle orecchie, nega le caratteristiche fisiche
individuali dellascoltatore.
Al di l delle variazioni che si constatano nelle particolarit
della testa, le variazioni nelle particolarit del padiglione
auricolare sono ancora pi grandi da un individuo a un altro. lecito
credere, in base agli studi sulludito direzionale, che lascolto con
le orecchie di unaltra persona avrebbe un effetto devastante sulla
qualit della percezione spaziale. Il modello binaurale studiato per
un ascoltatore adulto.
La forma e la grandezza della testa e delle orecchie cambiano
durante la crescita verso lo stadio adulto. La presentazione di un
segnale binaurale adulto a un bambino, darebbe come risultato una
cattiva decodifica del segnale. Non solo sarebbero inesatte le
modificazioni spettrali apportate dal padiglione dellorecchio, ma
sarebbero difficilmente interpretabili anche le differenze
interaurali dei tempi e dampiezza.
Inoltre la sensibilit allampiezza sonora non simmetrica tra
lorecchio sinistro e destro e questa sensibilit rovesciata nei
mancini. Si dovr allora costruire un modello binaurale destro e uno
mancino? Favorendo un modello standard non verranno soddisfatti
tutti i possibili fruitori.
CAPITOLO 4
I SISTEMI ELETTROACUSTICI GEOMETRICI
Lo sviluppo iniziale dei sistemi elettroacustici stato
fortemente legato allo sviluppo della telefonia. Noi lo abbiamo
dimenticato perch oggigiorno si fa una distinzione basata sul
diverso utilizzo. Questa distinzione tra telefonia e la catena
stereofonica non esisteva alla fine del XIX secolo e allinizio del
XX secolo. In effetti, a parte la tappa di fissare linformazione su
un supporto, lo scopo del telefono e della catena stereofonica lo
stesso: captare uninformazione sonora in un luogo dato e diffondere
questinformazione in un altro luogo. Pu forse sorprendere che la
prima registrazione stereofonica utilizzando due microfoni sia
stata trasmessa attraverso due linee telefoniche?
cos che nel quadro dellEsposizione internazionale dellelettricit
di Parigi, nel 1881, linventore Clement Ader compiva la
trasmissione stereofonica a distanza dei concerti che avevano luogo
nellOpra di Parigi.
Gi a questepoca era chiaro che la codifica delle caratteristiche
direzionali di un evento acustico rendeva necessario lutilizzo di
pi di un canale dinformazione.
Ma due canali erano sufficienti? Nel 1898, il grammofono
Multiplex Graphophone Grand utilizzava tre cornette per la
registrazione e riproduzione, che scrivevano e leggevano tre solchi
su un cilindro.
Con un costo proibitivo di mille dollari, questapparecchio non
ha sicuramente trovato molti acquirenti.
Alla luce di questi due esempi, vediamo che allinizio della
telefonia, da pi di centanni, le qualit direzionali di un evento
acustico, non erano riproducibili con un solo microfono e un solo
altoparlante.
Tuttavia ancora attuale lutilizzo in radio e in telediffusione
della registrazione e trasmissione, utilizzando un unico canale
dinformazione.
4.1 I sistemi elettroacustici con un canale dinformazione
La registrazione e riproduzione con un unico canale
dinformazione meglio conosciuta con il nome di monofonia. Nella
monofonia, linformazione sonora catturata ed emessa da un solo
punto nello spazio; un sistema che non neppure unidimensionale.
Lutilizzo di microfoni dalle propriet sferiche differenti, non
cambia nulla: al massimo si pu cambiare il raggio tra il suono che
proviene direttamente dalla sorgente e il suono riflesso dalle
pareti.
Nella riproduzione, a parte posizionare fisicamente la fonte di
emissione, cio laltoparlante, non possibile alcun posizionamento
spaziale se non quello della sorgente sonora. Se la monofonia non
nemmeno unidimensionale, come si fa al momento della riproduzione,
a valutare le caratteristiche acustiche del luogo di registrazione,
come il riverbero o leco?
Un fenomeno sonoro come la riverberazione fornisce informazioni
sullacustica del luogo di registrazione fornendo una descrizione
spaziale e una descrizione temporale di questa acustica.
La registrazione monofonica non permette la codifica delle
caratteristiche spaziali e di riverberazione, ma permette di
codificare le caratteristiche temporali. Queste caratteristiche
temporali sono delle variazioni nel tempo dellampiezza globale e
del raggio dampiezza delle frequenze del suono riflesso che
arrivano al microfono.
Al momento della riproduzione, la nostra esperienza uditiva ci
permette di interpretare i descrittori temporali e di valutare le
caratteristiche acustiche del luogo di ricezione. Si pu allora
parlare di dimensione spaziale, captata e riprodotta dal sistema
elettroacustico, quando essa esiste solamente nellestrapolazione
mentale basata su una parte degli elementi descrittori?
per questi motivi che la monofonia non nemmeno
unidimensionale.
4.2 Sistemi elettroacustici a due canali dinformazione
I sistemi elettroacustici che utilizzano due canali
dinformazione sono comunemente raggruppati sotto il termine di
stereofonia.
Letimologia della parola stereo deriva dal greco stereos che
significa solido, nel senso geometrico del termine; la stereofonia
sarebbe quindi il suono in tre dimensioni. Il termine stereofonia
costituisce, considerando la sua etimologia e il suo utilizzo
corrente per designare esclusivamente i sistemi elettroacustici a
due canali, un abuso del linguaggio storico. Nella consuetudine
odierna questo termine viene usato per designare una registrazione
trasmessa attraverso due canali e riprodotta con due diffusori o un
casco dascolto. Come nella telefonia, anche nel campo dei sistemi
elettroacustici lutilizzo di due canali per la trasmissione e
riproduzione sonora appariva come un netto miglioramento rispetto
alla monofonia.
Bisognava aspettare ancora una quarantina danni, prima che il
perfezionamento delle componenti meccaniche e elettriche
permettessero sperimentazioni pi approfondite e una possibile
commercializzazione della stereofonia. Nel 1931, delle domande di
brevetto sullincisione di un solco a due canali su un disco o su un
cilindro, furono depositate in Inghilterra e negli Stati Uniti.
Le condizioni sfavorevoli e la crisi economica impedirono
tuttavia gli investimenti necessari alla commercializzazione di
questi brevetti.
Gli anni cinquanta, con il boom economico del dopoguerra,
offrirono un contesto pi favorevole alluscita sul mercato di questi
prodotti.
Nel caso degli Stati Uniti, questa domanda proveniva dai
Laboratori Bell, in cui si facevano da qualche tempo, delle
registrazioni stereofoniche a due o tre microfoni. In Inghilterra,
la domanda di brevetto proveniva da Alan Dower Blumlein, che
lavorava per la compagnia EMI. Ci che era interessante nel brevetto
di Blumlein, che egli non parla solo dellincisione, ma di un
sistema stereofonico completo, dalla registrazione alla
riproduzione.
Dopo la lettura di questo brevetto, risulta evidente che molte
delle tecniche di produzione utilizzate al giorno doggi in
stereofonia vengono direttamente da Blumlein.
La registrazione stereofonica di base con due microfoni, ci
offre una moltitudine di possibilit quanto a combinazioni
funzionali dei microfoni.
Si pu raggruppare questa combinazione di microfoni in due
classi: la registrazione coincidente e la registrazione non
coincidente. Queste tecniche utilizzano sia la differenza dampiezza
tra i canali, sia una combinazione di differenza intercanale
dampiezza e di differenza intercanale di fase, per codificare il
posizionamento dei suoni.
4.2.1 La registrazione stereofonica coincidente
Nella registrazione coincidente del suono, due capsule
direzionali occupano teoricamente lo stesso punto nello spazio, ma
con gli assi di rotazione puntati in direzioni differenti. Il suono
arriva cos nello stesso istante ai due microfoni, ma con unampiezza
che varia in funzione della direzione del suono. Quindi in una
registrazione coincidente, la codifica della posizione di una
sorgente sonora data, dipende unicamente dalla differenza
intercanale dampiezza. Evidentemente con due microfoni
omnidirezionali coincidenti, non si avrebbe teoricamente alcuna
differenza dampiezza nella direzione dei suoni. Lutilizzo di
coincidente di microfoni aventi lo stesso diagramma polare sono
generalmente chiamati X-Y. Si possono utilizzare due cardioidi, due
ipercardioidi o due figura-otto.
Gli angoli di separazione variano generalmente tra 90 e 180; gli
angoli pi larghi sono preferiti con i cardioidi e con gli
ipercardioidi, mentre langolo di 90 preferito con i
figura-otto.
I figura-otto a 90 sono stati proposti da Blumlein nel 1931 e
questo spiega perch questassemblaggio conosciuto anche con il nome
del suo inventore. Nella realt pratica, occupare lo stesso spazio
con due microfoni non fisicamente possibile; essi vengono
posizionati abitualmente uno sopra laltro, occupando cos in un
piano orizzontale parallelo al loro asse di rotazione, lo stesso
punto nello spazio.
La forza principale di questa tecnica risiede nella possibilit
di creare microfoni virtuali, variando la combinazione della somma
monofonica e della differenza stereofonica prodotta dai microfoni
originali. La somma si ottiene addizionando i segnali dei due
microfoni, e la differenza si ottiene addizionando ancora il
segnale, ma invertendo la polarit del segnale di uno dei due
microfoni. Si possono anche utilizzare direttamente dei microfono
aventi caratteristiche sferiche analoghe alla somma mono e alla
differenza stereo. Questa tecnica viene denominata M-S che
significa Middle-Side o Mono-Stereo.
Come proposto da Blumlein nel suo brevetto, il microfono M punta
direttamente verso il centro della sorgente con angolo 0 e il
microfono S orientato a 90 dazimut. Il microfono M generalmente un
cardioide, ma pu essere anche un figura-otto o un microfono
direzionale di ordine superiore o eccezionalmente un
omnidirezionale. Invece il microfono S deve essere sempre un
figura-otto. Addizionando e sottraendo i segnali di M e di S (M+S e
M-S) si ottengono dei nuovi microfoni virtuali che hanno
lorientamento e le caratteristiche sferiche di un X-Y. Cambiando il
rapporto tra M e S si pu variare langolo di separazione dei
microfoni virtuali.
La separazione dei microfoni direttamente legata alle loro
caratteristiche sferiche: pi si allontanano i microfoni e pi si
aumenta la proporzione dellarmonica sferica di primo ordine, il
microfono S figura-otto. Analizzando con il modello delle armoniche
sferiche le tecniche X-Y e M-S sembrerebbe lecito affermare che
esse sono equivalenti, ma nella realt pratica certi ingegneri
preferiscono la tecnica M-S perch permette una somma monofonica di
qualit migliore nelle caratteristiche frequenziali e sferiche.
Le tecniche coincidenti sono teoricamente intercambiabili, ma
evidentemente le caratteristiche sferiche e langolo di separazione
dei microfoni hanno un impatto determinante sulla funzione di
panoramica.
I figura-otto a 90 e i cardioidi a 180 sono le sole
registrazioni ad avere una funzione di panoramica regolare, cio non
favoriscono nessun quadrante a discapito di un altro. Le altre
combinazioni ottenute in X-Y e in M-S favoriscono il quadrante
frontale o i quadranti sinistro e destro.
Il fattore comune che lega tutte le tecniche coincidenti che
utilizzano solo due microfoni il carattere unidimensionale della
loro capacit di codifica spaziale.
4.2.2 La registrazione stereofonica non coincidente
Contrariamente a ci che si fa nelle tecniche coincidenti,
lutilizzo di microfoni omnidirezionali consigliato nella
registrazione del suono non coincidente.
Questa classe raggruppa linsieme di tecniche in cui i due
microfoni non occupano lo stesso posto nello spazio. Il microfono
omnidirezionale utilizzato in un assemblaggio denominato
generalmente A-B, in cui la distanza tra i due microfoni pu variare
da qualche decina di centimetri a qualche metro a seconda della
situazione e delle preferenze soggettive.
La distanza tra i microfoni e la differenza intercanale
dampiezza, crea una differenza intercanale di fase poich i suoni
giungono ai microfoni in momenti differenti. Quando la separazione
dei due microfoni supera qualche metro, consigliata laggiunta di un
terzo microfono omnidirezionale, posizionato in maniera
equidistante rispetto ai microfoni principali diretto al centro
dellimmagine stereofonica. Questa pratica si ispira direttamente
alle esperienze sulla stereofonia realizzate nei Laboratori Bell
durante gli anni trenta. Daltra parte, quando la distanza tra i
microfoni piuttosto piccola, meno di trenta centimetri, i microfoni
omnidirezionali non sono pi necessariamente una buona scelta poich
la differenza intercanale dampiezza comincia a essere molto lieve.
Se si decide di utilizzare un omnidirezionale per le sue qualit
spettrali, preferibile lutilizzo di un baffle.
LOptimal Stereo System (OSS) ne un esempio: Due capsule
omnidirezionali distanziate di 16,5 cm e separate da un baffle
circolare di 28 cm di diametro. Si tratta anche in questo caso di
una delle tecniche stereofoniche brevettate da Blumlein.
Per le distanze itermicrofoniche inferiori a 30 cm, luso di
microfoni direzionali diventa una scelta assai utilizzata. La
letteratura specializzata identifica spesso questo tipo di
registrazione come facente parte di un raggruppamento a parte e lo
definisce quasi coincidente.
Lassemblaggio francese ORTF senza dubbio il pi comune di questa
famiglia. Esso utilizzza due cardioidi distanziati di 17 cm e con
110 di angolo. La tecnica olandese NOS utilizza anchessa due
cardioidi, ma separati di 30 cm e con 90 di angolo. Il montaggio
britannico Faulkner, sicuramente il meno conosciuto, utilizza due
figura-otto spaziati di 18-20 cm, ma con gli assi di rotazione
paralleli luno allaltro e diretti verso la sorgente.
A questi assemblaggi si potr sempre apportare qualche
modifica.
La compagnia AKG utilizza un baffle circolare di 35 cm, simile a
quello del sistema OSS, per migliorare le prestazioni del sistema
ORTF.
Nelle tecniche quasi coincidenti luso del baffle opzionale; si
dovr tuttavia utilizzarlo se si ha lintenzione di preservare una
grande compatibilit monofonica. Infatti si avranno, per certe
lunghezze donda che corrispondono alla distanza tra i microfoni,
una sfasatura di 180 causando lannullamento di queste frequenze
nella riproduzione monofonica.
Unanalisi delle armoniche sferiche dei montaggi quasi
coincidenti senza baffle, rivela linsorgere di fenomeni acustici
dinterferenza, poich unarmonica sferica di secondo o terzo ordine,
variando a seconda della lunghezza donda, costituisce una perdita
importante del microfono virtuale che corrisponde alla somma
monofonica.
Quindi il baffle, diminuendo lampiezza dei segnali che giungono
ai due microfoni, ma in opposizione di fase, assicurer la
compatibilit monofonica. Le registrazioni non coincidenti sono
unidimensionali nella loro codifica spaziale, proprio come le
registrazioni coincidenti.
Nel caso della tecnica A-B, poich laggiunta potenziale del
microfono supplementare si fa sulla stessa linea dei microfoni
principali, si migliora la definizione della linea. La tecnica A-B
dunque unidimensionale come le altre.
4.2.3 La registrazione stereofonica polimicrofonica
Le registrazioni polimicrofoniche con microfoni monofonici,
utilizzano principalmente la differenza intercanale dampiezza, per
posizionare i suoni monofonici a sinistra e a destra, sia in tempo
reale che in differita su due piste. Il controllo della panoramica
sulla console si ottiene cambiando lampiezza del segnale in un
canale rispetto allaltro.
Le registrazioni polimicrofoniche con microfoni stereofonici,
possono utilizzare differenti combinazioni di microfoni stereo
principali e microfoni mono dappoggio. Il missaggio potr preservare
o no le caratteristiche di codifica direzionale dei diversi
assemblaggi di microfoni, mantenendo o diminuendo la separazione
dei canali in questi differenti assemblaggi.
La differenza intercanale di fase non ancora utilizzata
usualmente per posizionare i suoni in un missaggio su due piste.
Finora gli apparecchi periferici che producevano questi delay
servivano soprattutto per creare delle impressioni spaziali con
posizionamento diffuso; laccostamento con la registrazione del
suono non coincidente abbastanza semplice da fare.
Larte del missaggio stereo di una registrazione polimicrofonica
si recentemente arricchita di nuove sperimentazioni.
La questione del trattamento temporale dei microfoni dappoggio
stata studiata con differenti ipotesi e diverse
sperimentazioni.
La tecnica polimicrofonica odierna consiste nel registrare
levento con un montaggio stereofonico e dei microfoni monofonici di
sostegno per gli strumenti in cui si vuole compensare la debolezza
del rispettivo segnale. Eseguita in questo modo questa tecnica
comporta un importante problema:
i suoni captati dai microfoni dappoggio saranno percepiti
davanti ai suoni captati dal montaggio stereo. Il risultato sar
lillusione che linformazione del montaggio stereo costituisca le
prime riflessioni e che i microfoni dappoggio costituiscano i suoni
diretti. Se si aggiunge della riverberazione artificiale, si
produce una modificazione dellacustica originale.
Per contrastare lanticipo temporale dei segnali dei microfoni
dappoggio, la prassi normale compensare con dei delay equivalenti
alla distanza tra i microfoni dappoggio e il montaggio stereo.
Questa tecnica di correzione crea dei nuovi problemi di
filtraggio frequenziale quando la sorgente di un microfono di
sostegno spostata lateralmente, in quanto la relazione temporale
tra il montaggio stereo e il microfono dappoggio assume delle
proporzioni differenti.
Rimane unultima soluzione, abbastanza promettente, che consiste
nellintrodurre nei canali dei microfoni di sostegno un delay
superiore a quello corrispondente alla distanzza tra i microfoni
dappoggio e il montaggio stereo. Questo delay manda i segnali
monofonici nella zona temporale delle prime riflessioni e non
distrugge limmagine prodotta dallassemblaggio stereo. Questa
tecnica di missaggio ancora pi efficace se, per una data sorgente,
sono simulate pi riflessioni.
4.2.4 Apprezzamenti soggettivi delle registrazioni
stereofoniche
Quali sono le differenze udibili e apprezzabili tra le varie
tecniche di registrazione stereofoniche coincidenti e non
coincidenti?
Queste differenze sono di tipo psicoacustico; il giudice finale
che misura lapporto della codifica direzionale di questi meccanismi
e determina quindi il successo di queste tecniche rimane il nostro
orecchio. Inoltre sembra che la precisione nella riproduzione
direzionale dei suoni non sia il solo criterio di per apprezzare la
qualit del posizionamento spaziale di una registrazione stereo.
Carl Ceoen, della Radiodiffusion-Tlvision Belge, ha compiuto nel
1971 un test dascolto comparativo delle differenti tecniche
stereofoniche dello stesso evento musicale. I criteri della
valutazione, e in pi della precisione direzionale (stage
continuity), erano i seguenti: liveness, intimacy, perspective,
extra-width, dynamic range, warmth e brillance. Oltre sessanta
persone hanno ascoltato lestratto delle Danze slave di Dvorak
registrato simultaneamente in X-Y (cardioidi), Blumlein, M-S
(cardioide/figura-otto), ORTF, NOS e polimicrofonia (cinque
cardioidi panoramici con una console di missaggio).
La maggioranza delle persone interrogate hanno indicato che la
tecnica ORTF sembrerebbe essere il compromesso migliore tra tutti i
criteri, con la registrazione M-S come seconda scelta. Questa
preferenza per la non coincidenza, spiega Griesinger, dovuta al
fatto che queste registrazioni ottengono una migliore impressione
spaziale. Questimpressione solo una parte dellinformazione spaziale
codificata da una registrazione stereofonica; non si ritrova
uninformazione direzionale precisa, ma piuttosto uninformazione
sullacustica del luogo originale.
Theile afferma che limpressione spaziale comprende due attributi
dellimmagine sonora: la riverberanza, cio la diffusione temporale
degli eventi sonori causata dalle riflessioni tardive e dalla
riverberazione e l'areazione spaziale, cio la diffusione spaziale
degli eventi sonori, causata dalle prime riflessioni.
Questa informazione sullimpressione spaziale contenuta nel
microfono figura-otto, reale o virtuale, corrispondente al segnale
di differenza stereofonica della registrazione. Lorientamento di
questo microfono lo rende particolarmente adatto a captare le prime
riflessioni della sala che danno riferimenti importanti sul volume
della sala originale.
La distanza tra i microfoni di un montaggio non coincidente,
assicura una scarsa correlazione intercanale e contribuisce cos a
produrre un segnale di differenza stereo, ricco dal punto di vista
psicoacustico. La preferenza per le tecniche non coincidenti
unindicazione abbastanza forte di difetti inerenti alla stereofonia
convenzionale quanto alla sua capacit di dare unimpressione
credibile dello spazio acustico dellevento.
4.2.5 Il trattamento del segnale stereofonico
Gli assemblaggi coincidenti permettono generalmente una
variazione uniforme della differenza intercanale dampiezza, ma
lassenza della differenza intercanale di fase produce una
differenza stereo con una forte correlazione e restituisce in
maniera spenta limpressione spaziale.
Griesinger suggerisce la correzione in piano (shelf filtering)
della somma e della differenza stereo di una registrazione del
suono coincidente, per aumentarne limpressione spaziale. Aumentando
di 4 dB le frequenze al di sotto dei 700 Hz nella differenza
stereo, e in certi casi riducendo di 4 dB questa zona di frequenze
nella somma monofonica, sembra esserci una migliore impressione
nella riproduzione dellambiente.
Questo tipo di trattamento, in cui le modificazioni sono
apportate ai segnali di somma e di differenza, piuttosto che ai
segnali sinistro e destro, stata proposto da Blumlein.
Si cominciano cos a scoprire le virt di un trattamento
stereofonico essenzialmente simmetrico: una modifica alla somma o
alla differenza si ripercuote sempre in maniera identica nel canale
sinistro e destro.
Non bisogna stupirsi se il tipo di correzione spaziale proposto
da Griesinger simile al trattamento del segnale che si ritrova
nella tecnica di produzione Stereosonic.
Utilizzato negli anni cinquanta e sessanta dalla EMI,
Stereosonic era la versione commerciale del brevetto di Blumlein.
Le ricerche di Blumlein e Griesinger hanno trovato interesse per la
compagnia Hughes Aircraft.
Mentre Griesinger suggeriva una correzione spaziale statica, il
Sound Retrieval System (SRS) della Hughes applica una correzione
spaziale dinamica che varia in funzione del segnale stereo che lo
alimenta. Innanzitutto il segnale stereofonico sinistro e destro
ricomposto in somma monofonica e in differenza stereofonica. LSRS
procede in seguito a unanalisi dei segnali per determinare la
quantit di trattamento da applicare.
Ci sono poche informazioni nella letteratura specializzata su
questa parte del sistema, ma si presume che lanalisi venga eseguita
seguendo dei parametri fissi: si guarda la proporzione dellampiezza
della somma e della differenza per tutta la banda passante e per
dei settori di frequenze in particolare.
Si modificano poi le ampiezze di certe zone di frequenza che
possono creare una buona impressione spaziale.
Per la ricostruzione del segnale stereo sinistro e destro, si
lascia al fruitore la possibilit di modificare, entro certi limiti,
il rapporto tra la somma mono e la differenza stereo. Il Bedini
Audio Spatial Environment (B.A.S.E) funziona esattamente sullo
stesso principio dellSRS.
Questi due sistemi diventano particolarmente interessanti nel
caso in cui i diffusori sono ravvicinati: correttori spaziali
procedono a un aumento dellimpressione spaziale del segnale
stereofonico.
Da qui le affermazioni da parte delle due compagnie di un
sistema di riproduzione sonoro tridimensionale.
Un altro trattamento post-registrazione usato recentemente la
conversione Blumlein, che consiste nel convertire la differenza
intercanale di fase di una registrazione non coincidente in
differenza intercanale dampiezza.
Leffetto principale di questa conversione di rendere pi
compatibile lascolto c