Cos'è l'audio tridimensionale (3D)?

Ci troviamo sulla soglia del ventunesimo secolo ed, ancora, il sistema migliore per simulare la provenienza di un suono da un certo punto dello spazio è posizionare una cassa acustica in quel punto.

Ma se avessimo bisogno di "muovere" virtualmente il suono, cioè simulare il cambiare nel tempo della posizione del punto di provenienza? Accontentandoci di una qualità inferiore, potremmo posizionare due casse ai lati del punto e far muovere il suono lungo una linea immaginaria tracciata tra i due estremi delimitati dalle casse utilizzando un semplice algoritmo basato sulle variazioni di volume del suono stesso (panning stereo).

E se volessimo "muovere" il suono su di un piano, simulare quindi degli spostamenti bi-dimensionali? Tralasciando alcuni sistemi basati su algoritmi di psico-acustica che riescono a dare una sensazione di "allargamento del panorama stereo" ma sono limitati dal numero di casse in uscita o dall'uso di una cuffia stereo, potremmo utilizzare uno dei tanti standard proposti dalla Dolby. Questi standard, se da un lato hanno avuto l'indubbio merito di aver diffuso l'uso di un numero di casse maggiore di due nel mondo e creato degli utilissimi algoritmi di codifica come l'AC32, ad esempio, in sintesi propongono essenzialmente una moltiplicazione delle linee immaginarie suddette, utilizzando due o più immagini stereofoniche aiutate sulle frequenze più basse da una cassa dedicata denominata sub-woofer e vari ritardi e variazioni di fase sugli altri canali. Vi rimandiamo alla vasta e dettagliata documentazione disponibile in internet per maggiori informazioni in merito.

Ma l'ambiente in cui viviamo, per il nostro udito, è un paesaggio sonoro tridimensionale in costante cambiamento, come abbiamo detto. Se vogliamo creare una simulazione realistica di un vero paesaggio sonoro o comunque creare un paesaggio sonoro immaginario che sembri realistico (non c'è molta differenza tra le due cose, se ci pensate bene) dobbiamo utilizzare un sistema audio realmente tridimensionale. E dobbiamo preoccuparci anche della riproducibilità del nostro paesaggio sonoro, spero che sarete d'accordo con me su questo punto. Se il novecento è stata l'era della "riproducibilità tecnica dell'opera d'arte"3, il ventunesimo secolo, con l'affermazione della globalizzazione e di internet, dovrebbe essere anche l'era della diffusione globale dell'evento spettacolare, della sua trasfigurazione e sublimazione in vari contenuti multimediali per ottenere (magari) il consenso del maggior numero di persone, fargli provare una vera e propria esperienza estetica, e quindi far raggiungere all'evento lo status di opera d'arte.

Ma quali sono i limiti imposti dalla realtà prosaica dell'industria musicale alla realizzazione di un progetto così ambizioso? La localizzazione di un suono da parte di un ascoltatore posto al centro di un ambiente tridimensionale può essere indotta simulando tre principali fenomeni:

  1. La differenza temporale con la quale la vibrazione dell'aria che costituirà il suono giungerà ai due orecchi dell'ascoltatore, detta Inter-aural Time Difference (ITD) .
  2. La differenza di intensità, Interaural Intensity Difference (IID).
  3. La modellazione della struttura spettrale del suono dovuta alle varie riflessioni indotte dall'ambiente che ospiterà la simulazione del paesaggio sonoro.
  4. L'orientamento della testa dell'ascoltatore.

Se i primi due fenomeni sono facilmente riproducibili dappertutto perché basati sulle relazioni che intercorrono tra le posizioni dell'ascoltatore e del sistema di riproduzione, i punti tre e quattro, purtroppo, non si possono prevedere con sufficiente esattezza. Intendiamoci, anche per i primi due parametri dobbiamo accontentarci di un'approssimazione, ma è un compromesso che funziona nel novanta per cento dei casi. I coefficienti di riflessione dei materiali che costituiscono le pareti e degli oggetti presenti nell'ambiente dove avrà luogo la spazializzazione ed i parametri d'orientamento della testa di tutti gli ascoltatori varieranno di continuo ed all'interno di una gamma di valori troppo ampia per poter tentare un'approssimazione.4 Ma il nostro sistema abbiamo detto che dovrà funzionare presumibilmente dappertutto, in una qualsiasi casa dotata di un impianto home theater come in un teatro od in un cinema...

Esistono varie soluzioni al problema attualmente, come i sistemi basati su Ambisonic od Open AL, alcune anche di ottimo valore teorico ma la maggior parte con grosse limitazioni di ordine pratico od economico. Le forche caudine che tutti devono attraversare sono rappresentate dal tipo di supporto utilizzato sul mercato "consumer" per la diffusione di film, video e documentari, in poche parole il surround Dolby o DTS. Personalmente, ormai da una decina d'anni, preferisco utilizzare e sviluppare sistemi hardware e software per la spazializzazione che possano essere utilizzati in qualsiasi situazione e che non richiedano un grosso budget di spesa per l'acquisto e la realizzazione, in caso di rappresentazioni od installazioni. E soprattutto, che permettano di "mantenere" l'effetto spettacolare del paesaggio sonoro passando da un impostazione delle casse acustiche all'altra, cioè dal "live" al DVD. Basandomi su un algoritmo brevettato a livello internazionale per A&G Soluzioni Digitali, la mia società di sviluppo e distribuzione, ho ideato e realizzato, con il prezioso supporto di Umberto Zanghieri della ZP Engineering, un hardware con connessioni audio digitali controllabile via MIDI che ho chiamato X-spat boX. Il passo successivo, ancora in corso, è stato sviluppare una serie di interfacce software per diverse tipologie di utilizzatori che fossero semplici e veloci da usare, complementari e compatibili tra loro.


2
Vedremo in seguito come si possa tranquillamente far convivere una spazializzazione con un mix in surround, anzi, includere una spazializzazione in un mix in surround codificato e pronto per la diffusione in DVD od altri formati per il cinema.

3 Walter Benjamin  - L'opera d'arte nell'epoca della sua riproducibilità tecnica - Einaudi, Torino 2000

4 Vedremo in seguito come la simulazione di questi due fenomeni sia comunque possibile in caso di particolari installazioni fisse dove il problema della diffusione dei contenuti è speculare perché è il pubblico a dover raggiungere... i contenuti.