Rozwiązania wykorzystujące
metodę kompresji MPEG opierają się na tym samym schemacie działania.
Wykorzystują one tzw. efekt maskowania, doskonale znany wszystkim
posiadaczom
magnetofonów analogowych. W uproszczeniu polega on na tym, że
głośniejsze
dźwięki „przykrywają" te o mniejszym natężeniu - maskują je. Łatwo się
o
tym przekonać słuchając tzw. wyciszenia utworu muzycznego
W którymś momencie,
oprócz ulubionej pieśni, da się słyszeć także szumy własne taśmy i
urządzenia
grającego. Nie znaczy to oczywiście, że szumów wcześniej nie było.
Były, ale
ograniczona czułość słuchu nie pozwala na wychwycenie takich detali.
Zupełnie
tak jak odgłosów dochodzących zza ściany mieszkania znajdującego się
przy
ruchliwej ulic.
Kiedy na zewnątrz jest cicho, nie występuje
efekt maskowania
i słychać grające radio sąsiada. Wszystkie układy redukcji szumów
instalowane
choćby w magnetofonach kasetowych potrafią zrobić użytek z tej
swoistej
ułomności i zaprzestając działania po przekroczeniu przez sygnał
użyteczny
pewnego poziomu.
W niektórych z nich, jak w zaawansowanych
procesorach
dźwięku opracowanych przez Dolby Laboratories (w wersji SR),
wykorzystuje się
w celu optymalizacji procesu zapisu magnetycznego (a tym samym
zwiększenia
dynamiki, czyli „odstępu" szum - sygnał użyteczny) złożone algorytmy
analizy widma sygnale, oparte na cechach fizjologicznych naszych uszu.
Pod tym
względem zachowują się bardzo podobnie do koderów formatu MPEG.
Analizują
widmo sygnału po to, by następnie dostosować go do modelu
psychoakusrycznego;
na bieżąco szacując dopuszczalny poziom szumów poniżej progu
słyszalności.
Algorytm pomija lub upraszcza te składowe przekazu, które „Zagłuszają" głośniejsze jego
elementy.
Reszta dzieje się w naszych głowach - mózg „dopowiada" sobie to, czego
w rzeczywistości nie słyszymy.
Koder
formatu MPEG Layer2 dzieli widmo~ sygnału akustycznego na 32 podzakresy
o
„szerokości" 750 Hz. W każdym z nich zawarta jest cząstka widma
analizowanego dźwięku. Na bieżąco obliczany jest efekt maskujący dla
poszczególnych zakresów. Dodatkowo program kodujący wykorzystuje fakt,
iż
czułość ucha zmienia się w funkcji częstotliwości. Przy mniejszej
głośności zdecydowanie słabiej słyszymy wysokie i
niskie dźwięki, a najlepiej dźwięki o częstotliwościach od 2 do 4
kHz. Koder
formatu MPEG 3 jest jeszcze bardziej złożony. Między innymi ma 18
razy
większy rozdzielczość i stosuje różne szerokości podzakresów dla
poszczególnych
wycinków widma akustycznego. Ponadto w przypadku transmisji
stereofonicznych,
stosowany jest tryb „joint-stereo", wykorzystujący wzajemne przenikanie
informacji kanałów lewego i prawego (metoda Huffmana).
Zapotrzebowanie
na moc obliczeniową podczas kodowania jest niewspółmiernie większe
niż
podczas syntezy „obrobionych" w ten sposób dźwięków. Profesjonalne
systemy MPEG czasu rzeczywistego (kodowanie przebiega na bieżąco, np.
podczas
transmisji cyfrowego programu radiowego) wymagają wciąż solidnej
platformy
sprzętowej. Służą do tego specjalizowane procesory i karty dźwiękowe
(np.
francuskiej firmy Digigram).
.