Algorytmy Kompresji plików AUDIO i VIDEO

VIDEO
MPEG
MPEG - 1
MPEG - 2
MPEG - 4
AUDIO
Digital Audio
MP2 / MP3
Twin VQ
WMA
MP3pro
MIDI

MP2 / MP3

Rozwiązania wykorzystujące metodę kompresji MPEG opierają się na tym sa­mym schemacie działania. Wykorzystują one tzw. efekt maskowania, doskonale znany wszystkim posiadaczom magneto­fonów analogowych. W uproszczeniu po­lega on na tym, że głośniejsze dźwięki „przykrywają" te o mniejszym natężeniu - maskują je. Łatwo się o tym przekonać słuchając tzw. wyciszenia utworu mu­zycznego

W którymś momencie, oprócz ulubionej pieśni, da się słyszeć także szu­my własne taśmy i urządzenia grającego. Nie znaczy to oczywiście, że szumów wcześniej nie było. Były, ale ograniczona czułość słuchu nie pozwala na wychwy­cenie takich detali. Zupełnie tak jak odgłosów dochodzących zza ściany miesz­kania znajdującego się przy ruchliwej ulic.

Kiedy na zewnątrz jest cicho, nie wy­stępuje efekt maskowania i słychać grają­ce radio sąsiada. Wszystkie układy reduk­cji szumów instalowane choćby w magne­tofonach kasetowych potrafią zrobić uży­tek z tej swoistej ułomności i zaprzestając działania po przekroczeniu przez sygnał użyteczny pewnego poziomu.

W niektó­rych z nich, jak w zaawansowanych pro­cesorach dźwięku opracowanych przez Dolby Laboratories (w wersji SR), wykorzy­stuje się w celu optymalizacji procesu zapi­su magnetycznego (a tym samym zwiększe­nia dynamiki, czyli „odstępu" szum - sy­gnał użyteczny) złożone algorytmy analizy widma sygnale, oparte na cechach fizjolo­gicznych naszych uszu.

Pod tym względem zachowują się bardzo podobnie do kode­rów formatu MPEG. Analizują widmo sy­gnału po to, by następnie dostosować go do modelu psychoakusrycznego; na bieżą­co szacując dopuszczalny poziom szumów poniżej progu słyszalności. Algorytm po­mija lub upraszcza te składowe przekazu, które Zagłuszają" głośniejsze jego elemen­ty. Reszta dzieje się w naszych głowach - ­mózg „dopowiada" sobie to, czego w  rze­czywistości nie słyszymy.

Koder formatu MPEG Layer2 dzieli widmo~ sygnału akustycznego na 32 podzakresy o „szerokości" 750 Hz. W każdym z nich zawarta jest cząstka widma analizowanego dźwięku. Na bie­żąco obliczany jest efekt maskujący dla poszczególnych zakresów. Dodatkowo program kodujący wykorzystuje fakt, iż czułość ucha zmienia się w funkcji czę­stotliwości. Przy mniejszej głośności zde­cydowanie słabiej słyszymy wysokie i ni­skie dźwięki, a najlepiej dźwięki o czę­stotliwościach od 2 do 4 kHz. Koder for­matu MPEG 3 jest jeszcze bardziej złożo­ny. Między innymi ma 18 razy większy rozdzielczość i stosuje różne szerokości podzakresów dla poszczególnych wycin­ków widma akustycznego. Ponadto w przypadku transmisji stereofonicz­nych, stosowany jest tryb „joint-stereo", wykorzystujący wzajemne przenikanie informacji kanałów lewego i prawego (metoda Huffmana).

Zapotrzebowanie na moc obliczenio­wą podczas kodowania jest niewspół­miernie większe niż podczas syntezy „ob­robionych" w ten sposób dźwięków. Pro­fesjonalne systemy MPEG czasu rzeczy­wistego (kodowanie przebiega na bieżą­co, np. podczas transmisji cyfrowego pro­gramu radiowego) wymagają wciąż solid­nej platformy sprzętowej. Służą do tego specjalizowane procesory i karty dźwię­kowe (np. francuskiej firmy Digigram).

.


zrodla wiedzy:  "Chip", "Life Video", "Video i komputer" oraz inne pisma o tej tematryce a także internet.