Reprezentacja dźwięku i obrazów ruchomych w komputerze

Dźwięk jest sygnałem analogowym, co oznacza, że wartość chwilowa jego natężenia zmienia się w czasie w sposób ciągły.

Analogową metodę zapisu dźwięków wynalazł edison w roku 1877, ale była to metoda czysto mechaniczna.

fono1-293585-e3cc0bd51ec2deb1323

 

W drugiej połowie xx wieku dominował już elektryczny zapis dźwięku wykorzystujący w charakterze nośnika taśmę magnetyczną

Revox_B77

W tym samym czasie wprowadzono technikę cyfrową do telefonii.

Dla zachowania jednorodności rozwiązań konstrukcyjnych konieczne stało się przekształcenie analogowego sygnału dźwiękowego na sygnał cyfrowy.

Dokonano tego za pomocą modulacji kodowo-impulsowej (pulse code modulation – pcm).

Castel-A1902-replika-telefonu-z-roku-1902.1364

Metoda ta polega na sprawdzaniu z określoną częstotliwością chwilowych wartości sygnału analogowego (próbkowanie sygnału)

Obraz1

Odczytane w ten sposób wartości są przeliczane na liczby binarne. Po tym przekształceniu chwilowe wartości sygnału analogowego są przesyłane jako ciąg liczb binarnych (czyli jako ciąg impulsów o jednakowej amplitudzie)

Obraz2

Wartości sygnału w poszczególnych punktach próbkowania wyrażone binarnie

Obraz3

W urządzeniu odbiorczym dokonuje się proces odwrotny. Odebrane wartości binarne są zamieniane na proporcjonalne wartości napięcia. W ten sposób zostaje odtworzony przybliżony sygnał analogowy.

Obraz4

Jakość dźwięku jest tym lepsza, im bliżej siebie leżą kolejne próbki, czyli im większa jest częstotliwość próbkowania. Jeżeli częstotliwość próbkowania jest dostatecznie duża, to sygnał kodowany cyfrowo niewiele różni się jakościowo od oryginalnego sygnału analogowego.

W końcu lat osiemdziesiątych xx wieku zostały wyprodukowane pierwsze karty dźwiękowe dla komputerów ibm pc. Microsoft i ibm opracowały, oparty na kodowaniu pcm, format plików do zapisu dźwięku o nazwie wav (z ang. Waveform).

Na jakość zachodzącej w cyfrowym przetworniku karty dźwiękowej digitalizacji – konwersji wartości amplitudy sygnałów analogowych do postaci liczbowej mają wpływ:

CZĘSTOTLIWOŚĆ PRÓBKOWANIA – liczba próbek sygnału analogowego pobieranych w ciągu jednej sekundy. Standardowo stosuje się następujące częstotliwości próbkowania: 11025 Hz – digitalizacja mowy, 22050 Hz – muzyka o jakości „przenośnego radia”, 44100 Hz – jakość płyty CD.

ROZDZIELCZOŚĆ PRÓBKOWANIA – liczba bitów przeznaczonych do zapisu każdej próbki. Ścieżki płyty CD-Audio są digitalizowane z 16-bitową rozdzielczością.

W systemie Windows jest stosowany format WAV tworzący pliki audio bez kompresji.

Brak kompresji oznacza, że plik zawierający 3 minutowe nagranie orkiestry symfonicznej będzie miał taką samą wielkość jak zawierający 3 minuty absolutnej ciszy.

Dane zapisane w plikach tego formatu mają dużą objętość. Jednominutowe nagranie o jakości płyty CD Audio zajmuje około 10 MB. Oznacza to małą przydatność w sieci.

Muzyka nagrana na kompakcie ma częstotliwość próbkowania dźwięku 44,1 kHz. Muzyka z jakością radiową to około 22 kHz. Jakość rozmowy telefonicznej to około 11 kHz.

Ilość bitów przeznaczona na zapis jednej liczby binarnej zapisanej w wyniku próbkowania („ramki dźwięku”) może być różna. Jakość kompaktowa dźwięku to 16 bitów (2 bajty), jakość radiowa i telefoniczna to 8 bitów (1 bajt).

Dźwięk monofoniczny lub stereofoniczny.

44 kHz. 8 bit, stereo – 1 min 36 sekund – 8,11 MB

22 kHz. 16 bit, stereo – 1 min 56 sekund -9,75 MB

44 kHz, 16 bit, mono – 4 sekundy – 408 KB

22 kHz, 16 bit mono – 10 sekund – 447 KB 

 

WAV – zalety i wady

Rozpowszechniona obsługa przez popularne oprogramowanie komputerowe

Prosta struktura pliku

Łatwość obróbki

Możliwa wysoka jakość dźwięku

 

Duży rozmiar (aby zmniejszyć wielkość trzeba zrezygnować z jakośći)

Nie nadaje się do Internetu

 

Z zapisem i odtwarzaniem dźwięku wiąże się pojęcie „kodeka” (kodowanie – dekodowanie). Jest to urządzenie lub program służący do zakodowania lub rozkodowania sygnału. W efekcie zakodowania powstaje plik dyskowy. Aby ten plik odsłuchać konieczne jest zainstalowanie w systemie tego samego kodeka, który służył do zakodowania.

 

 

WAVE – digitalizacja sygnału, amplituda, sinusoida, pomiar = 44,1kHz/s, każda wartość zapisana jest na 2 bajtach

MP3 – kompresja do 10x

MIDI – zapis partytury

Lempel-Ziv-Welch, LZW – metoda strumieniowej bezstratnej kompresji słownikowej

Metoda LZW jest względnie łatwa do zaprogramowania, daje bardzo dobre rezultaty. Wykorzystywana jest m.in. w programach ARC, PAK i UNIX-owym compress, w formacie zapisu grafiki GIF, w formatach PDF i PostScript (filtry kodujące fragmenty dokumentu) oraz w modemach (V.42bis). LZW było przez pewien czas algorytmem objętym patentem, co było przyczyną podjęcia prac nad nowym algorytmem kompresji obrazów, które zaowocowały powstaniem formatu PNG.

Algorytm kompresji (kodowania)

Algorytm przebiega następująco:

  1. Wypełnij słownik alfabetem źródła informacji.
  2. c := pierwszy symbol wejściowy
  3. Dopóki są dane na wejściu:
    • Wczytaj znak s.
    • Jeżeli ciąg c + s znajduje się w słowniku, przedłuż ciąg c, tj. c := c + s
    • Jeśli ciągu c + s nie ma w słowniku, wówczas:
      • wypisz kod dla c (c znajduje się w słowniku)
      • dodaj ciąg c + s do słownika
      • przypisz c := s.
  4. Na końcu wypisz na wyjście kod związany c.

dz03NTA=_src_34742-kompresja_sygnalu_dzwiek

Obróbka dźwięku przy pomocy odpowiednich aplikacji12922_screen 2_110922085356_1 g_-_-x-_-_s_30566x20120229140738_01


Źródła: Krzymowski Bogdan, MP3 – czyli muzyka z Internetu, Komputerowa Oficyna Wydawnicza „HELP”, 2008 http://www.promusic.pl

http://www.pentagram.pl

http://www.fizykon.org

Michał Franczak

strona internetowa: mfranczak.pl

http://mfranczak.pl/66-reprezentacja-dzwieku-i-obrazow-ruchomych-w-komputerze/

Author: ZSE

Share This Post On
Skip to content