사운드 정의
사운드란 소리를 뜻하는 영단어로, 물리적인 진동 작용인 음파에 기초를 두고 있는 개념이다. 우리가 귀로 들을 수 있는 모든 것은 음파의 형태로 우리의 귀에 도달하고 그리고 우리가 인지하게 된다. 결국, 일반적인 사운드는 매체 안에 있는 분자들의 진동으로 생성된 파장을 통해 전달되는데 이를 측정하고 기록하여 전자적으로 처리할 수 있다.
아날로그 사운드
아날로그 사운드는 실제 세상에서 듣는 소리를 의미한다. 각각의 소리는 소리의 크기, 소리의 높이, 음색으로 구성된다. 순소한 소리의 기본적인 진동은 사인파 모양을 형성한다. 먼저 사운드를 제대로 이해하기 위한 기본 용어들을 정리하겠다.
- 진폭(Amplitude): 파형의 최고점 또는 최저점과 중앙선의 차이, 즉. 파장의 높이이다.
- 주기(Period): 한 사이클이 중앙선에서 시작하여 그 파장의 위쪽과 아래쪽의 확장을 통해 나아가 다시 중앙선에 도착하는데 걸리는 시간을 말한다.
- 주파수(Frequency): 단위 시간당 사이클의 수, 헤르츠(Hz) 또는 CPS(Cycles per Second) 측정 단위로 표현한다.
주기와 주파수는 서로 반비례 관계이다(주파수 = 1 / 주기). 사운드에서는 높은 주파수를 다루기에 킬로헤르츠(1kHz = 1,000Hz)와 메가헤르츠(1MHz = 1,000kHz = 1,000,000Hz) 단위를 사용하게 된다.
사운드는 연속적인 아날로그 파형으로 표시되고, 아날로그 파형은 음의 크기(진폭), 음의 높이(주파수), 음색, 이렇게 3가지 특징으로 표현한다.
- 음의 크기(Intensity): 소리의 파형에서 "진폭" 부분이 클수록 사운드의 크기가 커진다. 파형에서 가장 큰 크기를 가지는 지점이 가장 큰 소리를 내고 작은 크기를 가지는 지점이 작은 소리르 낸다. 소리의 크기를 나타내는 단위는 데시벨(dB)이다.
- 음의 높이(Pitch): 음의 높이는 "주파수", 사이클이 1초에 반복되는 횟수에 의해 결정된다. 사이클이 많을수록 높은 음이 된다. 초당 사이클의 수를 나타내는 단위는 헤르츠(Hz)이다.
- 음색(Tone): 사운드에서 가장 중요한 고유의 음 색깔이며, 인간의 귀가 서로 다른 사운드를 구분하게 하는 특징이다.
디지털 사운드
디지털 사운드는 사운드가 디지털로 표현되고 저장된 것을 의미한다. 컴퓨터는 오직 디지털 신호만을 처리할 수 있기에 아날로그 신호를 디지털 신호로 변환하는 작업이 필요하다. 소리의 원형을 완전히 보존할 수는 없어도 양자화의 과정을 거쳐 재생 시에 귀로 느끼는 원음의 손실은 사실상 없다. 이러한 특징으로 디지털 사운드는 소스 제작 당시의 원음을 우리 귀에 전달할 수 있다.
사운드 변환
아날로그 신호를 디지털 신호로 바꾸는 것을 "사운드 변환"이라고 한다. 아날로그 신호를 디지털 신호로 바꾸는 것은 ADC 변환장치(Analog-to-Digital Converter)에서 이루어진다. ADC 변환장치를 통해 아날로그 신호가 "샘플링" 과정과 "양자화" 과정을 거쳐, 양자화 비트 수에 해당하는 0과 1의 디지털 숫자로 부호화되는 과정을 통하여 디지털 신호로 변환된다. 그 후, 재생을 위해서 DAC 변환장치(Digital-to-Analog Converter)를 통해 아날로그 신호로 변환시키는 과정을 거쳐야 한다.
사운드 변환 과정
- 샘플링(Sampling): 파형을 일정한 간격으로 잘게 쪼개어 각 지점의 값을 하나하나 차례대로 끄집어내는 작업이다. 이때 하나하나의 값으로 표현된 신호를 샘플이라고 하며, 1초 동안 취한 샘플의 수를 샘플링 비율이라고 한다. 샘플링 비율의 범위가 클수록 음질이 좋아지고, 데이터의 양 또한 증가한다.
- 양자화(Quantization): 어떤 값을 취할 수 있는 유한의 이산적인 값으로 표현하는 조작을 말한다. 양자화는 샘플링한 신호의 크기들을 이산적으로 단계화하는 과정이다. 연속적인 신호를 단계화하면 오차가 발생하는데 이를 양자화 오차라고 하며, 원신호의 왜곡을 막기 위해 디지털 레벨의 수를 조절하여 적절한 수준의 양자화 오차를 유지해야 한다.
- 부호화(Encoding): 양자화된 아날로그 신호들을 디지털 형태의 2진 정보로 표현하는 것이다. 일반적으로 음성 신호는 PCM 방법을 통해 변환된다.
디지털 사운드의 특징 (수치적 기준)
디지털 사운드는 그 특징을 각각 수치적으로 나타내는 기준이 필요한데, 그 기준은 다음과 같다.
- 샘플링 크기(Sampling Size): 사운드의 크기(진폭)를 디지털 수치로 표현하는 것으로, 크기의 차이를 얼마나 촘촘하게 표시하는가를 결정한다. 샘플링 크기의 비트 수가 클수록 사운드의 크기를 세밀하게 디지털로 표현할 수 있다.
- 샘플링 비율(Sampling Rate): 시간에 따라 변하는 사운드의 1초당 추출 횟수를 표현하는 것으로, 아주 작은 단위인 하나의 샘플을 추출한 후 다음 샘플을 추출하기까지의 시간을 의미한다. 샘플링 비율이 클수록, 즉 샘플링 간격이 짧을수록 아날로그 파형을 더욱 정교하게 디지털 사운드로 표현할 수 있다.
- 채널 수(Number of Channels): 동시에 들리는 사운드의 개수로, 채널에는 "모노(Mono)"와 "스테레오(Stereo)"가 있다. 모노는 한 개의 단일 채널만을 사용하는 것이고, 스테레오는 두 개의 채널을 지정하여 사용하는 것이다. 왼쪽과 오른쪽에서 각각 다르게 들리면 디지털 사운드를 구성할 때 실제 세계에서 듣는 것 같이 느껴지기에 사람들은 스테레오를 선호하는 경향이 있다. 그러나 그만큼 스테레오 사운드는 저장량이 2배가 필요하다.
사운드 변환 방법
지금부터 사운드를 변환하는 방법에 대해 알아보도록 하겠다.
- PCM(Pulse Code Modulation): 아날로그 파형을 작은 시간 간격으로 연속적으로 나누어 각기 직사각형 형태로 크기를 표시한 후, 높이를 숫자화하는 방식으로, 소리를 디지털화하는데 이용되는 대표적인 방식이다. 먼저 아날로그 신호를 양자화하여 PAM(Pulse Amplitude Modulation) 신호로 만들고, 펄스의 디지털 레벨의 비트 수만큼 2진 코드열로 변환한다.
- DPCM(Differential Pulse Code Modulation): 개선된 PCM 방식으로, 아날로그 신호에서 서로 인접한 샘플링 시점의 파형을 비교하면 값이 크게 변하지 않기에, 사운드 파형의 값을 그대로 저장하지 않고 이전의 값과의 차이만을 저장하는 방식이다. PCM 방식에 비해 데이터의 양이 줄어들게 된다.
- ADPCM(Adaptive Differential Pulse Code Modulation): DPCM 방식을 개선한 방식으로, 음성 신호는 상관성이 크기에 음성 신호를 직접 양자화하지 않고 과거의 음성 신호의 샘플을 기준으로 다음에 들어올 신호의 크기를 예측하고 실제의 입력 신호로부터 빼줌으로 오차를 발생시켜, 오차 신호를 양자화하여 전송하는 방식이다. ADPCM 방식은 DPCM에서 양자화 단계의 폭(Step Size)을 신호의 진폭에 따라 적응적으로 변경시키는 방식이기에, 가변적으로 차이를 정밀하게 표현할 수 있다.
디지털 오디오의 생성과 저장
컴퓨터를 이용하여 처리하는 사운드는 "디지털 오디오"와 "미디(MIDI)"로 나누어진다.
디지털 오디오의 생성
디지털 오디오를 생성하는 가장 간단한 방법은 컴퓨터의 CD 드라이브에서 음악 CD나 음향효과 CD의 사운드를 추출하는 것이다. 그 외에도 마이크를 통하여 사운드를 녹음하는 방법, 디지털 사운드를 컴퓨터의 사운드 카드와 오디오 시스템에 연결하여 소리를 녹음하는 방법 등이 있다.
디지털 오디오의 파일 크기
디지털 사운드가 웨이브 형식으로 변환되어 저장되는 디지털 오디오 파일의 크기는 "샘플링 크기"와 "샘플링 비율"에 따라 달라진다. 이 두 가지의 값이 클수록 디지털 오디오의 음질이 좋아지나 데이터의 크기도 커지게 된다. 오디오 파일의 크기는 샘플링 크기, 샘플링 비율, 사운드 채널의 수를 통해 계산 가능하다.
오디오 파일의 크기 = 샘플링 크기(Byte) X 샘플링 비율 X 채널 개수 X 시간(s)
디지털 오디오의 저장
디지털 오디오의 음질은 데이터의 양과 비례하고, 이는 샘플링 비율과 샘플링 표현 비트 수로 결정된다. 음질을 향상 시키면 데이터의 양도 커지게 되고 그러면 시스템에 많은 부하를 주기에 적절한 밸런스를 맞추는 것이 중요하다.
오디오 데이터의 음질이 원음과 동등한 정도를 유지해야 한다면 오디오 데이터를 압축하지 않고, 오디오 데이터의 음질이 원음에는 미치지 못하여도 차이를 크게 느끼지 못할 정도로 충분하다면 오디오 데이터를 압축해서 사용한다.
데이터의 압축은 손실 압축과 무손실 압축으로 나뉘게 된다.
- 손실 압축(Lossy compression): 정보의 손실을 감수하고 데이터의 양을 최대한 줄이는 방법
- 무손실 압축(Lossless compression): 정보의 손실을 최대한 억제하여 음질의 수준을 최고로 유지하는 방법
오디오 파일의 형식
사운드 음질을 거의 원형대로 유지하는 무손실 압축 방식의 대표적인 디지털 오디오 파일 형식에 대해 알아보도록 하겠다
- WAV(Waveform Audio Format): 마이크로소프트사와 IBM사가 오디오 파일 형식의 표준으로 공동 개발했으며, 주로 윈도우 운영체제에서 사용된다. 사용하기 쉽고 음질이 뛰어난 편이나, 파일 크기가 너무 크다는 단점이 있다. 기본 확장자는 *.wma이다.
- AU(AUdio): 썬마이크로시스템즈에서 만든 사운드 형식으로 유닉스 시스템에서 사용되는 표준 오디오 파일이다. WAV 파일과 비슷하나 샘플링 비율이 조금 작아 음질이 떨어진다.
- AIFF(Audio Interchange File Format): 애플 컴퓨터에서 개발된 PC와 기타 오디오 전자장비에서 주로 사용되는 오디오 파일 형식으로, 주로 매킨토시에서 사용된다. 확장자는 *.aiff, *.aif이다.
- 리얼오디오(RealAudio): 리얼네트웍스사에서 개발한 것으로 실사간 전송을 위해 만들어졌으며, 실시간 감상을 위한 스트리밍 오디오 형식이다. 파일 확장자는 *.ra, *.ram이다.
- ASF(Advanced Systems Format): 고급 시스템 포맷이라고 하며, 마이크로소프트사에서 만든 디지털 소리와 영상을 담는 형식이다. ASF 파일은 인터넷에서 파일을 다운로드하며 동시에 재생이 가능하다는 특징을 가지며, 확장자는 *.asf이다.
미디 (MIDI)
미디(MIDI: Musical Instrument Digital Interface)는 디지털 음악에 대한 국제 표준으로 제조업체가 다른 컴퓨터와 전자악기를 연결하는 하드웨어와 케이블 및 장비 간의 통신 프로토콜에 관한 사양을 정리한 것이다. 실제 소리를 갖고 있지 않고 악기의 연주 방법에 대한 정보를 가지고 있는 것이다.
미디 파일은 실제 음악 악보와 음의 강도 및 빠르기, 음악적 특성에 관한 명령어, 악기의 종류 등의 정보도 가진다. 다만, 미디 파일은 파형 정보를 저장하지 않기에 파일 크기가 상대적으로 작고, 편집에는 용이하나 명확한 사운드 제어는 부족하다. 또한 미디 파일은 음악 악기를 위해 정보를 표현하는 것이기에 재생될 때 음악 악기에 영향을 많이 받는다. 미디를 이용해 작곡한 결과를 웨이브 파일로 녹음하여 사용하면 사용자가 가지는 사운드 카드에 의해 음질이 좌우되지 않는다.
미디 편집 프로그램
전문적인 미디 파일을 재생하고 창작하기 위해서는 미디 편집 프로그램을 사용해야 한다.
- 시퀀서(Sequencer): 멀티 트랙 레코드를 시뮬레이션한 프로그램으로, 악기로 연주되는 음악을 트랙 단위로 녹음하였다가 녹음된 여러 트랙을 동시에 재생함으로 마치 오케스트라를 연주하는 것과 같은 효과를 내는 프로그램이다.
- 노테이션 프로그램(Notation Program): 직접 손으로 입력한 미디 신호를 변환한 후 컴퓨터 그래픽을 이용하여 악보로 나타내는 프로그램이다. 즉, 악보 작성 프로그램이다.
- 보이싱 프로그램(Voicing Program): 특정 신디사이저의 음색을 새로 만들거나 편집하는 작업을 컴퓨터를 이용하여 더 효율적으로 할 수 있도록 하는 프로그램이다.
미디 파일 형식
미디 파일 형식은 다음과 같다.
- SMF(Standard MIDI File): 미디 메세지가 컴퓨터 파일로 저장될 때의 파일 형식으로, 정식 명칭이 "표준 미디 파일"이다. 확장자는 *.mid이다.
- RMI(RIFF-based MIDI): 마이크로소프트사에서 지원하며 미디 파일의 단점을 해결하는 형식으로, 미디 파일 내용과 함께 곡에 대한 추가 정보를 기록할 수 있는 형식이다. 별도의 음원을 가지며 미디 파일이 가지는 정보들을 가진다. 이 파일을 재생하기 위해서는 MIDI 장비가 필요하다. 확장자는 *.rmi이다.
- MOD(MODules): 아미가(AMIGA) 시스템에서 개발한 미디용 파일과 같이 음악을 연주하는 사운드 파일로, 샘플링된 소리 데이터들을 소프트웨어적인 방법으로 변형, 합성하여 음악으로 출력한다. 미디처럼 악보 정보를 가지며 또한 WAV 같은 음원도 내장되어 일반 사운드 카드에서 원곡의 재생이 가능하다.