게인과 볼륨디지털오디오의 샘플과 비트에 이어, 이번 시간에는 리플레이게인(Replay Gain)과 K-System에 대해 알아본다

마침 둘 다와 관련깊은 영상이 있으니 보고나서


  
라우드니스 워의 진상을 밝힌 레전드

  
위에걸 더 이해하기 쉽게 새로 만듬



위 두 영상에서 가장 중요하게 다루는 개념은 라우드니스(Loudness)다이나믹레인지(Dynamic-range)클립 디스토션(Clip-distortion) = 클리핑, 압축(Compress), 헤드룸(Headroom)의 다섯가지야

이제부터 하나씩하나씩 다 얘기해줄게

영상에 내포된 맥락이랑 짜잘한 사항들이랑 그것들 이해하기 위해 필요한 사전정보까지 몽땅 다 말로 풀어놓을 계획이니 스크롤 휙휙 내려가면서 아! 내가 아는거다! 싶으면 넘어가라


라우드니스는, 소리가 얼마나 시끄럽게 느껴지느냐는 뜻이고 라우드니스레벨이라는 고유의 단위도 잘 안쓰지만 정해져있다

일단 음량과 동의어로 봐도 좋다

즉 윈앰프나 아이폰 볼륨막대기를 오른쪽으로 밀거나 앰프같은거 다이얼을 시계방향으로 열어서 볼륨을 올리게 되면, 라우드니스도 높아진다는 얘기야

그 라우드니스가 어느 정도인지를 정확히 알기 위해 측정이나 계산같은걸 우리가 할 필요까지는 없고, 지금은 위에 영상에서 음악이 나오며 같이 표시되는 파형의 색칠된 넓이만 봐두면 된다

왜냐하면 스피커에서 소리를 낼 때 유닛의 진동막이 신호의 모양대로 움직이거든

파의 모양이 잔잔하면 진동막도 살살 움직인다는 뜻이고, 높게 확! 치솟았다가 바로 꺼지면 진동막도 그만큼 확! 튀겼다가 잽싸게 있던 자리로 돌아간다는 거다

그리고 전체적으로 뚱뚱하게 부풀어있다면 마찬가지로 소리도 뚱뚱하게 난다

보이는 그대로, 파형의 외곽이 울퉁불퉁 하거나 넓고 크게 일어서 있다면 진동막이 그만큼 활발하게 움직이면서 오래도록 제자리를 벗어나 있게 되는거야

그럼으로써 공기를 더 많이 밀고당기며 더 큰소리가 나는거다

그리고 진동막을 꽉 붙잡고 앞뒤로 흔드는 힘이 바로 앰프에서 보내는 전류에너지이고 도식상 이 전류에너지의 형태를 신호의 전압이라고 해석할 수 있는데, 무슨 말이냐면 라우드니스가 크려면 진동막이 더 바쁘게 더 멀리까지 움직여야 하고 그러기 위해서는 앰프도 더 열심히 힘을 써야 한다는거야

소리의 시끄러운 정도 ≒ 퍼렇게 칠해진 파형 안쪽의 넓이 ≒ 그렇게 하기 위해 앰프가 뱉어낸 에너지의 양 이라 치면 맥락만은 정확하다(사실 대부분의 에너지가 열손실에 의해 날아가며 가장 뛰어난 스피커가 기껏해야 30% 정도의 효율에 불과하므로, 앰프에서 나온 전류에너지와 스피커에서 나온 소리에너지가 같다고는 할 수 없다. 그냥 일단 그렇다고 치자)

라우드니스라는 용어가 있다는 정도는 알았을테니, 이쯤해서 다음 개념으로 넘어가겠다


파의 모양과 끝의 뾰족함 따위는 뒤로 밀어두고, 다음으로 다이나믹레인지

이건 무사히 처리할 수 있는 가장 큰 신호가 잃어버리지 않고 분간해내서 출력할 수 있는 가장 작은 신호와 얼만큼의 차이가 있는지, 가장 작은걸 몇개나 세워올려야 가장 큰거랑 키가 같아지는지, 혹은 가장 큰게 차지하는 영역(Range) 안에 가장 작은걸 얼마나 많이 채워넣을 수 있는지 등의 개념을 가장 큰것과 가장 작은것간의 비율로써 나타내는 표시다

믹서나 스피커나 DAC같은 음향장비라면 그걸로 빼낼 수 있는 가장 큰 신호가 가장 작은 신호보다 몇배나 큰지를, 그리고 레코드판이나 MP3같은 음원매체라면 마찬가지로 거기 저장되는 소리의 가장 큰 진폭한계가 가장 작은 유효 변화량 몇개만큼의 높이와 같은지를 의미한다

달리 말하면 그놈이 얼마나 민감하냐, 혹은 얼마나 작은 신호까지 살려낼 수 있냐는 거다

절대로 다이나믹레인지가 얼마나 큰 소리까지 낼 수 있는지를 뜻하는게 아니야

큰 소리는 단지 앰프의 뿔려주는 능력과 스피커의 변환하는 효율에 달려있을 뿐이다

그런데, 위 영상에서 계속 말하는 다이나믹레인지는 음악의 다이나믹레인지다

노래중에 제일 시끄러운 부분이랑 제일 조용한(어쩌면 소리가 없는) 부분끼리 음량의 대비 내지는 파형 높이의 대비가 얼만큼이나 되느냐 뭐 이런거지

알려지기로는 음악중에 다이나믹레인지가 가장 넓은, 혹은 가장 넓게 필요로 하는게 수십명 이상이 합주하는 오케스트라와 오만 잡소리의 대규모 혼합물인 극장음향이라 하고, 부르다 버리는 일반 가요종류가 가장 좁다고 한다

헤드폰이나 DAC나 음원파일같은거 스펙의 다이나믹레인지가 높을수록 다이나믹레인지가 높은 음악을 보다 정확하게 진짜같이 재생할 수 있다는것도 참고로 알고 있자

그런데, 우리가 즐겨듣는 클럽용 땐싱브금은 지금 얘기하는 음악적인 다이나믹레인지가 돈받고 팔고 돈주고 사는 소비용 음악중에 매우 좁은 편이다

밴드음악 중에서도 락이나 재즈나 컨트리같은거 말고 메탈이나 원조펑크락같이 비교적 사납고 지랄같은 음악도 마찬가지로 평범한 사랑노래나 된장힙합에 비해 다이나믹레인지가 좁다(그런데 얌전한 노래도 덩달아서 다이나믹레인지를 좁히는 추세를 따라간다는게 함정. 그 중에서 특히, 한국 대중음악계의 상황이 현재 세계최고로 암울하다)

왜냐면 이렇게 음악의 다이나믹레인지가 좁을수록 라우드니스를 키우기가 그만큼 수월하기 때문이야

말인즉 보다 강력한 라우드니스를 확보하기 위해 음악적인 다이나믹레인지를 죽인거다

음악적인 다이나믹레인지가 라우드니스를 위해 희생된 이유는 음원매체의 다이나믹레인지에 한계가 있기 때문이고,


그러니까 음악의 다이나믹레인지와 음원매체 혹은 재생장치가 지원하는 다이나믹레인지 한계를 이제부터는 서로 구분해서 생각할 수 있어야 한다

참고로 누구는 음악의 다이나믹레인지를 다이나믹스라고 하더라만은, 그건 음악평론가의 용어이고 지금 할라는 얘기랑은 일단 무관하다


동영상에 보면 라우드니스를 높이기 위해 파형의 위아래 진폭을 늘려보는게 있잖냐

소리가 작은, 즉 진폭이 낮은 부분을 뿔려서 해당 구간의 라우드니스를 키우기 위해 그렇게 한건데, 그 결과 작은 부분은 목적대로 충분히 커졌지만 처음부터 컸던 부분은 너무 커져서 음원매체의 진폭 한계치를 넘어서게 된다

여기서 선택지가 몇가지 나온다

1. 그냥 둠 → 클리핑 발생
2. 압축!! → PROFIT!!
3. 반성한다

2번부터, 삐져나온 부분에 컴프레싱을 걸어버리니까 클리핑도 안 생기고 소리가 작은 부분도 빵빵해지고 아주 좋았더란 말이지

그렇게 좋아서 너도나도 하다보니 경쟁이 붙었다

어떤 경쟁이었냐면, 지 혼자 제일 높게 튀어나온 막대기의 꼭대기만 슬쩍 문질러버리는 식으로 눈치보면서 슬금슬금 컴프레싱을 하다가, 누가 꼭대기를 조금 더 많이 잘라내니까 질세라 나는 조금 더 잘라보고 다른애는 그거보다 더 많이 자르며 RMS를 그만큼 더 추켜올리는 그런거였다

그렇게 잘라낸 길이만큼 파형의 높이를 더 부풀릴 수 있고 결국 라우드니스가 커지는거거든

그러다 보니 톡 튀어나온 부분만이 아니라 어지간치 파형이 높은 구간이면 몽땅 짓누르고 뭉개서 소리가 작은 부분이 음원매체 다이나믹레인지의 바로 밑에까지 차올라갈 정도로 전체가 납작해질 지경까지 왔는데, 이 행위를 일반적으로 민주화Peak Normalization이라고 부른다

컴프레스 처리를 용인할 수준 이상으로 지나치게 많이 적용했다는 견해에 의해 이 꼬라지를 Hyper Compression이라 특정하기도 하고, 컴프레싱의 도가 지나쳐서 숫제 리미팅을 거친 것처럼 수많은 꼭대기들이 나란히나란히 판판해졌고 그게 시간축을 좁혀서 한눈에 보면 네모반듯한 모양같다 해서 Brick-wall Limitation이라고 칭하는 사람도 있다

한편 대응불가피함과 기술진보를 역설하며 이걸 옹호하는 측에 선 사람들(마스터링 엔지니어, 유통사 술상무, 가수 매니저, 레이블 이사)은 좋은말로 Maximization이라고해달라는 듯 하다좆까

맥락은 다를 수 있지만 모두 동일한 것을 가리키는 말이야

여기까지가 바로 소위 말하는 라우드니스 워의 실체야

이 바닥에서 해잡수시는 각계의 잡것들이 더 넉넉하게 더 충분하게 누구보다도 간지터지고 부유하게 해먹으실라고 깝쳐온 십수년의 세월을 겪은 끝에, 상황이 요따구로 되어버렸다

그리고 3번 반성의 결실이 리플레이게인과 K-System이다

유사한 솔루션이 몇가지 더 나와있지만 많이 복잡해서 나부터가 누구한테 설명해줄 만큼 이해를 못 할 뿐더러, 일반 소비자는 알 필요가 없는거다


둘중에 개념이 좀 소극적이고 사후약방문격인 리플레이게인부터 확인토록 하자


하지만 이걸 공부하기에 앞서 조금 얘기했던 다이나믹레인지와 라우드니스에 더해서 데시벨, 피크(Peak), RMS크레스트팩터(Crest factor), 등청감곡선(Equal loudness-curve)등을 또 먼저 이해해야 한다아오 씨발 잘 알지도 몬하면서 설명할라니깐 까마득하네 저거 언제 다 쓰냐

데시벨은, 크기의 단위가 아니라 배율이다

보통 신호의 크기를 잴 때, 엄밀히는 비교할 때 많이 활용한단다

위에 얘기한 다이나믹레인지를 보통 데시벨을 이용해서 파악한다

왜냐면 다이나믹레인지 등의 측정은 결국 먼저 제시된 다른 크기('표준단위' 혹은 '기준점')에 비교해서 지금 알고자 하는것의 크기가 얼만큼인지를 재는 방식이기 때문이야

음원매체나 신호를 처리하는 기계의 다이나믹레인지는 물론이고 소리크기(음압), 전압(전위차), 디지털 양(비트깊이), 전력용량(전압×전류량)등등 어쩐지 오디오질 할 때 중요한 여러가지의 계산을 다 데시벨로 하고있다

그런데 소리크기에 쓰는 데시벨이 다르고 신호의 데시벨도 뭔가 여러가지가 따로 있고 디지털도 데시벨로 보고 라디오전파나 핸드폰전파의 강도도 데시벨로 표시하고 전압 계산할 때랑 전력 계산할 때 적용하는게 데시벨인데 같은 전기이면서도 서로 다르고 같은 분야인데도 기준점을 다른데다 놓으면 비율이 틀어지고 하여튼간 온갖가지에 죄다 갖다붙이고 툭하면 뒤에 단위까지 생략해버려서 마치 진짜 단위인 것처럼 헷갈리는데, 다시 말하지만 이건 단위가 아니다

좀 더 쉽게 이해되도록 비유를 하자면, 1그램짜리 물건 1000개의 무게를 보통 1000그램보다는 1킬로그램이라 말하고, 1미터를 100으로 나눈 길이도 1/100미터나 0.01미터가 아니라 센티미터라고 부르잖아

잘 알겠지만 여기서 그램이 무게의 단위, 미터는 길이의 단위, 그리고 앞에 붙인 킬로는 ×1000이라는 뜻의 배율, 센티는 ÷100이라는 뜻의 배율이다

서로 짝을 바꾸면, 킬로미터는 1미터보다 1000배 긴 길이가 되고, 보다 실용적인 밀리그램에 밀려 안쓰이기 때문에 낮설겠지만 센티그램은 100개가 있어야 1그램과 같아지는 무게가 된다

이렇게 킬로, 센티, 밀리, 메가, 나노등을 단위의 앞에 붙여서 다시 그것의 몇배인지로 쉽게 표시할 수 있는 것처럼, 데시벨도 단위의 앞에 붙이는 배율의 표시야

단, 다른 익숙한 배율은 단위와 숫자의 더하기빼기가 현상에 직관적으로 합치되고 뭐에 갖다붙이든 변함없이 똑같은 반면에, 데시벨 영역의 더하기빼기는 실제로는 곱하기나누기를 의미하는 것이기 때문에 기준과 비율을 각각 얼만큼으로 설정하냐에 따라 배율이 크게 달라지고 어떤 단위(물리량)에 적용하느냐에 따라서도 계산을 달리해야 하기에 결과에 아주 큰 편차가 난다는 차이가 있다

더 어려운 썰이 될 지 모르겠다만, 기존의 단위계 관념은 더하기빼기의 단위에 곱하기나누기의 배율을 얹는 방식이고, 데시벨은 곱하기나누기의 단위에 로그를 걸어서 수량의 자릿수 표기를 꺾음으로써 비율로 나타내는 개념이야

모르는 우리는 그런갑다 하면서 우선은 소리에 대해서만, 아니 그게 아니라 보통들 쓰는 음악파일의 다이나믹레인지라고 하는 96데시벨만 보도록 한다

"그래서 데시벨의 정체가 뭐고 하필이면 왜 96데시벨이냐!?"는 의문은 밑에밑에까지 쭈욱 읽어내려가며 여러가지를 알면서 희미하게나마 풀릴것이고 총정리 비슷한걸 막판에 가서 해볼거니까 일단 참고 진도 나가자(급한 사람은 여기를 참조할 것)


그러니까 의사양반 이게무슨 말이냐면 16비트 WAV나 그거 손실압축한 MP3같은 음악파일에 저장이 가능한 가장 작은 변화량이 만땅 채운 파형보다 아무튼 약 96데시벨만큼 작다는거야(MP3는 손실압축이라 이만큼이나 작은 곡선은 걍 뭉개버리지만 일단은 그렇다 치긔)

96데시벨은 사실 근사치이고, 더 쉽게 이해되는 10진수로 표시하면 (실제로 쓰지는 않는)맨 밑바닥 하나까지 포함해서 65536단계라고 한다(0부터 세기 시작해서 65535까지. 정확히는 그 자신을 포함한 -32768과 32767의 사이)

즉 제일 작은 신호의 진폭을 65536배 키우거나 65536개 쌓으면 한도가 꽉 차고, 그 위에다 한 알만 더 올리면 클립이 되어버리는 거다(자꼬 클립클립 거리는데 뭔 말인가 감을 못잡는사람도 있을까봐 참고하라고 밝히는데, 동사 Clip의 이 때 의미는 우리말 '찝힘'과 어감까지 매우 가깝다. 즉 파형 대가리가 찝혔음=클리핑 정도의 기분으로 받아들이면 딱 맞다)

그냥 뭐가 있긴 있어야 할거같아서 써논거니까 뭔소린가 싶겠지만 이번에도 그런갑다 치고 넘어가라

그니까 누가 어떤 소리를 녹음해서 16비트 스펙의 WAV파일로 만들었어

그런데 16비트 → 한줄로 쌓아놓은 존나 찌깐한거 65536개 = 65535단계 → 약 96데시벨이다

그리고 아무튼 16비트짜리 음원을 갖다가 큐배나 오디션 같은걸로 열어서 파형이 제일 높은데를 위아래 끝에 딱 붙도록 채워서 저장했다고 치는거다

파형중에서 제일 높은 이 부위를 흔히 피크라고 부른다

아무튼 그렇게 저장까지 하고 나면, 한계 끝까지 차있는 피크는 그 WAV파일에 구분되어 저장이 가능한 이론적으로 가장 작은 변화량에 비했을 때 65536배 높은 셈인거잖아

즉 제일 큰 피크의 폭이 제일 약한 신호보다 96데시벨만큼 크다는거다

이렇게 매체나 장비같은거가 지원하는 다이나믹레인지의 한계가 어디까지 닿는지의 스펙을 말 할 때에는, 진짜 아무것도 없어서 0인거 말고 제일 작은 양 한개를 0으로 놓고 그보다 큰걸 위쪽으로 올린다

그리고 이 때 제일 작은 양 한 칸 미만의 디테일은 소실되며, 이렇게 소실될만치 작기 때문에 알 수 없는 높이를 일컬어 노이즈플로어Noise-floor라고 한다

엄격한 디지털의 시각으로써 이걸 부등식으로 표현하면 1/비트깊이≥
노이즈플로어가 된다(아날로그는 칸이 없으므로 이런거 하면 안되지만, 어쨌든 노이즈플로어는 실존하며 개념도 동일하다)

참고로 16비트보다 더 고성능인 24비트의 경우 이론적인 다이나믹레인지가 144데시벨까지 뻗친댄다(실제로는 열손실등의 물리적인 한계로 인해 144데시벨이 다 안 나옴. 이러나저러나 진리는 비싼게 장땡)

근데, 방금전에 0이라고 치자고 했던 가장 작은 변화량을 반대로 만땡크시킨 피크의 1/65536라고 볼 수도 있잖아

그러면 이걸 데시벨 단위에서 -96데시벨로 표기할 수 있다

이 때는 피크가 꽉 채워진 만땅을 반대로 0이라고 한다

이처럼 기준점 잡고 아래로 내려읽는건 음악과 소리를 만들거나 가공하거나 녹음하거나 듣는 상황에서 신호의 크기나 때로는 음량의 크기가 얼만큼인지를, 정확히는 최대치에 비해 진폭이 아직 얼마나 작고 그래서 여유공간은 얼마나 남았는지를 확인해놓고 안심하기 위해 취하는 방식이다

이거 얘기를 할 때 혹시 듣는 사람이 다른거랑 헷갈릴까 싶다면 뒤에 FS를 붙여준다

FS는 (채울 수 있는 )최대한의 범위라는 뜻인 Full-Scale의 이니셜로써, 16비트의 환경을 기준으로 위아래 높이가 다 차있는 만땅이 0데시벨FS, 제일 작은 한 칸은 약 -96데시벨FS로 표기된다(한 칸보다 작은 영역이 방금 나왔던 노이즈플로어. 그래서 전압의 강도를 수량으로 해석한 디지털 데이터에선 0칸이란게 있을 수 없다. 프로그래밍에서도 1이 가장 작은 값이고 0은 보통 무한대, 무효, 해당없음, 정의되지 않음 등을 의미함)

24비트짜리도 마찬가지로 제일 작은 한 칸이 -144데시벨FS가 되고 최대치가 0데시벨FS이다

그런데 여기에 알 필요는 없지만 헷갈리는 일은 더더욱 없어야 하는 문제가 하나 있다

알 필요가 없다는 말은, 16비트도 읽을 수 있고 24비트도 읽을 수 있는 일반 감상용 홈오디오기기는 16비트의 0데시벨FS와 24비트의 0데시벨FS를 동일한 기준이자 똑같은 음량으로 표현하도록 만들어졌기 때문에근데 이 기능 없이 아무렇게나 처리시키는 장치도 가끔 있음 그걸로 음악을 그냥 듣기만 할 사람은 볼륨다이얼을 편한 위치에 고정하면 만고땡이란 의미다


니가 음악들을 때 쓰는 아이폰이나 DAC나 사운드카드나 윈도우 볼륨믹서나 알송이나 텔레비전등에 달린 볼륨의 역할은, 안에서 할거 다 끝마친 후에 너 들으라고 내보낸 신호의 자체적인 최대치를 얼마나 줄일지를 정하는 것 뿐이야

참고로 이 때 최종으로 합쳐서 내보낸 신호를 Program(방송의 프로그램과 컴퓨터 실행파일의 프로그램도 이것과 똑같은 개념. 줄여서 PGM으로 쓰기도 함)으로 부르고, 이것의 크기를 도로 줄이는 일을 Trimming이라고 한다
(근데 이 두가지 명칭은 점차 안쓰는 추세)

Trim이후의 그야말로 최종신호인 '프로그램 시그널'이 앰프와 스피커를 거쳐 우리 귀를 향하는거고, 이 소리(의 크기)가 바로 볼륨이다


즉 어디로 보내는 신호강도를 조절하는건,
꽉 막았거나 또는 아예 켜지 않아서 아무것도 안 나오는게 디폴트이자 최소인 0점(굳이 말 하자면 0데시벨)이며 이걸 높임으로써 게인을 더하(+)는 것이므로 게인, Gaining이 되고,

이제 소리로 바꿀 일만 남은 맨 막판의 합산신호의 조절에 관해서는,
반대로 
최대로 다 풀어놓은게 기본위치 0점 0데시벨이고 이걸 줄이(-)기 때문에 트림, 트리밍이라 부르는 거야

만약 다이얼을 왼쪽 끝까지 죽였는데도 소리가 실실 샌다면 그 안의 부품은 게이닝이 아니라 트리밍을 하라고 돼있는거고, 감상용 오디오의 사용자가 조절하는 볼륨이라면 이게 정석이다만 듣다가 확 돌려서 소리를 끌 수가 없다는 불편함이 있기에 이렇지 않은것이 많고, 상관없다(이 경우 대부분 옆에 음소거단추도 같이 있음)

한편 DJM은 트림이라 새겨놨지만 동작방식은 게이닝이기에 왼쪽 끝의 0점이 '입력 없음' 내지는 '완전한 차단'을 의미하는 
-∞이다

그리고 옆에다 레벨로 표기해둔 Xone은 트리밍으로 동작하며, 이는 12시 방향이 ±0의 0점(유니티게인), 왼쪽 끝은 -n, 오른쪽 끝에는 +n으로 표기된 것을 보아도 알 수 있다(싸구려 and/or 초심자용 몇종류는 예외로 파이오니어처럼 만들어졌다. 아마 그거 기안서 올라왔을 때 반발이 심했을 듯)


양쪽 다 나름의 철학이 있어서 그런거야

이것도 어차피 혼자 듣는데 쓰든 남들 들려주는데 활용하건 실 사용에 영향을 주는 차이는 아니다

DJ믹서 말고 믹싱콘솔의 채널의 경우, 물건이 비싸질수록, 제조사의 역사가 오래일수록 후자의 방식이 많은 경향이지만 전체로 보면 대략 반반비율인 것 같다


좌우간그리고 헷갈리면 안된다는 말은 24비트의 0데시벨FS와 16비트의 0데시벨FS에 각각 해당하는 신호규격, 즉 게인(전압)이 본래부터 서로 다른 것이기 때문이야

일반 감상용 기기중에도 24비트나 그 이상까지 다룰 수 있도록 만들어진게 많이 있기는 한데, 그게 사실 내부적인 신호계산을 그만큼 더 정밀하게 해서 (동등한 음량 하에서의, 또는 음량이고 나발이고간에 아무튼 )해상도의 메리트를 취하여 음질을 제고하기 위해서일 뿐, 16비트보다 폭넓은 비트깊이 포맷의 운용에 사용하자고 따로 제정해둔 전송신호의 전압규격과는 무관하다(XLR 출력단이 달려있다면 얘기가 달라진다. 하지만 그런 물건은 니가 사서 잘 쓰고 있더라도 애초에 일반 감상용으로 만든건 아님)

그래서 우리가 MP3를 들을 때와 음악CD를 들을 때와 어디가서 다운받아놓은 앨범 하나당 3기가짜리의 24/96 초고해상도 음원을 들을 때 약간의 음질차이만 느끼거나 느끼지 못할 뿐 따로 복잡한걸 조정해야만 하거나 문제를 겪지 않는거야

하지만 듣고 땡인게 아니라 보다 높은 비트깊이 환경과 프로용 기기를 적극적으로 활용해서 작편곡을 비롯한 어떤 음악이나 음향적인 작업을 하고자 한다면, 민망한 상황을 피하고 기분좋게 일하기 위해서라도 이 문제를 정확히 인식하고 있어야 한다

일단, 24비트의 신호규격과 다이나믹레인지가 16비트보다 넓긴 넓은데, 이게 도표상으로 위로도 넓고 아래로도 넓다(이렇게. 참고로 왼쪽 셋과 오른쪽 셋은 서로 상관없긔!)

아래로 넓다는건 24비트의 깊이단계가 더 많으므로 구분해서 저장이 가능한 가장 작은 변화량의 한 칸이 16비트쪽의 그것보다 훨씬 더 작다는걸 이해할 수 있다면 비슷하게 유추해낼 수 있다

2진수의 자릿수인 비트가 하나씩 늘어날 때마다 저장이 가능한 가짓수가 2배씩(2^1=2) 늘어나는데, 이걸 대충 6데시벨만큼 단계가 많아진다고 정의하거든

그러므로 비트가 하나씩 늘 때마다 구분칸의 밀도도 그 정도로 촘촘해지는 식인데, 얘네 둘간에는 8비트의 차이가 있잖아


그래서 만약 양쪽의 0데시벨FS의 게인을 똑같게 환산한다면, 16보다 8이 많은 24비트가 48(6×8)데시벨(2^8=256배) 더 촘촘한 만큼 최소의 한 칸도 48데시벨만큼 더 작은(1/256) 셈이 된다

마찬가지로 16비트는 8비트보다 256배 촘촘하고 32비트도 데이터 상으로는 24비트보다 256배 더 촘촘하다

그런데 위로 넓다는건 뭘까?

이건 약간 더 복잡하다

똑같은 장치의 똑같은 설정으로 만들어낸 신호파를 잡아서 그대로 디지털에다 저장했다고 일단 가정하자

그리고 그걸 증폭을 하다보면, 언젠가는 피크가 클리핑 직전의 한계선에 닿을거란 말이지

그런데 이렇게 되기 전까지 가능한 증폭비가 24비트일 때 더 높다

그 차이만큼 24비트의 구조에 담을 수 있는 소리의 최대치가 더 크다는거야

그러니까 정확히 계산을 해보면, 실제로는 24비트의 최소단계가 16비트보다 48데시벨만큼 더 촘촘하기 때문에 최소치도 48데시벨만큼 더 작지는 않다는 말이 된다

24비트의 규모는 16비트를 그대로 48데시벨만큼 더 잘게 쪼갠것과 같지 않다



그래서, 16비트의 폭을 꽉 채워서 24비트 규격의 기계에 쌩으로 입력하면 증폭이든 감쇠든간에 더 해볼 여지가 좀(많이) 남게 되고, 반대로 꽉 찬 24비트의 출력신호를 16비트만 먹을 수 있도록 만든 DSP의 아날로그단에다 우겨넣으면 극소영역의 소리에는 별 일이 없다 치더라도(사실은 수십칸씩 합쳐서 뭉뚱그리므로 별 일이 있긴 함) 위로 삐져올라온건 무자비하게 클리핑 당한다

게다가 AD/DA변환기를 통해 현실의 전압으로 바꾸어서 전송할 때에만 이러는게 아니고, 환산테이블을 경유하는 일종의 보정을 중간에 가하지 않는 한은 프로세서의 연산을 통한 디지털데이터 끼리의 직변환도 근본적으로 마찬가지라고 한다

하드웨어 입출력단 매칭의 실수로 이러는 일은 그리 많지 않은 것 같고(로우파이라는 장르 내지는 메타장르에서는 일부러 이런 종류의 작업을 하는 경우가 있음), 팔 물건을 16비트로 뽑더라도 각종 작업은 높은 비트깊이 하에서 하는게 음질에 유리하다는 카더라에 혹해서 그대로 그냥들 덤볐다가 피본 소수의 사례가 대부분인 것 같다

근데 내가 이론서만 읽고는 상상하고 있을 뿐이지 DAW깔아서 뭘 해본적이 없어서 모르겠지만 분명히 비트깊이 바꾸려고 할 때 어떻게 할거냐고 물어볼거고 기본은 꺼진 상태일거야

좌우간 오늘도 내일도 24비트랑 씨름할 니네를 위해 실질적인거 한가지만 알려주자면, 피크가 -12데시벨FS만 안넘게, 아니 그보다 몇칸 더 낮도록 짜맞춰라

그 후에는 호갱호갱거리며 콧물바른 삥을 마스터링 훃아한테 두둑하게 털려드리고 담배불도 붙여드리고 한모금 빠신 후 헛기침소리 들릴 때 짜져드리는 정도의 간단한 일만 남는다돈 버리는 방법도 가지가지


아유 난 항상 이렇게 본론은 몇마디 없고 딴얘기로만 똥을 싼다 대충 뭐 그렇다 하고 다음은 RMS

저 위에 써놓은 넓이어쩌고랑 라우드니스 기억나지?

그거랑 상당히 관련있다

왜냐면,



이렇게 RMS값을 높이로 하고 일정한 시간을 넓이로 삼은 네모칸의 넓이가 같은 시간동안 움직인 파형의 넓이랑 같기 때문이야

위 그래프에서 연두색의 RMS×한 사이클짜리 네모랑 그 옆에 파란색으로 된 사인파 한 사이클어치의 두 조각넓이가 실제로 같지는 않지만, 전기의 개념에서는 똑같은 양으로 간주된다(파란색의 넓이를 곧이곧대로 적분해버린 산술평균은 RMS와 대략 비슷하고 약간 작다. 이 수치는 전기설비랑 무선전파 분야에서나 어쩌다 필요한 것 같음)

즉 같은 시간동안의 에너지라는 조건 하에 파형 안쪽 넓이 ≒ 라우드니스인데, RMS에너지 = 파형 안쪽 넓이 이니까 RMS에너지 ≒ 라우드니스가 되는거다

조금 더 얘기하자면, 실제의 음량은 RMS에너지보다 대애충 0.89배 정도 작다고 계산된다고 한다

그러나 값에 격차가 있기는 하되, RMS의 양에 변화를 주었을 때 라우드니스가 바뀌는 비율이 똑같으므로 반드시 정확한 숫자를 알아야만 하는 연구자나 설계자쯤 되지 않는 한은 그냥 같다고 쳐도 아무런 문제가 없을거다(차이의 발생은 여기에서 설명하는 현상으로 인한 것 같다. 읽어봐도 이해 안되면 그냥 넘어가도 무방하니 돈케어비해피)


하여간에 꼭 같기만 한건 아니지만 거의 틀림없게 맞아떨어지고, 라우드니스 외에는 앰프 전력용량 산정의 기준점으로 활용하기도 한다(지속적이고 존나게 큰 최대출력의 유지를 견야 하는 대규모 공연장에서는 주어진 스피커시스템에서 필요 라우드니스가 나올 수 있도록 하는 RMS의 3~4배 또는 그 이상으로 앰프용량을 책정하고, 홈오디오는 RMS기준 1.5~2.3배 정도를 권장)

그리고 RMS값은,


이런 범하고 싶을 정도로순결한 사인파에 한해 피크값에 약 0.707을 곱해서 구할 수 있다

곱하는 수는 왜 하필 0.707이고 다른 형태의 파에는 얼마나 곱해야는지 등등이 궁금해서 미적분이랑 삼각함수 같은거 파고들어봐야 대가리 안에서 클립이 나거나 다 알고나서 걍 허탈해지거나 둘 중 하나니까 여기까지만 알아놓자

전기전자나 음향분야에서 자격증이라도 딸게 아닌 한은 저런 그래프에 곁들여나오는 공식도 알 필요 없으니까 편하게 넘어가도록

아무튼 RMS도 뭔지 알았겠다, 다음은 크레스트팩터다

Crest가 고깔, 볏, 최고점, 꼭대기 등등의 뜻이거든

크레스트팩터라는 용어는 그러므로 얼마나 뾰족한지, 얼마나 날카로운지, 얼마나 삐져나왔는지를 나타낸다

우리말로 순화하면 뾰족도나 뾰족계수 정도가 좋지 않을까?

근데, 이거 사실 RMS의 역수야

파형이 얼마나 튀어나왔고 나온게 얼마나 들쭉날쭉한지를 판단하라는 기준 자체가 RMS값 높이의 평면이다

보면 초록색 RMS값의 높이가 빨간색 사인파의 꼭대기보다 낮잖아

하지만 반대로 사인파의 꼭대기는 RMS보다 높고, 대략 삐죽하게 튀어나온 형태라고도 말 할 수 있지

그래서 사인파에 대한 RMS인 0.707의 역수인 약 1.414가 RMS의 직선에 대한 사인파의 크레스트팩터가 된다(왜 1.414인지는 여기에서)

그리고 이곳에 가면 사인파 말고 다른 종류의 신호 몇가지에 대한 크레스트팩터랑 RMS를 확인할 수 있으니까 잠깐 보고온다

그 중에서 막 복잡한거는 넘어가고, Square Wave(사각파)랑 Triangle Wave(삼각파)만 일단 확인한다

보고와


왜 하필 이 둘이냐면 얘네들 파형이 음악을 만들 때 유용하게 쓰이기 때문이야

이놈들은 우리가 특별히 즐겨듣는 일렉트로, 트랜스, 덥스텝등의 댄스 내지는 전자음악에 반드시! 무조건! 들어간다


사각파는 움직임이 앗쌀하게 뚝뚝 제껴지느라 파형이 네모낳다

이놈의 크레스트팩터가 1인건 머리통이 RMS 위로 전혀 튀어나오지 않았다는 의미이고, 그 역수인 RMS가 1인것도 신호의 피크랑 RMS값이 똑같다는 뜻이다

즉 사인파와 사각파의 피크높이가 같을 경우 사인파쪽의 RMS가 0.707배만큼 적고, RMS와 라우드니스가 대략 같은거라고 했으니까 사인파의 소리가 0.707배만큼 작게 들릴거다

또한 앰프가 공급하는 신호의 전력량도 사인파쪽이 사각파보다 0.707배 적거나 사각파가 사인파보다 1.414배 많을것으로 예측할 수 있겠지

반대로 둘의 RMS가 똑같다면, 사각파의 피크가 사인파보다 0.707배만큼 낮겠지만 RMS는 같다고 했으니 소리의 크기를 의미하는 라우드니스도 같게 나온다

그 다음에 삼각파는 +와 -의 두 피크간의 최단경로인 직선으로 움직이는 신호인데, 딱 생긴게 얄팍하고 뾰족한 것에서 알 수 있듯 사인파에 비해 RMS가 약간 작고 크레스트팩터가 약간 크다

사인파와 사각파의 차이만큼은 아니겠지만, 필시 사인파보다 같은 피크에서는 작게 들리고 같은 RMS에서는 피크가 더 높을거야(반면에 사각파와 삼각파의 음색은 사인파에 대해 서로 닮았다. 왜 그런지는 밑에서)

그래서 여기까지 횡설수설한걸 좀 짧게 정리하자면,

1. 라우드니스는 실제 체감되는 시끄러움의 정도를 뜻한다
2. RMS값은 시끄러움의 정도인 라우드니스와 상관성이 졸라 높아서 같다고 치기로 하자. 방에 혼자 숨어서 듣거나 만들 때에는 그대로 대입해도 되겠다만 뭐 따질 필요는 없다
3. 파형이 둥글넓적뚱뚱해질수록 RMS값과 피크가 서로 가까워진다 = 크레스트팩터가 최소값인 1로 접근한다
4. 그러니까 파형을 최대한 너부대대뭉툭하게 만들면서 그 피크를 다이나믹레인지의 끝장까지 채워올리면 RMS 및 라우드니스도 피크에 뒤따라서 끝장에 더더더 가까워질 것이다
5. 파형이 얇고 뾰족한 형상이라면 피크의 높이에 비해 RMS값이 적다 = 크레스트팩터가 크다
6. FAIL!!
7. ???

정도가 되겠다

이제 위에서 봤던 영상의 논지를 따라, 음악산업계에서 무슨 일이 벌어졌었는지 다시 확인해본다

1. 음향학자&심리학자&생리학자 曰 "사람은 똑같은 소리라도 어느 정도 더 크게해서 들으면 더 선명하게 인식한다. 음악소리가 약간 더 커지면 음질이 좋아진 것처럼 느낀다"
2. 그래서 저작자는 내 노래가 다른이의 것보다 돋보일 수 있음이 확실하다면 나는 더 크게 만들겠다는 각오를 한다
3. 크게 만들어 보앗다welcome to the new world illin' asshole!
4. 다른놈이 더 크게 뽑아서 나는 더더 크게한다
5. !!?!
6. 그 결과, 새로 나온 음악일수록 더 시끄럽다
 → 라우드니스가 더 높다 ↔ RMS가 더 높다
7. 하다보니까 파형의 피크가 음원의 0데시벨FS에 닿아버렸음. 더 올리면 소리 으깨지긔 ↔ 클리핑!
8. 성가셔서 피크를 뭉개보앗다(압축). ㅎㅎ조금 더 올릴 수 있겠군 → 라우드니스와 피크의 격차(Peak-Loudness Ratio; PLR)가 줄어들었고, 라우드니스를 그만큼 더 키웠음
9. 피크를 더 뭉갰다. 다시 조금 더 올릴 수 있겠군 → PLR이 더 줄어들었다. 라우드니스를 또 그만큼 더 높일 수 있게 되었음
10. 라우드니스의 수위가 계속해서 올라간다. PLR도 점차 줄어든다
11. 뭉개는걸론 답이 안 나온다. 대패! (리미트)

2번부터 10번까지의 경과 및 11번의 현재가 대략 이런 식이라고 한다

참고로 바로 위 링크에서 다이나믹레인지라고 나와있는게 정확히는 PLR이고, 저걸 음악소리가 아니라 신호로 간주하면 크레스트팩터다

즉 음악신호에 한해서는 PLR과 크레스트팩터가 같은 말이다

하여간에 치킨레이스스러운 저 짓거리가 한 2002년쯤 되어서는 약간 주춤해졌는데, 왜냐면 기술수준이 완숙기에 접어들어서 더 나가버리면 레알 파탄이 날 지경에 도달했기 때문이야

그러나 경쟁의 열기가 진정되었다 뿐이지 엄연히 현재진행형이다

200초 내외의 노래 한 곡 안에서 수천수만개씩 나타나는 파 꼭대기들의 높이를 모조리 획일화한 채 그 모두를 0데시벨FS에 정확히 갖다붙이고, 음악이 음악같게 들리는 한계까지 PLR을 좁혀서 라우드니스를 극대화 시킨다는 개념이 이제는 누구에게도, 아무것도, 전혀 이상하지 않은 현실로 고착되었고,

녹음실, 음반사, 유통사, 방송국 등에서 근무하는 기술 실무자와 의사결정을 위임받아 행하는 임원진, 그저 
순진한 아티스트, 그리고 음악산업에서 가장 중요한 다수대중의 소비자 모두가, 마치 태초부터 이래왔던 것 마냥 믿음을 수용하고 있다

비관적이지만, 2000년대에 접어든 이후의 모든 하루하루를 매일 반복되는 지옥의 나날이라고 생각 하는것도 그리 틀린 말이 아니야

널리 만연한 MP3같은 손실압축에 의해 본연의 음색이 들릴 듯 들리지 않을 정도로 상해버리는 것도 세태에 한몫한다

그런 와중에, 강력한 라우드니스는 물론이고 라우드니스의 확보를 위한 피크 뭉개기 = RMS의 강화를 위한 크레스트팩터 좁히기 작업중에 피치못하게 발생하는 부산물인 클립왜곡에 준하는 유사한 양상의 왜곡 내지는 명백한 클리핑 그 자체가 주요 세일즈포인트인 몇몇 장르는 2000년대 중후반들어 오히려 전쟁을 본격 시작한 판국이고, 심지어는 거칠은 음색과 PLR의 좁은 폭이 해당 장르(익스트림메탈, 노이즈뮤직, 일렉트로팝과 그에 영향을 준 메인스트림 일렉트로하우스 및 미국덥스텝, 피짓하우스, 싸이트랜스, 실험음악 등)의 작법과 기교의 발달을 앞에서 끌어당기는 요인이 되고 말았다

이 때, 리플레이게인이 등장한다


정확히는 2001년에 처음 제창된거다

리플레이게인(글자가 많으니 이제부터 RG로 쓰겟슴)은, 기왕 이렇게 되었으니 각 음반의 피크 최대치나 피크와 음량의 격차는 어쩔 수 없다 치고 음량이나마 일정하게 붙잡아서 찻잔 속 평온을 구하자는 발상으로 개발된 기술이야

그 일정하게의 기준은 16비트 기준으로 83데시벨RMS이고, FS대비 역수로 쓰면 -14데시벨FS이다

하필 왜 저기로 하자고 정했냐면, 이거 개발한 사람들이 음악의 이상적이며 전형적인 PLR을 14데시벨로 판단했기 때문이야

실제로 1980년대 후반까지는 메탈, 컨트리, 포크락, 빌보드 댄스, 테크노, 뉴에이지 인스트루먼틀, 가스펠, 재즈, 오페라 등등같은 장르의 여부와는 상관없이 널리 보급되었고 많이 팔리고 크게 사랑받는 음악이라면 PLR이 14데시벨에서 크게 차이나지 않았었고, 시중에 유통중인 모든 음악의 크레스트팩터 평균도 역시 14데시벨에 대체로 수렴했다

그래서 파형의 크레스트팩터가 몇이든지간에 신경끄고 일단 RMS를 -14데시벨FS로 붙잡아놓으면 PLR이 14데시벨이리라 가정된 보편적인 음악의 피크가 0데시벨FS의 한계를 넘기지 않으리라는, 그러면서 음원의 한정된 다이나믹레인지와 시스템의 충분치 못한 증폭량 및 정밀도까지 감안하여 신호대잡음비와 해상도도 나름 유지할 수 있는 최대한의 게인의 확보가 가능하게 되리라는 뜻이었던 것이지

이런 식으로 PLR의 디테일이 온전히 살 수 있도록 RMS나 그 비슷한 뭐든간을 좌우지간 일정하게 내리눌러서 0데시벨FS로부터 멀어지게 하는 것을 라우드니스 노멀라이즈, 또는 RMS 노멀라이즈라고 부르고, 이 때 게인을 내린 폭, 음악의 평균 RMS(영역)에서 0데시벨FS까지의 거리, 또는 대부분의 피크가 분포한 대역과 0데시벨FS간의 거리를 헤드룸이라 부른다(엄밀한 기술적 의미에서는 세번째만 헤드룸임)

RG는 아예 초장부터 음원에서 14데시벨 어치의 일종의 헤드룸을 마련하도록 하는 라우드니스 노멀라이즈다

여기까지는 존나 합리적이다

그리고 음량을 기준으로 하쟀으니 사람 귀가 소리를 감지하는 패턴에 대한 연구결과도 함수에 반영하기로 했다

스피커랑 헤드폰도 보면 응답특성이란게 있잖아

소리내는 유닛과 반대로 소리를 받도록 동작하는 마이크도 마찬가지로 주파수응답의 특성이 있고, 마이크와 역할이 똑같은 우리의 귀 기관도 그렇다

RG를 개발한 사람들은 물론이고 음향이론을 연구하는 학자들 모두가 가장 중요한 탐구대상으로 삼는게 바로 사람의 청각능력이야

만약 사람의 귀가 소리의 음고(주파수)를 바꿀 때마다 그것의 크기 또는 강도를 다르게 받아들인다면, 내지는 느끼는 민감도가 달라진다면, 그 정도와 양상을 파악하는 것이야말로 들리는 주파수 대역의 전체에 걸쳐 의미가 담겨있는 '음악'의 라우드니스에 대한 RG의 설정치와 실효성의 관건일 수밖에 없겠지

그걸 연구하고 실험하고 정리해서 한눈에 파악할 수 있도록 그래프로 그린게 바로 등청감곡선이다


대충 뭐 이런거

이게 뭔지에 대해서 꼬치꼬치 깊이 따질건 없고 이미 한글로도 많은 분들이
이런 식으로 정리를 해두셨으니 개괄은 생략하되, 기존의 글에서는 대체로 그냥 지나간 부분만 보충을 해볼란다

먼저 이 그래프의 세로축에 있는 데시벨은 음압의 단위인 데시벨SPL(Sound-Pressure Level)이긴 한데 다짜고짜 소리의 크기가 아니라 귀의 민감도를 의미하는 데시벨SPL이다

뭐에 대한 민감도냐면 단일 주파수의 사인파에 대한 민감도인데, 이 사인파가 느껴지는 크기를 단위화해서 phon으로 쓰자고 합의를 보고 1000Hz일 때의 데시벨SPL과 phon의 크기를 맞췄다

즉 1000Hz일 때에만 phon과 데시벨SPL이 똑같다

그리고 0은 소리(압력, 진동)가 아예 없어서 0인게 아니라 이보다 작아지면 우리의 귀가 들을 수 없다고 0으로 하자고 정한거야

즉 사람 청력의 노이즈플로어다

따라서 0phon곡선 아래의 영역(주파수×음압)에 있는 소리는 통계적으로 사람의 귀에 전혀 감지되지 않는다

1000Hz에서 주파수를 조금 올렸더니 0phon의 선이 0데시벨SPL보다 낮아진건, 그 주파수의 소리를 사람의 귀가 1000Hz보다 더 민감하게 느낀다는 의미다(참조 - 음량 자체와 그 변화의 정도가 주파수마다 다르게 느껴지는 이유)

그러니까 같은 데시벨SPL로 느껴지는 소리라 하더라도 주파수에 따라 그걸 내기 위해 들인 에너지의 양이 다르다

위 그래프를 이리저리 읽는 구체적인 요령은 바로 위의 링크에 아주 간단명쾌하게 설명이 되어 있으니까 그대로만 외우면 될것이고 더 궁금하면 더 찾아보세요


그런데, 그래프를 보면 위로 올라갈수록, 즉 에너지가 강해질수록 선이 점차 평평해지잖아

0, 50, 110phon곡선의 100과 3400Hz의 점 사이에 쳐놓은 자주색 선에 주목


이렇게

그리고 더불어서 비교적 민감한 한 600에서 6000Hz정도의 사이에 있는 소리의 phon곡선은 데시벨SPL과 사실상 같은 간격을 두고 있지만 그보다 덜 민감한 음역은 phon곡선끼리 다닥다닥 붙어있는 것도 알 수 있다


이걸 종합해보면, 우리의 귀는 느낌 자체가 통 안오는 소리에 대해서는 크기변화의 정도도 마찬가지로 덜 민감하게 느낀다는 결론을 얻을 수 있다

따라서 가청주파수 거의 전체에 걸쳐 다양한 주파수가 섞인 소리의 꾸러미를 음량을 달리하면서 듣게 되면, 예를 들어 음악을 틀어놓고 그대로 볼륨을 올리게 되면, 우리의 귀가 그 자체를 민감히 느끼는 음역에 속한 소리의 경우 바뀐 양이 얼마나 되는지에 대한 느낌도 역시 명확하게 인식할 수 있고, 그 명확함의 정도는 출력장치에서 바꾼 만큼의 그대로에 거의 근접한다

반면 우리의 귀에 동등한 에너지에서도 비교적 작게 들리는 둔감한 소리는 볼륨이 좀 올라갔건 내려갔건 신경이 덜 쓰인다

특히 왼쪽 저주파영역의 끝에 가까운 30Hz에서는 초장부터 
0phon곡선이 60까지 올라간 상황인데, 여기에 무슨 의미가 있냐면, 30Hz의 소리는 그걸 만들기 위한 에너지가 1000Hz에서의 60데시벨SPL에 상당하는 수준이나 되어야 우리 귀에 겨우 들릴똥말똥하고 거기서 10이나 20데시벨SPL쯤 크기를 키워봐야 민감한 영역에서 3~4데시벨SPL 정도만을 살짝 바꿨을 때 느껴지는 정도와 비슷할 적은 차이만을 겨우 알아챌 수 있다는 거야

그래서 위에 종합을 컴프레스요약하면,

1. 각각 동일한 에너지로 가청대역 전체에 걸친 소리를 만든 후 섞어서 동시에 내면,
         600~7000Hz정도의 소리가 가장 잘 들린다
         주파수가 600Hz에서부터 낮아질수록 들리는게 점점 작아지다가 20Hz 근처쯤에 가서는 완전히 안들린다
         7000Hz보다 높은 음도 주파수가 점점 더 높아져감에 따라 작아지다가 20000Hz쯤에서 결국 들을 수 없게 된다
2. 1번의 소리를 전체적으로 보다 키워서 내보내면,
         이전과의 음량의 차이는 600~7000Hz에서 가장 잘 느낄 수 있다
         그에 비하면 별로 커진 것 같지 않지만, 그래도 좀더 낮은 소리와 좀더 높은 소리까지 잘 느껴지긴 한다
3. 1번의 소리를 줄이면,
         들리는 대역이 끝에서부터 점차 줄어든다

정도가 된다

혹은 전반적으로 큰 음량에서는 폭넓은 음역의 소리를 대체로 다 들을 수 있지만 볼륨을 줄이면 가운데의 좁은 음역만이 들릴 정도로 남는다고 할 수 있고, 반대로 작게 듣다가 볼륨을 크게 키우면 좀전까지 들리지 않던 더 낮은 소리와 더 높은 소리까지 인지가 된다고도 할 수 있다

그런데, 상술했듯 음악은 가청대역 (거의)전체에 걸쳐 다양한 소리들이 함께 있는 일종의 혼합물이다

그래서 특정한 볼륨으로 들어보며 여러 악기들의 비중이 적당하도록 맞춰둔 음악을 만들어진 그대로 즐기기 위해서는 만들 때 정해놓은 그 볼륨으로 틀어야 하는데, 특별히 어떻게 해야겠다는 의도나 기준이 없는 한은 작곡가와 엔지니어가 녹음실에서 작업(마스터링)하면서 듣던 볼륨이 감상에도 가장 적합할 것이라고 미루어 짐작할 수 있다

왜냐하면 이걸 지나치게 작게, 혹은 만들 때의 음량에 비해 작게 들으면 귀가 민감하게 감지하기 때문에 등청감곡선이 아래로 쳐져있는 대역에 속한 목소리나 멜로디악기같은 일부의 소리만 살아남아서 들리게 되기 때문이야

그리고 반대로 매우 크게, 내지는 만들 때의 음량보다 크게 키우면, 증가폭은 비교적 좁지만 음역의 아랫쪽 끝과 윗쪽 끝에 자리한, 등청감곡선이 위로 올라가있는 대역의 소리는 결국 그만큼 상대적으로 더 많아지는 반대의 상황이 된다

적정범위를 벗어난 음량 가청대역 끝의 소리가 들리거나 들리지 않는 원인이기도 하지만, 그보다는 음악이 가장 듣기좋도록 조정된 대역밸런스를 망치게 된다

그래서 음악을 크게 듣든지 작게 듣든지에 상관없이 일정한 대역밸런스가 유지되도록 하는 꼼수가 개발되었는데, 그걸 Loudness control, Tone control, Loundness contour 등으로 부른다

맨 위에 플랫은 미적용. 라우드니스 컨트롤을 가할수록 중역과 그 이상이 작아진 결과 저음의 비중이 늘어난다

마찬가지. 돈샤리가 대세인 요즘과 달리 왕년엔 미드하이를 키워듣는게 유행이엇슴

베이스는 크게 변하고 하이는 비교적 조금만 조절되는 모습

베이스 에너자이저! 부왘!



대략 이렇게, 우리 귀가 둔감한 음역만을 덜 들리는 만큼 더 증폭한다 = 전반적인 음량의 변화와 별개로 저음역의 양은 항상 거의 비슷하게 유지된다(또 참고로, 대중적인 판매량을 중시하는 헤드폰 및 스피커 제조사가 대체로 저음만 과하거나 소위 말하는 돈샤리형의 제품만 주구장창 내놓는 이유가 마찬가지로 등청감곡선의 원리 때문이다. 한마디로 덜 들리는 대역의 소리를 미리 키워서 작은 볼륨으로도 생생하고 빠방하게 들을 수 있게 하기 위함임)

on/off나 몇칸의 단계를 제껴서 고를 수 있는 스위치나 돌려서 맞추는 다이얼 형식의 라우드니스 스위치를 볼륨 옆에다 붙여놓는 식이다

작게 듣고 싶을 때에는 라우드니스를 강하게 먹여서 음량은 조용조용하지만 저음만은 두툼하게 나오도록 하고, 크게 키워서 들을 때에는 라우드니스를 약하게 적용하거나 아예 꺼서 그대로의 배합비로 출력시킨다

고물처럼 생긴 빈티지 기기에는 십중팔구 이게 있지만 요즘에 나오는 신형은 대개 볼륨회로 안에다 기능을 내장시켜서 크게 틀면 알아서 그냥 두고 볼륨을 줄이면 줄인만큼 저음만 도로 뿔려준다

이런걸 하기 위해 따로 빼놓은 상자가 바로 프리앰프야

신호를 받아서 뭘 어떻게 조절한다는 의미에서 프리앰프를 컨트롤앰프라고 부르기도 한다

그리고 요새는 더 씐나게 들을라고 곡마다 장르에 따라 바꿔 적용해서 특색을 강조하는 걸로 아는 사람이 더 많은 이퀄라이저도, 애초에는 이런식으로 대역밸런스가 틀어지는걸 보상해서 매번 더 일정하고 정확하게 듣을 수 있도록 개발된거야

그리고 RG와 K-System이 여러가지 음악을 사람이 들을 때 같은 음량으로 느껴지도록 하는 것은, 적용의 대상과 방식은 위의 라우드니스 컨트롤과 다소 다르지만 이론적인 바탕이 같다





























































그러나 이들이 무엇을 하건 괘념치 않는 이들이 있었으니, 바로 음반제작자


사실 2001년 당시기준으론 14데시벨의 PLR도 이미 옛날얘기였다

컨셉부터 조용조용한거라 라우드니스에 대해 미련없이 만든게 잘해봐야 12데시벨, 대중적인 팝댄스 및 밴드음악은 7데시벨쯤, 선구자(?)들은 그 무렵 이미 3~4데시벨의 크레스트팩터를 달성한 상태였단다

저런 음악들은 그래서 RG의 조정으로 RMS가 동등해지고 나면 PLR이 좁은만큼 피크는 더 낮게 나타난다

그리고 모든 곡이 별로 안튀어나왔든 매우 도드라지게 솟았건간에 피크가 0데시벨FS에 거의 닿도록 만들어졌다는 가정 하에, RMS를 
RG의 표준인 83데시벨로 밀어버리기 위해 적용한 감소도인 14데시벨이라는 숫자에서 RG가 게인을 보정한 만큼을 뺀 수가 해당 곡의 PLR일거라는 통밥도 부정확하지만 믿어볼만 하다(14-RG보정=PLR 추정치)

예를 들어 어떤 노래를 
RG나 '89데시벨' 설정상태의 MP3Gain이 -9데시벨로 판정한 경우 PLR은 5데시벨과 그리 크게 다르지 않을 것이고, -2데시벨로 나온 곡은 PLR이 한 12데시벨 정도가 아닐까 하고 짐작해볼만 하다는 식이다

실제로 확인해보면 다수의 곡에서 PLR이 저 예측보다 2~3데시벨씩 크게 나오나, 보정이 많이 필요한, 즉 
피크가 0데시벨FS에 근접하면서 PLR도 좁은(컴프레스가 심한) 곡일수록, 그리고 전자음 만으로 이루어졌거나 저음역의 비중이 유별나게 많은 곡으로 갈수록 통밥과의 오차가 적어지는 편이다

하지만 그게 어떻건 RG가 맞추고자 하는 RMS는 차이가 사실상 없는 수준까지 일정해졌기 때문에, RG의 처리를 거친 후에 피크가 0데시벨FS에 거의 근접했든 한참 아래에서만 깔딱거리든간에 아무튼 들리는 음량은 상당히 동일해졌을 것이라고 판단할 수 있게 된다

이것이 RG의 의의이다

RG를 지원하는 프로그램 중 그나마 가장 널리 쓰이고 먹어주는걸로는 Foobar2000이랑 MP3Gain을 꼽을 수 있다


근데 MP3Gain은 보면 프로그램 이름은 게인인데 이걸로 조절하는 변수는 볼륨이라고 표기해놨고, 기본값은 난데없는 89데시벨
(-7데시벨FS)이다

같은 노래를 복사해서 
Foobar2000의 RG와 MP3Gain의 89데시벨로 각각 처리해보면 알 수 있겠지만, 보정하는 양은 곡에 따라 2데시벨 미만의 오차는 있다만 사실상 둘이 똑같다(RG쪽의 판정과 적용이 좀더 정밀함)

즉 MP3Gain이 89데시벨로 표기하는 어떤 기준선에 맞게 밀어버린 결과물의 RMS가 사실은 -14데시벨FS, 즉 83데시벨이라는 말이다(실제로는 RMS 기준의 노멀라이즈를 했기 때문에 PLR이 14데시벨 이상인 음악은 피크가 클립됨)

그런데, 포럼같은데 뒤져보니까 RG가 초기에 RMS 기준을 89데시벨로 시작했다가 얼마 후에 83데시벨로 개정한 거라고도 하고 그 반대의 주장도 있고 16비트 다이나믹레인지랑 무관한 다른 계량체계에 기반한 89데시벨이라는 말도 있고 하여간 희한한데, 나는 예전엔 MP3Gain의 표기방식이 이 논란과 모종의 관련이 있는 걸로 알기도 했었다

근데 상관이 없었고, RG의 
-14데시벨FS과 동일한 보정이 MP3Gain에서 89데시벨로 표시되어 있는 것도 그거 만든 사람들이 게으르거나 머저리이기 때문이 아니더라

정황으로 보아 얘네는 사람들이 듣는 음악의 보편적인 PLR 혹은 평균 크레스트팩터를 6데시벨로 간주하고 있다

즉 RMS를 83데시벨로 정해서 틀어본 노래라면 으레 피크는 그보다 6데시벨쯤 높은 89데시벨 근처에서만 놀겠거니 하는 짱구에 입각하여, 피크가 89데시벨에 멈추도록 보정하는 식으로 작동하는 개념이란 말이지

많이들 듣고 많이 팔리는 대중가요의 PLR이 상당히 오래 전부터 6데시벨정도로 평준화되어 있는게 사실이기도 하고 말이야

여기까지 추론한 후 빌보드핫100이나 UK탑40차트나 MoS애뉴얼이나 멜론100같은 지극히 통계자료스러운 뭉탱이를 추려다가 일부는 RG에, 다른 일부는 MP3Gain의 89데시벨 설정에 각각 넣었다 뺀 후, PLR은 어느 정도씩 되고 RMS랑 피크 각각은 곡마다 어떤 식인지를 주목하면서 쭉 들어봤다

과연 그중 거의 전체가 가장 시끄러운 구간의 RMS는 83데시벨(-14데시벨FS)을 전후하여 울렁대고, 그 때 대다수의 곡에서 피크가 89데시벨을 중심으로 한 별로 넓지 않은 영역의 안에서만 튀더라고

대략을 얘기하자면 저 차트의 내용물 중 가장 시끄러운 노래의 가장 요란한 구간에서 대체적인 PLR이 4.5~7데시벨의 범위 안인 경향인데, 결국 요새 대중음악의 평균 PLR이 6데시벨이란 해석은 성립한다(그리고 이 정도가 저어기 위에서 말한 레알 파탄의 마지노선)

그래서, RG는
우리 우선 PLR을 14데시벨이라 치자!
 → RMS를 83데시벨로 맞춰서 14데시벨 만큼의 여유를 둬야겠다. 그렇게 하면 피크가 0데시벨FS를 때리지 않을거임ㅇㅇ → 옳소ㅇㅇ의 개념이다

한편 MP3Gain의 개념은,
RMS를 83데시벨로 맞춰야 한다더군? 
→ 야 근데 요새 애새끼들 듣는거 찍어보니까 PLR이 죄다 6데시벨이야 → 83+6=89니까 피크를 89데시벨에 맞추면 되겠네 → 올ㅋ 정도가 되겠다(그래서, MP3Gain식의 판단에 따른다면 RG의 기준선을 89데시벨까지 올려도 된다. 노래의 PLR이 6데시벨이니까 이렇게 하면 피크가 0데시벨FS보다 약간 낮은 95데시벨임)

그런 사정이 있어서 MP3Gain의 보정치와 표기법이 꼭 야매같이 그꼴이지만 Foobar2000의 RG랑 결과는 같은거다 뭐 이런 얘기다

근데 이래놓고 PLR이 몹시 넓은 오케스트라나 영화음악음향이나 올드락 같은거 집어넣으면 피크가 89데시벨보다 높다

즉 MP3Gain의 인터페이스에 써놓은 설정의 숫자가 피크게인을 뜻함과는 달리 실제 동작은 RMS 기준임이런 ㅄ

하지만 이 단락의 주장은 걍 나혼자 추측으로 싼거고 신빙성이 별로 없으므로 어디가서 이렇다고 아는체하진 말긔








시발 좀만 기달 다른거부터 좀 쓰고


http://translate.google.co.kr/translate?sl=ja&tl=ko&js=n&prev=_t&hl=ko&ie=UTF-8&eotf=1&u=http%3A%2F%2Fdgo.xsrv.jp%2Falipapa%2Fwmp%2F



Posted by 우다리
,