24 vs 23.976


기본에 대한 생각

Compositing 아티스트였을 때, 그리고 TD로 전향 한 이후에도 항상 집중하려고 하는 것 중 하나가 바로 ‘기본’이다. 어느 직업군이나 마찬가지겠지만 특히나 VFX 업계에서 ‘기본’은 어떻게 보면 모든 것의 시작이기도 하면서 또 어떻게 보면 당연하다고 생각한 나머지 너무나도 쉽게 지나쳐버린 것일 수 있다. 예컨대, 로그와 리니어, 10bit와 16bit, exr과 dpx, Black point와 White point 등 나열하면 수도 없이 우리가 매일매일 일상적으로 사용하는 개념들이-바쁜 턴오버 스케쥴로- 생각해볼 겨를 도 없이 희미하게 두둥실 떠다니고 있다.

하지만 가끔씩은 그런 익숙한 ‘기본’들을 내가 왜 사용하는지, 어떤 속 이야기를 가지고 있는 지 물음을 던져보는 것도 나쁘지 않다. 생각보다 그 과정은 재미있고 적지 않은 문제를 해결할 수 있게 해주기 때문이다.

그 일환으로 앞서 말한 ‘기본’에 대해 찾아보고 정리한 내용을 남겨보려고 한다. 물론 완벽하지는 않겠지만 적어도 나와 같은 고민을 한번이라도 했던 사람들에게 조금이나마 도움이 되고 또 포스팅하는 과정을 통해 내 스스로에게도 좀 더 정확하고 깊게 생각할 수 있는 일종의 동기부여가 되리라고 생각한다.

그래서 오늘은

서론이 길었다. 이번 글에서는 업계에서 흔히 사용하는 23.976과 24 frame rate(fps)의 차이에 관하여 알아보려고 한다. 이전에 어떤 Project Manager가 나에게 ‘도대체 무슨 차이가 있는거냐’며 질문을 던졌는데 그때 나의 대답은 ‘똑같다고 보면 된다’ 였다. 물론 어떠한 근거도 없이 단순히 숫자 차이가 소수첨 차이밖에 나지 않고 실제 다른 fps의 mov를 플레이해봐도 차이를 못 느꼈기 떄문에 던진 대답이었다. 그때부터 마음 한 켠에는 찝찝함과 동시에 ‘시간이 나면 한번 찾아봐야지’라는 생각을 가지고 있었고 며칠 전에서야 행동에 옮겼다.

24fps

보통 영화는 24fps를 사용한다. 알다시피 1초에 24장의 그림을 보여주는데, 이 수치의 정착에는 여러 이유가 있다. 그 중 보편적으로 말하고 있는 사례는 초기 14~26fps로 촬영된 무성영화에서 필름과 사운드를 동시에 입히는 기술이 발전하면서 사운드와 화면이 가장 적절하게 매칭되는 최소의 frame rate가 24fps였다는 주장이다(물론 필름 가격의 가성비에 대한 의견도 있다). 지금은 기술이 발전해 영화 ‘호빗’처럼 48fps를 사용하는 작품도 있지만 너무나 24fps에 익숙해져버린 까닭일까, 영화 같지 않은 이질감으로 다가왔다는 리뷰도 적지 않게 봤던 것 같다.

하지만 당신은 영화를 영화관에서만 보는가?

그렇지 않다. 보통의 영화들은 극장을 거쳐 여러 플랫폼을 통해 각 가정의 TV로도 송출된다. 바로 여기서 문제점이 발생한다.

이 모든 사태의 원인 NTSC

미국의 텔레비전 표준방식 검토위원회. 이곳에서 규정된 표준 방식이 NTSC 60(59.94)Hz 방식이다. 유럽의 PAL방식과 함께 많은 나라에서 이 NTSC방식을 채택하여 방송을 송출하고 있다. 초창기 흑백 방송은 30fps(60Hz)를 사용하여 송출되었다. 시간이 지나면서 컬러 방송이 가능하게 되었고 흑백 TV와 호환을 위한 신호체례를 만들다 보니 30fps를 살짝 틀어서 29.97fps(59.94Hz)로 송출하는 편법을 만들어 냈다.

이것이 바로 모든 것의 시발점이다.

한 번 만들어진 이 방식은 이전의 컨텐츠를 재활용해야 하는 방송사의 숙명때문에 이 편법 체계를 지금까지도 바꾸지 못하고 있고, 여기에 맞춰서 TV송출을 무시할 수 없는 영화 산업에서도 호환을 위해 24fps가 아닌 23.976fps라는 개념이 나타나게 된 것이다. 다시 말해, 23.976fps은 영화에서 전통적으로 사용되는 24fps의 TV 친화적 버전이라고 보면 된다.

이쯤에서 질문이 생긴다. 왜 23.976fps가 24fps보다 TV의 형식에 친화적인 frame rate일까?

3:2 Pull Down(Telecine)

답은, 23.976fps가 24fps보다 간단하게 3:2 pull down 라는 기술을 통해 보다 쉽게 방송 텔레비젼 형식인 29.97fps로 전환할 수 있음에 있다. 이러한 기술로 fps를 전환하는 것을 ‘Telecine(이하 텔레시네) 한다’라고 한다. 3:2풀다운은 두 단계로 수행된다. 첫 번째 단계는 필름을 1/1000초 느리게 해서 24-(24/1000)=23.976 fps로 만든다. 이 정도 속도의 차이는 보통 사람은 지각 할 수 없다. 하지만 2시간 런타임의 영화라면 총 재생 시간이 (24/1000)x60x60x2= 172.8 프레임 즉 172.8/24=7.2 초가 연장된다.

3:2 풀다운의 두 번째 단계는 시네마 프레임을 비디오 필드에 배포하는 것이다. 말이 어렵다. 단순하게 말해 23.976 : 29.97 = 4:5 비율이기 때문에 TV에서 총 5장의 프레임이 보여질 때 영화에서는 4장만 보여져서 1장이 부족해진다. 그렇다면 1장을 임의로 만들어 내야하는데 여기서 사용되는 기술이 바로 3:2 풀다운이다.

아래 그림을 보자.

wikipedia Telecine

4장의 프레임을 가지고 60Hz 비디오의 interlace(그림을 홀/짝 줄로 나눠서 주사하는 방식) 특성을 이용하여 5 장으로 “확장”된다. 모든 각각의 프레임은 2장의 ‘Field’로 구성되는데, 하나의 필드는 홀수줄, 다른 하나는 짝수줄이다. 텔레시네는 아래 그림처럼 4개 프레임을 가지고 A 프레임을 두 필드, B 필드는 세 필드, C 프레임은 두 필드, D 프레임은 세 필드로 총 10개의 필드를 번갈아 배치한다. 이것은 AABBBCCDDD 또는 2-3-2-3 또는 2-3으로 작성할 수 있다. 또 이 싸이클은 4 개의 필름 프레임이 보여진 후에 계속 반복된다. 이처럼 프레임을 2와 3 필드를 사용하여 3 개의 “풀”프레임과 2 개의 “풀다운”프레임을 생성하므로 3:2 풀다운이라고 불른다.

3:2 풀다운 기술은 매 5 개의 프레임마다 하나의 더티 프레임을 만든다. 이를 해결하기 위해 TV로 전송된 29.97fps의 영상을 다시 23.976fps로 만들어주는 역 텔레시네(IVTC : Inverse Telecine)라는 기술도 있지만 이 글에서는 자세히 다루지는 않겠다. 아무튼 이렇게 텔레시네를 거친 영화 영상은 TV와 잘 호환되어서 송출될 수 있게 된다.

자, 여기까지 24fps와 23.976fps가 나눠지게 된 이유와 차이점에 대해 알아보았다.

그렇다면 VFX파트에서 신경써야하는 것은 무엇일까?

POST-PRODUCTION 에서는?

조사하며 든 생각은 이렇다.

24든 23.976fps든 소수점의 frame rate라도 보여주는 초당 프레임은 정수고 그림 1장이니 작업은 똑같이 하면 될 것 같다. 대신 아웃풋 데이터의 메타데이터와 사운드와 mov 렌더링 파이프라인에서는 꼭 챙겨야 한다.

시퀀스의 메타데이터와 mov렌더링은 편집실과 DI실과의 딜리버리에 영향을 줄 수 있다. 스캔데이터의 모든 메타데이터는 그대로 보존하는게 원칙이기 때문에 당연히 frame rate 역시 렌더옵션에서 유지하고, 컨펌이나 편집 시 타임라인에서 틀어질 수도 있기 때문에 mov도 역시 맞춰야한다. 사운드는 frame rate 라는게 없고 스피드만 있기 때문에 영상 길이만큼 스트레치를 쳐주면 된다고 한다.

지금도 많은 영화들이 24fps와 23.976fps로 촬영되고 있다. 물론 여러가지 이유가 있겠지만 23.976fps가 24fps보다는 텔레시네에 유리한 것은 사실이다. 그래서 CF같이 애초에 TV송출을 목표로 촬영하는 경우에는 보통 필름 촬영을 23.976fps로 하고, 24fps로 촬영된 영화의 경우에는 필름의 재생속도를 바꿔서 23.976fps로 재생하고 사운드는 별도의 스트레치 작업을 거쳐 다시 합치는 방법으로 변환을 한다.

공부하면서 기록한 글이라서 잘못된 내용이나 오역이 있을 수 있습니다. 잘못된 내용이 있다면 댓글로 남겨주세요~

출처