OTT 업계는 AI 선도 분야로 꼽힙니다. 컨텐츠 추천 시스템 개발과 운영에 오랜 기간 힘써오다 보니 AI와 빅 데이터가 자연스럽게 조직의 핵심 역량으로 자리 잡은 곳이 많습니다.
그렇다면 이웃 산업이라 할 수 있는 영화 쪽은 어떨까요? 영화 또는 TV 드라마 시리즈 제작에 AI와 빅 데이터가 쓰인 예는 꽤 많습니다 🙂
컨텐츠 제작 의사결정에 도움을 주는 ‘데이터’
보통 제작한 영화나 드라마의 성공은 뚜껑을 열기 전에 알 수 없습니다. 성공 확률은 주로 스타 제작자와 그의 팀의 감에 의지하는 경우가 많았죠. 엄청난 양의 시나리오 중 될 것 같은 것을 고르는 것이 주로 직관에 의해 이루어졌다고 보면 됩니다. 그러던 것이 요즘에는 감보다 데이터에 의지하는 곳이 늘고 있습니다. 넷플릭스가 자사의 구독자 데이터를 바탕으로 시청자가 보고 싶어 하는, 다른 말로 성공 가능성 높은 시리즈로 하우스 오브 카드(House of Cards)를 기획한 것은 유명합니다. 당시 넷플릭스는 3천300만 구독자 데이터를 분석했습니다. 그 결과 1990년 BBC에서 방송한 원작 하우스 오브 카드 인기가 높다는 것을 알게 되었습니다. 영국 드라마를 각색하여 새로운 시리즈를 시작할 만하다고 데이터를 통해 판단한 것이죠. 다음으로 감독 선정과 주연 배우 캐스팅 역시 데이터를 따랐습니다. David Fincher 감독은 연출한 영화들을 끝까지 본 구독자가 많았다는 점이, 주인공 역을 맡은 Kevin Spacey 역시 출연한 영화의 인기가 높았다는 점이 분석 결과 나왔고, 이를 따라 감독과 주연을 맡겼습니다.
20세기 폭스의 ‘Merlin’이 보여 준 또 다른 가능성
AI와 빅 데이터 활용에 있어 또 다른 대표 사례가 있습니다. 바로 20세기 폭스가 개발해 운영하는 추천 시스템인 ‘Merlin’입니다. 이름에 나와 있듯이 이 시스템은 마법사 못지않은 능력을 보여 줍니다. Merlin은 AI를 적용해 영화 예고편에 대한 대중의 반응 속에서 스토리, 배우 등에 대한 선호를 파악합니다. 이를 통해 해당 영화의 성공 가능성을 알아보기도 하지만 앞으로 어떤 스토리가 대중의 관심을 끌지, 이야기를 이끌 주인공은 누가 적합할지 등에 대한 통찰력까지 확보할 수 있습니다.
Merlin의 데이터 파이프라인을 보면 이 시스템이 어떻게 동작하는지 알 수 있습니다. 영화 스크립트와 예고편 정보를 자연어 처리(NLP)와 컴퓨터 비전 기술 등을 거쳐 통합됩니다. 그리고 이 데이터 세트로 머신 러닝이 수행됩니다. 이 과정을 거쳐 생성된 보고서를 통해 영화 제작사는 프레임 단위 분석 정보, 고객에 대한 통찰력 등에 대한 내용을 파악할 수 있습니다.
이처럼 정교한 머신 러닝 시스템을 운영하는 데 있어 20세기 폭스가 느끼는 부담은 없습니다. 그저 아이디어 하나로 시작한 것입니다. 구글 클라우드가 제공하는 관리형 서비스를 통해 데이터 파이프라인을 구축하고 머신 러닝을 적용한 것이라 인프라와 플랫폼 구성을 따로 할 필요가 없었습니다. 20세기 폭스는 Cloud Dataflow로 데이터를 통합하는 구조로 파이프라인을 만들었습니다. 이를 토대로 Cloud ML Engine을 이용해 머신 러닝을 수행합니다. 보고서 생성은 BigQuery, BigQueryML, DataStudio를 통해 이루어집니다.
영화 흥행 수표는 이제 ‘데이터’이다!
OTT 분야에서 데이터 과학자의 활약이야 익숙하지만 영화사의 경우 조금 낯선 것도 사실입니다. 20세기 폭스 사례에서 알 수 있듯이 이제 영화 흥행을 책임지는 것은 다름 아닌 데이터와 AI입니다. 관객이 선호하는 스토리, 감독, 배우에 대한 의사결정에 필요한 내용은 모두 데이터 속에 다 있습니다. 이 데이터를 찾는 것은 물론 영화사의 몫입니다. 20세기 폭스와 같이 예고편을 데이터 소스로 활용할 수도 있고, 다른 데이터 원천을 참조할 수도 있습니다. 문화 강국으로 성장 중인 대한민국 영화 산업도 이제 데이터와 AI를 핵심 경쟁력으로 삼아야 할 때가 아닐까요? 클라우드 덕에 이제 기술 장벽은 사라졌습니다. 필요한 것은 아이디어와 실행력 그리고 결단뿐입니다.