https://www.hankyung.com/it/article/2022050911551 : 한국경제신문, 5/9일
기사에서는 ‘왓챠’의 콘텐츠 리뷰 및 추천 서비스에 대한 약간의 설명을 하고 있다. 2011년부터 소비자들의 별점과 후기등 6억5천만개 이상의 콘텐츠 평점 데이터를 보유하고 있음을 밝히고 있다. 대량의 데이터와 함께 쌍으로 출연하는 인공지능(AI) 시스템에 대해서도 언급하고 있다. 왓챠가 분전하는 것이 이러한 AI 기반의 데이터 분석 기술이 큰 원인이라면, 과연 왓챠는 시스템을 통하여 다른 OTT 서비스들과의 차별화에 성공하고 있는 것일까?
추천 시스템에 대한 과도한 기대
왓챠와 넷플릭스가 운영하는 ‘추천 시스템’은 기술적 측면에서 큰 차이가 없다. 추천 시스템은 평점, 후기, 콘텐츠 시청 중단 여부 등 사용자 개인과 사용자 집단이 발생시킨 대규모 데이터를 이용해서 연관성의 ‘패턴’을 찾아내는 것이다. 머신러닝을 이용하는 것도 좀더 정확한 패턴을 찾기 위해 데이터를 이용하여 시스템을 훈련하는 과정이다. 그렇다면 결과는? 왓챠와 넷플릭스의 추천 시스템의 정확도 차이가 엄청나게 벌어질까? 그렇지는 않을 것이다. 기본적으로 양쪽 시스템이 구사하는 논리에는 차이점이 없다.
시스템이 정확하게 취향을 예측하는 것에는 한계가 있다. 간단하게 말하면, 1. 시스템은 연관성이 있는 ‘패턴’을 찾아내는데, 이는 ‘인과관계’가 아니라 ‘상관관계’이다. 2. 취향은 동태적이다. 20세때 격정적인 로맨스를 좋아했지만 시간이 갈수록 시들해질 수 있다. 3. 취향은 상황 의존적이기도 하다. 집에 친구들이 놀러 왔을 때는 코미디 영화를 보고 싶어했지만, 밤에 혼자 있을 때는 울적한 기분을 즐기기 위하여 슬픈 영화를 선택할 수도 있다. 4. 시스템은 기본적으로 통계의 논리를 따른다. 통계에서 가장 자주 활용되는 방법중 하나는 ‘회귀분석’이다. 회귀분석의 정확도는 데이터에 따라 천차만별이다. 5. 데이터가 정확하다고 가정할 수 없다. 입력되는 데이터가 정확하지 않다면 출력되는 정보에도 한계가 있다. 이러한 이유들로 추천 시스템이 내놓는 결과들을 무턱대고 신뢰할 수는 없는 것이다. 친한 친구가 추천한 영화를 보고 감동할 가능성이 시스템의 추천 경우보다 작다고 할 수는 없을 것이다.
추천 시스템의 정확도는 시스템 자체에서 나오는 결과 수치로서 결정되지 않는다. 스포티파이 같은 동일한 논리의 추천 시스템의 운영은 시스템 자체가 내놓는 추천곡을 그대로 사용자 개개인에게 추천하는 식으로 운영되지 않는다. 데이터 과학자들은 시스템이 내놓는 연관성(인과관계가 아니라 상관관계다)에 대한 결론이 정말 맥락이 있는 것인지 판단하는 일을 매우 중요하게 생각한다. 결국 시스템과 인간이 협업하는 것이다. 많은 경우 추천 시스템 같은 빅데이터와 AI를 기반으로 하는 예측 시스템은 그 정확도와 영향력이 과대평가되고 있다.
왓챠와 넷플릭스의 다른 점 : 성공에 대한 정의가 다르다
기사에서 왓챠가 데이터와 AI를 활용해서 분투하고 있다는 것에 대한 의미를 좀더 생각해 볼 필요가 있다. 왓챠는 어떤 목적으로 시스템을 훈련시키고 활용할까. 왓챠의 사용자는 100만명대이다. 넷플릭스는 2억명대이다. 왓챠는 넷플릭스처럼 콘텐츠에 대규모로 투자하기 어렵다. 왓챠의 사용자들이 블록버스터 영화들을 선호하는 것이 뚜렷하다 해서 왓챠가 큰 돈을 들여 그런 영화들을 대규모로 사오기는 어렵다. 아마도 왓챠는 구매해 올 영화나 드라마가 자신의 고객들의 선호와 잘 맞을지를 판단하고 싶을 것이다. 넷플릭스는 어떨까. 전세계적인 흥행이 이루어지는 작품들을 사오면 새로운 고객들이 유입된다. 기존의 고객들도 이탈하지 않는다. 콘텐츠를 먼저 구매하고 나면 전세계적으로 2억명이 넘는 사용자들에게 적절하게 추천할 수 있다.
왓챠와 넷플릭스의 성공에 대한 정의가 다른 것이다. 왓챠는 구매해 온 콘텐츠가 기존 사용자들에게 잘 먹히도록 추천 시스템을 가동하고 틈새시장의 새로운 고객들에게 어필하는 것이 성공이다. 넷플릭스는 전세계적으로 새로운 사용자들을 유입하고 유입된 고객들이 이탈하지 않고 유지되도록 하는 것이 성공이다. 우리 나라로 국한해서 보더라도 왓챠와 넷플릭스는 시장도 다르고 제공하는 가치도 다르다(한마디로 정의하기는 어렵지만, 왓챠는 틈새 시장 – 넷플릭스는 매스 시장, 왓챠는 좀더 싼 가격에 희소성이 있는 콘텐츠 – 넷플릭스는 합리적 가격에 블록버스터).
오히려 시스템이 독이 되는 경우는 없을까
성공에 대한 정의가 다르면 각자가 지향하는 성공을 위한 활동도 다를 것이다. 왓챠는 먹힐만한 콘텐츠로 신규 고객들을 끌어오는 것에 성공의 방점이 찍혀 있다기 보다는 들여 올 콘텐츠가 기존 고객들에게 잘 맞을지, 이미 들여 온 콘텐츠가 고객들에게 정확하게 추천되는지에 성공의 방점이 찍혀 있는 것으로 보인다(이것은 왓챠가 영화 평점 및 후기 서비스로부터 시작된 것과 무관하지 않을 것이다). 이에 따라 추천 시스템의 정확도가 중요해진다. 하지만 앞서 잠깐 언급했듯이 추천 시스템은 정확도에 한계가 있다. 시스템에 대한 투자와 비용이 커지는 만큼 그에 따른 성과가 중요하지만, 추천 시스템을 기반으로 한 서비스가 어느 정도의 성과를 내고 있는지는 알 수 없다.
중요한 것은 다른 곳에 있을지도
왓챠가 6억5천만건이 넘는 데이터를 가지고 있다고 하더라도 적용되는 사용자 기반이 100만명대(2021년말 기준 132만명)라면 시스템이 적용되는 집단이 상대적으로 소규모라는 문제가 있다. 왓챠가 보유한 데이터는 대부분 과거부터 축적한 데이터이다(앞서 인용한 기사에서는 2011년부터 데이터를 모아 왔다고 되어 있지만, 나무위키에 따르면 왓챠는 2012년부터 영화 평점 및 후기 서비스를 시작했다). 과거부터 보유한 데이터로부터 현재의 고객에 대한 취향을 예측해야 하기 때문에 시간이 갈수록 예측의 질은 떨어질 가능성이 있다. 꾸준하게 데이터를 업데이트 하고, 시스템이 최신 데이터로 학습하는 것이 필요하다. 게다가, 시스템이 정교하게 영화를 추천한다고 하더라도 고객이 그것을 그대로 받아들여서 영화를 시청할 것이냐는 것은 또다른 문제다.
(추천) 시스템이 제대로 작동한다면, 이에 따라 서비스에 대한 평판이 올라가고, 신규 고객이 유입되고, 들어온 고객들은 시스템에 만족하여 지속적으로 유지되며, 새로운 콘텐츠가 다시 시스템의 작동에 영향을 미치는 순환이 이루어져야 할 것이다. 이 순환에서 중요한 출발점은 ‘시스템’이다. 즉, 추천 시스템이 고객을 유치하고 유지할 것이라는 가정이 강하게 깔려 있다. 이 가정이 타당하지 않다는 것은 왓챠의 사용자수가 아직 130만명 수준을 기록하는 것을 보면 알 수 있다. 시스템이 어느 정도 제대로 작동한다 해도 시스템의 (상대적) 정확성이나 정밀함이 새로운 고객을 유치하거나 기존의 고객을 유지하는데 결정적으로 작용하지 않는다는 것을 함축한다.
OTT 서비스에서는 사용자 수 확보가 무엇보다 중요하다. 사용자 수를 확보해야 블록버스터를 비롯한 콘텐츠를 다양하게 확보할 수 있고, 시스템에도 투자할 수 있는 여력도 생긴다. 그것이 여의치 않다면 특정한 분야(예를 들어, 클래식 영화나 다큐멘터리 등)에 집중하거나 관련된 사업과의 연계를 고려(예를 들어, 애니메이션이나 특정한 영화와 관련있는 상품 판매와의 연계)하는 등 ‘나만의 영역’을 구축하는 것이 전략적으로 중요하고 선행되어야 할 것이다. 대량의 데이터를 기반으로 상대적으로 정교한 시스템을 만들었다는 것으로 OTT 시장에서 ‘나만의 영역’을 구축했다고 주장하는 것은 와닿지 않는다. 이것은 빅데이터와 AI 같은 새로운 기술에 대한 과도한 기대를 부추기는 또다른 사례일 수 있다.