본문 바로가기

python

유튜브 트렌드 비교 분석 - 데이터 분석편

유튜브 인기동영상 리스트는 다양한 시청자의 관심을 끌거나 흥미로움, 새로움을 느낄 만한 동영상을 노출하는 것이다. 이를 판단하기 위해서 유튜브는 조회수, 조회수 증가 속도, 영상과의 비교 결과 등을 고려하고 있다. 따라서 17년 11월~ 18년 12월의 인기동영상 데이터를 분석하여 영상 트렌드와 이용자의 영상 소비 패턴을 파악해보고 22년 7~8월 인기동영상 데이터와 비교 분석하여 트렌드, 영상 소비 패턴의 공통점, 차이점을 도출해내고자 하였다. 물론 1년치의 데이터와 한달치의 데이터를 비교하는 것에는 무리가 있겠지만 지속적으로 데이터를 수집하기에는 어렵기 때문에 어느정도 감안하고 진행해보았다. 

 

왼쪽이 18년도, 오른쪽이 22년도

먼저 카테고리별 인기동영상 수를 보았을 entertainment, news & politics, people & blogs 카테고리가 압도적으로 많았으며 film & animation, comedy, music, gaming, sports 등의 카테고리가 뒤를 이었다. 22년도 또한  entertainment, people & blogs 카테고리가 상위권이었으나 news & politics 카테고리의 순위는 상당히 떨어졌다.

 

왼쪽이 18년도, 오른쪽이 22년도

18년도 News & politics 카테고리 제목 워드클라우드를 살펴보았을 대통령 정치인, 각국의 대통령이 언급되며 정치적 영상의 소비가 많았음을 있다. 하지만 22년도 제목 워드클라우드를 살펴보면 대통령 정치인 영상 소비가 전혀 없으며 오히려 여러 이슈들에 대한 영상 소비가 많음을 있다. 이로써, 대통령 탄핵 이후 국민들의 정치적 관심이 뜨거웠던 반면 현재 국민들의 정치적 관심도가 비교적 낮아졌음을 있다.

 

18년도
22년도

18년도 영상 세부 설명 길이는 0~100 구간이 가장 많았으며 영상 제목은 30~40 구간, 영상 태그는 0~5 구간이 가장 많았다. 최근 짧은 영상이나 숏츠와 같은 영상 등의 수요가 높아지고 익숙해짐에 따라 영상 설명과 제목 길이, 태그 개수 등이 더욱 짧아질 것이라 예상하였지만 18년도와 유사하였다.

 

22년도 인기동영상 영상 길이

평균 영상 길이를 살펴보았을 11분이며 5 미만의 영상이 가장 많았고 10~20 사이의 영상이 뒤를 이었다. 숏박스, 너덜트와 같은 짧은 코믹 영상이 최근 인기를 끌고 있으며 티저 영상, 신곡 뮤직비디오, 아이돌 직캠 등의 영상 길이가 대부분 3~4분이기에 5 미만 영상이 주를 이루었다. 이용자의 집중력을 낮추거나 시청의 진입장벽이 비교적 높을 있는 20 이상의 영상이 인기동영상 기준에 부합하진 않았다.

왼쪽이 18년도, 오른쪽이 22년도

18년도와 22년도 모두 16 ~ 20시에 업로드 영상이 인기동영상이 비율이 가장 높았으며 이는 퇴근 하교 개인 정비 시간에 영상 소비를 하는 패턴이 드러난 것으로 보인다.

 

다음은 카테고리별 영상 제목을 워드클라우드로 나타내본 것이다.

왼쪽이 18년도, 오른쪽이 22년도

Entertainment 카테고리는 다양한 영상들이 속해 있다. 18년도에는 먹방, 직캠 컨텐츠가 주를 이루었으며 22년도에는 화제를 모았던 이상한 변호사 우영우 각종 하이라이트 영상, tvn에서 운영하는 채널십오야 같은 컨텐츠가 주를 이루었다.

18년도에는 레전드, 충격, 꿀잼, 역대와 같은 자극적인 단어를 사용하여 영상을 업로드했던 반면 22년도에는 레전드 단어만이 사용되었다. 비교적 자극적인 단어를 사용하여 업로드를 있고, 해야 하는 개인 유튜버들의 영상보다는 유튜브 영향력을 파악한 지상파, 공중파들이 운영하는 채널들이 유입되며 생긴 변화로 판단된다.

 

왼쪽이 18년도, 오른쪽이 22년도

18년도에는 방탄소년단, 트와이스, 레드벨벳, 마마무 아이돌 컨텐츠와 라이브, 직캠 등이 소비되었다. 22년도에도 마찬가지로 소녀시대, 더보이즈, 뉴진스, 에스파 아이돌 컨텐츠와 라이브, 킬링보이스 직캠 컨텐츠가 소비되었다. 아이돌의 경우 여러 퍼포먼스를 봐야 하기에 다른 장르의 가수보다 영상 소비가 높음을 있다.

 

추가적으로 18년도에는 주차별 멜론 차트 듣기 컨텐츠가 상위권 이었지만 22년도에는 전혀 없다. 이로써 3가지 정도의 해석이 가능할 것이다. 첫번째, 차트에 대한 관심도 하락이다. 두번째 멜론, 지니뮤직, 스포티파이와 같은 음악 스트리밍 플랫폼 mau 증가이다. 유튜브로 듣던 순위 차트를 직접 스트리밍 플랫폼을 통해 듣는 것이다. 세번째 MZ세대의 확고한 개인 취향으로 개별 키워드 검색을 통한 음악 컨텐츠 소비이다. 그저 세워진 차트를 연속해서 듣는 것이 아닌 본인의 취향에 따라 개별 키워드를 검색하여 직접 음악을 찾아 듣는 패턴을 보이게 것이다.

 

왼쪽이 18년도, 오른쪽이 22년도

조회수, 좋아요, 싫어요, 댓글 개수, 제목 길이, 설명 길이, 태그 개수 변수들과 피어슨 상관 분석을 진행하였다.

 

18년도에는 변수들간 상관관계를 분석해본 결과 전반적으로 높은 상관관계를 보이진 않았지만 조회수와 싫어요 상관관계가 0.57, 조회수와 좋아요 상관관계가 0.48, 좋아요와 댓글 상관관계가 0.43 비교적 높은 상관관계를 보였다.

 

22년도에는 조회수와 좋아요 상관관계가 0.41, 조회수와 댓글 상관관계가 0.44 유지되거나 상승하였다. 좋아요와 댓글 간의 상관관계는 0.74 증가하였다. 이로 보아 18년도에 비해 시청자들의 영상 반응도가 높아졌음을 있으며 댓글 모음집 컨텐츠, 문화 댓글 문화의 발달 영향으로 보여진다.

 

데이터 수집 기간의 차이가 있고 통계적인 기법을 활용하지 않고 단순 시각화만 진행하여 비교하였기 때문에 일반화하긴 어렵지만 탐색조사 수준이며 이후에 데이터 수집 기간을 늘려 실제로 유의미한 차이가 있는지 분석해볼 예정이다.