2018년 박스오피스 데이터 분석 1부

2018년 박스오피스 분석 리포트 에서는 분석한 결과만 포스팅했었습니다. 이번 포스팅에서는 박스오피스 데이터를 분석하는 방법을 알려드리겠습니다.

이번 글은 구글 스프레드시트 사용법 (7) Query로 데이터 분석하기 후속편이기도 합니다. 전편에서는 쿼리(Query)로만 분석했습니다만, 실제로 업무 중에 데이터 분석할 때는 쿼리뿐만 아니라 피봇 테이블, 함수 등 다양한 방법을 활용하여 분석합니다.

영화진흥위원회(http://www.kofic.or.kr)에서 2018년도 1년간의 일별 박스오피스 데이터를 다운로드하여 스프레드시트로 가져오고 쿼리, 피봇 테이블, 함수 등으로 분석한 예시를 보여드리겠습니다.

일별 박스오피스 데이터

다 모아보니 무려 40,776개의 데이터!
데이터가 많다 보니 샘플 스프레드시트가 많이 무겁습니다. movie2018_00.png샘플 스프레드시트: KOFIC 2018년 일별 박스오피스 분석 > data

2018년 월간 전체 관객수, 매출액

우선 크게 월간 관객수, 매출액을 알아보겠습니다.

movie2018_03.png
샘플 스프레드시트: KOFIC 2018년 일별 박스오피스 분석 > ⓟ 월간 관객수 매출

왼쪽은 피봇 테이블로 작성한 월별 관객수, 매출액, 스크린수, 상영횟수, 상영된 영화 개수를 분석한 데이터입니다.

  1. 행에 ‘월’ 추가.
  2. 값에 ‘관객수’ SUM, ‘매출액’ SUM, ‘스크린수’ SUM, ‘상영횟수’ SUM, ‘영화명’ COUNTA
  3. 필터에 ‘월’이 ‘셀이 비어있지 않음’ 으로 추가.

오른쪽은 아래쪽의 쿼리를 이용하여 각 달의 관객수가 1위인 영화의 ‘영화명’, ‘관객수’ SUM, ‘매출액’ SUM을 해당 월의 오른쪽에 데이터를 복사해 붙여 넣었습니다.

각 달의 전체 관객수와 매출액, 1위 영화의 관객수와 매출액을 비교할 수 있도록 그래프를 만들었습니다.

월별_관객수_매출액.png

  • 1위 영화는 평균적으로 각 달의 관객수, 매출액의 약 30%를 차지합니다.
  • 가장 많은 관객수를 기록한 달은 8월입니다. 총 관객수 3억 명을 돌파했습니다.

2018년 관객수 많은 영화

관객수 많은 영화를 알아보겠습니다.

관객수 많은 영화를 알아볼 때는 피봇 테이블, 쿼리 둘 다 가능합니다.

피봇 테이블로 관객수 많은 영화 알아보기

movie2018_06.png샘플 스프레드시트: KOFIC 2018년 일별 박스오피스 분석 > ⓟ 관객수 많은 순

  1. 행에 ‘영화명’ 추가.
  2. 값에 ‘관객수’ SUM, ‘매출액’ SUM, ‘개봉일’ MAX, ‘개봉년도’ MAX을 추가.
  3. 필터에 ‘개봉일’에 ‘날짜가 2017-12-01 이후임’ 으로 추가.
    (표시되는 데이터 수를 줄이기 위해서 2017년 12월이후에 개봉한 영화로 제한했습니다.)
  4. 행의 정렬 기준을 ‘관객수의 SUM’에 내림차순으로 변경.

쿼리로 관객수 많은 영화 100개 알아보기

movie2018_09샘플 스프레드시트: KOFIC 2018년 일별 박스오피스 분석 > ⓠ 관객수 Top 100

query : select C, sum(G), sum(E), max(D), max(V) group by C order by sum(G) desc limit 100

  • 영화명 표시 : C
  • 총 관객수 표시 : sum(G)
  • 총 매출액 표시 : sum(E)
  • 개봉일 표시 : max(D)
  • 개봉년도 표시 : max(V)
  • 영화명으로 그룹을 묶음 : group by C
  • 관객수 많은 순으로 정렬 : order by sum(G) desc
  • 100개만 표시: limit 100
    (상위 100위만 표시하기 위해서)

쿼리로 검색된 데이터를 베이스로
관객수가 많은 상위 20위까지의 영화의 총 관객수, 매출액 그래프입니다.

top20영화_관객수_매출액

  • 2018년 가장 많은 관객수를 기록한 영화는 <신과함께-인과 연>입니다.
  • <신과함께> 전편은 5위, 속편은 1위로 두 영화 다 상위권입니다.

그리고 100위 내 영화가 무슨 요일에 개봉했는지 분석했습니다.
개봉요일분석

  • 대부분 영화가 수요일에 개봉했다는 걸 알 수 있습니다.

영화별 Daily 1위 횟수

순위 데이터를 분석하여, Daily 1등을 가장 많이 한 영화를 알아보겠습니다.

movie2018_05샘플 스프레드시트: KOFIC 2018년 일별 박스오피스 분석 > ⓟ 1위 횟수

  1. 행에 ‘영화명’ 추가.
  2. 값에 ‘순위’ COUNT 추가.
  3. 필터에 ‘순위’가 ‘값이 1와(과) 같음’ 으로 추가.
  4. 행의 정렬 기준을 ‘순위의 COUNT’에 내림차순으로 변경.

영화별Daily1위.png

  • 2018년도 Daily 1위를 가장 많이 한 영화는 <어벤져스: 인피니티 워> 입니다. 

2위는 의외로 관객수 많은 순으로는 12위인 <독전>이 차지했습니다.
1위 횟수는 총 관객수와 비례하지는 않는 것 같습니다.
총 관객수 순위와 1위 횟수를 한 그래프로 만들어봤습니다.
top20영화_관객수_1위횟수.png

To Be Continued…
예고 : 다음 2부에서는 주간 관객수를 분석하는 방법을 포스팅하겠습니다.

 

구글 스프레드시트의 다른 활용법을 알고싶으시다면!
» G Suite 사용법 #4 스프레드시트 활용 예시 모음

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Google photo

Google의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중