[스프레드시트 활용] 박스오피스 데이터로 2024년도 흥행 영화 시각화 + 1년 치 일별 박스오피스 데이터 공유

일별 박스오피스 데이터로 흥행 영화와 주간 관객수 그래프 만들기를 해보겠습니다.

💠목차

  1. 일별 박스오피스 데이터 준비
  2. 2024년도 흥행 영화 Top 20 누적관객수 시각화
  3. 2024년도 흥행 영화 주간관객수 시각화
  4. 2024년도 흥행 영화 주간 누적관객수 시각화
  5. 2024년도 영화 중 상영일수가 가장 많은 영화는?
  6. 1년치 일별 박스오피스 데이터 공유

일별 박스오피스 데이터 준비

KOBIS(영화관입장권통합전상망) 사이트 일별 박스오피스 페이지에서 2024년도 1년 치 데이터를 다운로드한 후, 하나로 합쳤습니다. 1년 치를 모으니 무려 39891행의 데이터양입니다.

박스오피스 2024 > rawdata 시트 : 다운로드 받은 전체 데이터

일별 박스오피스에서 제공하는 데이터양이 많기 때문에 여러 데이터 중에 상영일 날짜, 영화명, 개봉일, 매출액, 누적매출액, 관객수, 누적관객수만 추렸습니다.
*이미지에서 영화명을 가린 이유는 청불 영화 제목이기 때문입니다.

그리고 마지막 열에 이전 [스프레드시트 활용] 일별박스오피스 데이터로 영화 서울의 봄 주간 관객수 그래프 만들기 포스팅에서 만들어둔 함수 조합으로 각 영화별로 개봉주차를 계산했습니다. 단, 이번 스프레드시트에서는 2024년에 개봉한 영화만 개봉주차를 계산하기 위해서 IF, YEAR 함수 조합으로 개봉 연도가 2024인 영화만 개봉주차를 계산하도록 만들었습니다.

=IF(YEAR(<개봉일 날짜>) = 2024, <개봉주차 계산 수식>, )
박스오피스 2024 > data 2024 시트 : 일부 데이터 + 수식으로 개봉주차 계산



2024년도 흥행 영화 Top 20 누적관객수 시각화

우선은 피봇 테이블을 만들어서 영화별 개봉일, 관객수의 합계(SUM), 누적관객수의 최댓값(MAX)을 확인해 보았습니다.

피봇 테이블 설정:

  • :
    • 영화명 / 정렬기준: 관객수의 SUM 내림차순
    • 개봉일 / 정렬기준: 관객수의 SUM 내림차순
  • :
    • 관객수 / 요약기준: SUM
    • 누적관객수 / 요약기준: MAX
  • 필터: 날짜 / 조건별 필터링 – 셀이 비어있지 않음
흥행 영화 확인용 피봇 테이블 설정 상세

이렇게 피봇 테이블로 계산된 데이터로 상위 20위 흥행 영화의 누적관객수 그래프를 만들었습니다.

박스오피스 2024 > 2024 흥행 시트

가장 많은 관객수를 기록한 영화는 <파묘>였고, <파묘>와 <범죄도시4> 두 작품이 천만을 넘었습니다.
<소방관>과 <하얼빈>은 2024년 12월에 개봉한 영화이기 때문에 2025년도에 더 늘어날 것으로 예상됩니다.

2024년도 흥행 영화 누적관객수 그래프



2024년도 흥행 영화 주간관객수 시각화

사전에 data 2024 시트에서 수식으로 계산해둔 개봉주차를 열의 기준으로 설정하여 피봇 테이블을 만들었습니다.

피봇 테이블 설정:

  • : 영화명 / 정렬기준: 관객수의 SUM 내림차순
  • 열: 개봉주차 / 정렬기준: 개봉주차 오름차순
  • : 관객수 / 요약기준: SUM
  • 필터: 개봉주차 / 값이 1보다 크거나 같음
주간관객수 확인용 피봇 테이블 설정 상세

피봇 테이블로 계산된 주간관객수 데이터로 상위 20위 흥행 영화의 주간관객수의 그래프를 만들었습니다.

2024년도 흥행 상위 20위 영화 주간관객수 그래프

주간관객수 그래프가 완만하게 그려지는 입소문 흥행패턴에 해당하는 영화는 <파묘>, <인사이드 아웃 2> 2개를 들 수 있을 것 같습니다.



2024년도 흥행 영화 주간 누적관객수 시각화

이번에는 새롭게 주간 누적 관객수를 알아보고 싶어서 피봇 테이블의 설정을 달리해보았습니다. 피봇 테이블에서 누적으로 계산해 주는 설정은 없지만, 원 데이터에 누적관객수 데이터가 있기 때문에 쉽게 만들 수 있었습니다.

피봇 테이블 설정:

  • : 영화명 / 정렬기준: 누적관객수의 MAX 내림차순
  • 열: 개봉주차 / 정렬기준: 개봉주차 오름차순
  • : 누적관객수 / 요약기준: MAX
  • 필터: 개봉주차 / 값이 1보다 크거나 같음
누적 주간관객수 확인용 피봇 테이블 설정 상세

피봇 테이블로 계산된 누적관객수 데이터로 상위 10위 흥행 영화의 누적 관객수의 그래프를 만들었습니다.

2024년도 흥행 상위 10위 영화 누적 관객수 그래프

입소문 흥행패턴에 해당하는 <파묘>, <인사이드 아웃 2> 두 영화의 누적 관객수 그래프가 중간에 다른 영화보다 높아지는 모습을 볼 수 있습니다.

2024년도 영화 중 상영일수가 가장 많은 영화는?

주간 관객수 데이터를 확인하기 위해 만든 Weekly 시트에서 피봇 테이블의 개봉주차 열이 최대 50까지 표시되는 것을 확인할 수 있습니다.

박스오피스 2024 > Weekly 시트

개봉 후 50주차에 상영을 한 영화가 있다는 의미입니다. 그래서 이번에는 영화 상영일수가 가장 많은 영화 즉 장기 상영한 영화를 알아보기 위해서 피봇 테이블을 만들어봤습니다.

피봇 테이블 설정:

  • :
    • 영화명 / 정렬기준: 날짜의 COUNTUNIQUE 내림차순
    • 개봉일 / 정렬기준: 개봉일 내림차순
  • :
    • 관객수 / 요약기준: SUM
    • 날짜 / 요약기준: COUNTUNIQUE
상영일수 확인용 피봇 테이블 설정 상세

관객수는 많지 않아도 상영일수가 긴 영화들이 굉장히 많다는 것을 확인할 수 있었습니다.

2024년 상영일수 많은 순 영화 그래프

2024년도에 상영일수가 가장 많은 영화
1위는 307일을 상영한 <너의 이름은.> 이었고,
2위는 306일을 상영한 <더 퍼스트 슬램덩크> 입니다.

상영일수 많은 순 영화 리스트

박스오피스 데이터에서 제공하는 장르 정보를 확인해 보니 장기 상영한 작품에는 애니메이션 장르가 많다는 것을 알 수 있습니다.

참고로 <더 퍼스트 슬램덩크>는 2023년도에 상영일수가 363일로 가장 많은 영화 1위였습니다. 개봉일이 2023년 1월 4일이므로 개봉 전에도 상영한 일수가 있고, 개봉 이후 상영관에서 내린 적이 없다는 의미입니다.

2023년도 상영일수 많은 순 영화 Top 3

1년치 일별 박스오피스 데이터 공유

이 포스팅에서 사용한 스프레드시트 공유 링크입니다.
개봉주차를 계산하는 수식, 피봇 테이블, 그래프의 설정 등을 직접 확인할 수 있습니다.

⭐ 공유 스프레드시트: [공유] 박스오피스 2024

https://docs.google.com/spreadsheets/d/1hWGvJqHGG16CERGZig7enllWYBYBETG_iUrklWsPtmc/copy

공유 링크에 접속후 [사본 만들기] 버튼을 클릭하세요!

1년 치 일별 박스오피스 데이터가 쌓여있으므로 파일이 좀 무겁습니다.
이 점 유의하시기 바랍니다.

(동영상 강의 광고)

스프레드시트로 만든 가계부인데
스마트폰에서도 쓰기 쉽다고?

스마트폰에서도 쓰기 쉬운 스프레드시트 가계부

댓글

댓글 남기기