일별 박스오피스 데이터로 흥행 영화와 주간 관객수 그래프 만들기를 해보겠습니다.
💠목차
- 일별 박스오피스 데이터 준비
- 2024년도 흥행 영화 Top 20 누적관객수 시각화
- 2024년도 흥행 영화 주간관객수 시각화
- 2024년도 흥행 영화 주간 누적관객수 시각화
- 2024년도 영화 중 상영일수가 가장 많은 영화는?
- 1년치 일별 박스오피스 데이터 공유
일별 박스오피스 데이터 준비
KOBIS(영화관입장권통합전상망) 사이트 일별 박스오피스 페이지에서 2024년도 1년 치 데이터를 다운로드한 후, 하나로 합쳤습니다. 1년 치를 모으니 무려 39891행의 데이터양입니다.

일별 박스오피스에서 제공하는 데이터양이 많기 때문에 여러 데이터 중에 상영일 날짜, 영화명, 개봉일, 매출액, 누적매출액, 관객수, 누적관객수만 추렸습니다.
*이미지에서 영화명을 가린 이유는 청불 영화 제목이기 때문입니다.
그리고 마지막 열에 이전 [스프레드시트 활용] 일별박스오피스 데이터로 영화 서울의 봄 주간 관객수 그래프 만들기 포스팅에서 만들어둔 함수 조합으로 각 영화별로 개봉주차를 계산했습니다. 단, 이번 스프레드시트에서는 2024년에 개봉한 영화만 개봉주차를 계산하기 위해서 IF, YEAR 함수 조합으로 개봉 연도가 2024인 영화만 개봉주차를 계산하도록 만들었습니다.
=IF(YEAR(<개봉일 날짜>) = 2024, <개봉주차 계산 수식>, )

2024년도 흥행 영화 Top 20 누적관객수 시각화
우선은 피봇 테이블을 만들어서 영화별 개봉일, 관객수의 합계(SUM), 누적관객수의 최댓값(MAX)을 확인해 보았습니다.
◲ 피봇 테이블 설정:
- 행:
- 영화명 / 정렬기준: 관객수의 SUM 내림차순
- 개봉일 / 정렬기준: 관객수의 SUM 내림차순
- 값:
- 관객수 / 요약기준: SUM
- 누적관객수 / 요약기준: MAX
- 필터: 날짜 / 조건별 필터링 – 셀이 비어있지 않음

이렇게 피봇 테이블로 계산된 데이터로 상위 20위 흥행 영화의 누적관객수 그래프를 만들었습니다.

가장 많은 관객수를 기록한 영화는 <파묘>였고, <파묘>와 <범죄도시4> 두 작품이 천만을 넘었습니다.
<소방관>과 <하얼빈>은 2024년 12월에 개봉한 영화이기 때문에 2025년도에 더 늘어날 것으로 예상됩니다.

2024년도 흥행 영화 주간관객수 시각화
사전에 data 2024 시트에서 수식으로 계산해둔 개봉주차를 열의 기준으로 설정하여 피봇 테이블을 만들었습니다.
◲ 피봇 테이블 설정:
- 행: 영화명 / 정렬기준: 관객수의 SUM 내림차순
- 열: 개봉주차 / 정렬기준: 개봉주차 오름차순
- 값: 관객수 / 요약기준: SUM
- 필터: 개봉주차 / 값이 1보다 크거나 같음

피봇 테이블로 계산된 주간관객수 데이터로 상위 20위 흥행 영화의 주간관객수의 그래프를 만들었습니다.

주간관객수 그래프가 완만하게 그려지는 입소문 흥행패턴에 해당하는 영화는 <파묘>, <인사이드 아웃 2> 2개를 들 수 있을 것 같습니다.
2024년도 흥행 영화 주간 누적관객수 시각화
이번에는 새롭게 주간 누적 관객수를 알아보고 싶어서 피봇 테이블의 설정을 달리해보았습니다. 피봇 테이블에서 누적으로 계산해 주는 설정은 없지만, 원 데이터에 누적관객수 데이터가 있기 때문에 쉽게 만들 수 있었습니다.
◲ 피봇 테이블 설정:
- 행: 영화명 / 정렬기준: 누적관객수의 MAX 내림차순
- 열: 개봉주차 / 정렬기준: 개봉주차 오름차순
- 값: 누적관객수 / 요약기준: MAX
- 필터: 개봉주차 / 값이 1보다 크거나 같음

피봇 테이블로 계산된 누적관객수 데이터로 상위 10위 흥행 영화의 누적 관객수의 그래프를 만들었습니다.

입소문 흥행패턴에 해당하는 <파묘>, <인사이드 아웃 2> 두 영화의 누적 관객수 그래프가 중간에 다른 영화보다 높아지는 모습을 볼 수 있습니다.
2024년도 영화 중 상영일수가 가장 많은 영화는?
주간 관객수 데이터를 확인하기 위해 만든 Weekly 시트에서 피봇 테이블의 개봉주차 열이 최대 50까지 표시되는 것을 확인할 수 있습니다.

개봉 후 50주차에 상영을 한 영화가 있다는 의미입니다. 그래서 이번에는 영화 상영일수가 가장 많은 영화 즉 장기 상영한 영화를 알아보기 위해서 피봇 테이블을 만들어봤습니다.
◲ 피봇 테이블 설정:
- 행:
- 영화명 / 정렬기준: 날짜의 COUNTUNIQUE 내림차순
- 개봉일 / 정렬기준: 개봉일 내림차순
- 값:
- 관객수 / 요약기준: SUM
- 날짜 / 요약기준: COUNTUNIQUE

관객수는 많지 않아도 상영일수가 긴 영화들이 굉장히 많다는 것을 확인할 수 있었습니다.

2024년도에 상영일수가 가장 많은 영화
1위는 307일을 상영한 <너의 이름은.> 이었고,
2위는 306일을 상영한 <더 퍼스트 슬램덩크> 입니다.

박스오피스 데이터에서 제공하는 장르 정보를 확인해 보니 장기 상영한 작품에는 애니메이션 장르가 많다는 것을 알 수 있습니다.
참고로 <더 퍼스트 슬램덩크>는 2023년도에 상영일수가 363일로 가장 많은 영화 1위였습니다. 개봉일이 2023년 1월 4일이므로 개봉 전에도 상영한 일수가 있고, 개봉 이후 상영관에서 내린 적이 없다는 의미입니다.

1년치 일별 박스오피스 데이터 공유
이 포스팅에서 사용한 스프레드시트 공유 링크입니다.
개봉주차를 계산하는 수식, 피봇 테이블, 그래프의 설정 등을 직접 확인할 수 있습니다.
⭐ 공유 스프레드시트: [공유] 박스오피스 2024
https://docs.google.com/spreadsheets/d/1hWGvJqHGG16CERGZig7enllWYBYBETG_iUrklWsPtmc/copy

1년 치 일별 박스오피스 데이터가 쌓여있으므로 파일이 좀 무겁습니다.
이 점 유의하시기 바랍니다.

댓글 남기기