이번에는 구글 스프레드시트 사용법 (17) 날짜 함수 를 활용하여 긴 기간의 데이터를 피봇 테이블로 연간, 월간, 주간 테이블 만드는 방법을 알아보겠습니다. 샘플 데이터로는 2018년 11월부터 2019년 3월 사이의 점심 식사 날짜, 메뉴, 가격 데이터를 사용합니다. 기본 데이터입니다. 우선은 기본데이터 그대로 피봇 테이블을 만들어보겠습니다. 행에 '날짜'를 추가해보겠습니다. 아래와 같이 날짜 데이터가 그대로 표시됩니다. 기본 날짜 데이터만으로는 연간이나 월간 …
2018년 박스오피스 데이터 분석 2부
2018년 박스오피스 데이터 분석 1부의 후속편으로, 박스오피스의 일별 데이터와 개봉 요일 기준으로 주간 관객수를 분석하는 방법을 포스팅하겠습니다. 사실 이전 1부 포스팅에서는 일별 데이터가 아니라 월별 데이터여도 분석 가능한 내용들이었습니다. 일별 데이터로 다운로드 한 이유는 영화별 주간 관객수를 분석하고 싶어서였습니다. 영화진흥위원회에 주간/주말 박스오피스도 제공되고 있습니다만, 주간의 기준이 월요일~일요일로 설정되어 있어서 개봉요일이 서로 다른 영화를 비교하기 어렵습니다. …
2018년 박스오피스 데이터 분석 1부
2018년 박스오피스 분석 리포트 에서는 분석한 결과만 포스팅했었습니다. 이번 포스팅에서는 박스오피스 데이터를 분석하는 방법을 알려드리겠습니다. 이번 글은 구글 스프레드시트 사용법 (7) Query로 데이터 분석하기 후속편이기도 합니다. 전편에서는 쿼리(Query)로만 분석했습니다만, 실제로 업무 중에 데이터 분석할 때는 쿼리뿐만 아니라 피봇 테이블, 함수 등 다양한 방법을 활용하여 분석합니다. 영화진흥위원회(http://www.kofic.or.kr)에서 2018년도 1년간의 일별 박스오피스 데이터를 다운로드하여 스프레드시트로 가져오고 쿼리, 피봇 테이블, 함수 …
2018년 박스오피스 분석 리포트
영화진흥위원회(http://www.kofic.or.kr)에서 2018년도 1년치 박스오피스 데이터를 다운로드 후 분석하여 보고서를 만들어봤습니다. 월별 관객수, 매출액 월별 총 관객수, 매출액, 관객수가 가장 많은 영화 데이터입니다. 1위 영화는 평균적으로 각 달의 관객수, 매출액의 약 30%를 차지합니다. 가장 많은 관객수를 기록한 달은 8월입니다. 총 관객수 3억 명을 돌파했습니다. 하루에 거의 100만 명의 사람들이 영화를 관람했다는 의미입니다. 흥행 영화의 …
구글 스프레드시트 사용법 (7) Query로 데이터 분석하기
블로그 통계데이터를 보니 구글 스프레드시트 사용법 (3) QUERY 포스팅이 가장 인기가 좋아 QUERY 활용 예시를 추가해봅니다. QUERY는 대량의 데이터를 분석할 때 정말 편합니다. 이번에는 영화진흥위원회(http://www.kofic.or.kr)에서 2018년도 상반기(1월~6월) 월별 박스오피스 데이터를 다운로드 하여 Query와 스프레드시트의 함수, 계산식 등으로 분석하는 예시를 보여드리겠습니다. 데이터 준비 우선은 월별로 다운로드 받은 엑셀 데이터를 구글 드라이브에 올린 후, [Google 스프레드시트(으)로 열기 버튼]으로 스프레드시트로 변환합니다. …