2018년 박스오피스 데이터 분석 2부

2018년 박스오피스 데이터 분석 1부의 후속편으로, 박스오피스의 일별 데이터와 개봉 요일 기준으로 주간 관객수를 분석하는 방법을 포스팅하겠습니다. 사실 이전 1부 포스팅에서는 일별 데이터가 아니라 월별 데이터여도 분석 가능한 내용들이었습니다. 일별 데이터로 다운로드 한 이유는 영화별 주간 관객수를 분석하고 싶어서였습니다. 영화진흥위원회에 주간/주말 박스오피스도 제공되고 있습니다만, 주간의 기준이 월요일~일요일로 설정되어 있어서 개봉요일이 서로 다른 영화를 비교하기 어렵습니다. …

2018년 박스오피스 데이터 분석 1부

2018년 박스오피스 분석 리포트 에서는 분석한 결과만 포스팅했었습니다. 이번 포스팅에서는 박스오피스 데이터를 분석하는 방법을 알려드리겠습니다. 이번 글은 구글 스프레드시트 사용법 (7) Query로 데이터 분석하기 후속편이기도 합니다. 전편에서는 쿼리(Query)로만 분석했습니다만, 실제로 업무 중에 데이터 분석할 때는 쿼리뿐만 아니라 피봇 테이블, 함수 등 다양한 방법을 활용하여 분석합니다. 영화진흥위원회(http://www.kofic.or.kr)에서 2018년도 1년간의 일별 박스오피스 데이터를 다운로드하여 스프레드시트로 가져오고 쿼리, 피봇 테이블, 함수 …

구글 스프레드시트 사용법 (8) 데이터 필터링하기

스프레드시트에서 기본으로 제공하는 필터 만들기 기능과, Query함수를 필터처럼 사용하는 방법을 알려드리겠습니다. 미쉐린 가이드 서울 2019의 빕 구르망의 레스토랑 데이터를 요리유형별, 지역별로 필터링해서 보는 시트를 만들어보겠습니다. 데이터 준비 ★ 샘플 스프레드시트: data시트에 빕 구르망에 선정된 61개 레스토랑의 요리유형, 레스토랑 이름, 주소, 연락처, 웹사이트, 예약유형의 데이터를 정리했습니다.   요리유형으로 필터링 헤더 정보가 있는 1행을 선택 후, 데이터 > …

구글 스프레드시트 사용법 (7) Query로 데이터 분석하기

블로그 통계데이터를 보니 구글 스프레드시트 사용법 (3) QUERY 포스팅이 가장 인기가 좋아 QUERY 활용 예시를 추가해봅니다. QUERY는 대량의 데이터를 분석할 때 정말 편합니다. 이번에는 영화진흥위원회(http://www.kofic.or.kr)에서 2018년도 상반기(1월~6월) 월별 박스오피스 데이터를 다운로드 하여  Query와 스프레드시트의 함수, 계산식 등으로 분석하는 예시를 보여드리겠습니다. 데이터 준비 우선은 월별로 다운로드 받은 엑셀 데이터를 구글 드라이브에 올린 후, [Google 스프레드시트(으)로 열기 버튼]으로 스프레드시트로 변환합니다. …

구글 스프레드시트 사용법 (3) QUERY

이번 예시는 업무에서 사용하는 시트는 아니지만, QUERY 함수를 배울 수 있는 점심 메뉴 기록 시트를 알려드리겠습니다. 데이터베이스 검색할 때 사용하는 그 쿼리를 스프레드시트에서 사용할 수 있습니다. 데이터베이스에서 사용되는 쿼리와 사용법이 조금 다르긴합니다만, 컬럼명대신 열을 나타내는 알파벳(A, B, C...)을 이용하는 점만 유의하면 데이터베이스를 검색하듯이 스프레드시트의 데이터를 검색할 수 있습니다. QUERY 도움말 페이지에 써있듯이 쿼리 언어에 대한 …