본문 바로가기
Database & Bigdata/공공 빅데이터 청년 인턴십

[ DAY 18 ] 표준모델분석실습 - 관광축제

by jionee 2020. 9. 16.
SMALL

[ 분석 모델 개요 ]

- 분석 배경 및 목적

빅데이터 기반의 정책의사결정 지원체계 마련을 통해 

지자체 현안 반영 분석결과 도출

 

빅데이터 기반의 분석 + 지역별 관광/축제 활성화 + 맞춤형 정책 수립 지원

 

 

- 분석 프로세스

 

 

- 분석 활용 데이터

 

 

 

[ 실습 ] 

- 데이터 다운로드

www.tour.go.kr/

 

관광지식정보시스템

 

www.tour.go.kr

통계 > 관광자원통계 > 관광지 > 통계다운로드

 

 

- 경기도 데이터 추출

1. 다운로드한 통계에서 경기도 데이터 형성을 위해 14개 지점 확인

2. 분석을 위해 기초 관광지 지점 파일 생성

3. 인터넷 지도 사이트(네이버 지도 등)에서 각 지점 주소정보 확인 후 지오코딩 툴로 필요 데이터 수집

지도 사이트에서 관광지 주소 조회 > 지오코딩 툴에서 좌표계 설정(카텍) > 지오코딩 툴 입력 주소란에 주소 입력(한 건씩 처리) > 필요데이터를 앞에서 만든 엑셀에 복사(광역시/시군구/행정동/법정동/X좌표/Y좌표/주소)

 

14개 관광지 반복

 

지점정보를 모두 입력 후 CSV로 저장

(다른이름으로 저장 > CSV(쉼표로 분리) > 경기도관광지_XY.csv로 저장

 

 

- 카텍 좌표계 생성

QGIS 실행

TMS for Korea 플러그인 이용해 지도 호출 

 

설정>사용자 정의 좌표계 > 우측 상단 + 눌러 새로운 좌표계 생성

더보기

+proj=tmerc +lat_0=38 +lon_0=128 +k=0.9999 +x_0=400000 +y_0=600000 +ellps=bessel +units=m +no_defs +towgs84=-115.80,474.99,674.11,1.16,-2.31,-1.63,6.43

 

- 레이어 추가

레이어 추가 > 구분자로 분리된 텍스트 레이어 추가>경기도관광지_XY.csv

 

레이어 우클릭 > 좌표계 설정 > 레이어 좌표계 설정 > 카텍 네비게이션용 좌표계 선택

 

레이어 우클릭 > 속성 > 심볼 > 크기 5 설정

 

 

- 한국행정구역 데이터

kssc.kostat.go.kr/ksscNew_web/kssc/common/CommonBoardList.do?gubun=1&strCategoryNameCode=019&strBbsId=kascrr&categoryMenu=014

 

리스트

51   <2020.1.1. 기준 및 2019.12.31. 기준 행정구역분류> (수정) 관리자 2019-12-30 1176 -

kssc.kostat.go.kr

한국행정구역분류(2020.7.1. 기준) 다운로드

 

엑셀파일 열고 법정동코드 연계 자료분석용 탭 선택

 

현재 탭에서 필요한 컬럼(시도, 시군구, 행정구역명, 행정동(행정기관명), 법정동, 행정기관코드) 만 따로 CSV 저장 > 파일명 : 한국행정구역_수정파일.csv

 

- 필요 데이터 수집 및 확인

 

 

- 빅재미에서 유동인구 데이터 불러오기

sk_flow_in_2017.CSV, sk_flow_in_2018.CSV 워크플로우로 불러오기

 

데이터 병합 > ROW 확장 > 적용하기

 

컬럼 변경 > V1 컬럼 제외(불필요컬럼 삭제) > 컬럼명 변경 stdr_ym -> std_ym (불일치 컬럼명 변경) > BLK_CD 컬럼타입 numeric (타입 일치) > 적용하기

 

 

- QGIS 활용을 위한 좌표 추가(조인)

BLK_V4_GG.csv 워크플로우로 불러오기

 

컬럼변경된 유동인구데이터와 BLK_V4_GG 데이터 조인

 

데이터 조인 > Right Outer Join > BLK_CD의 타입을 numeric으로 변경 > BLK_CD 기준 체크 박스 체크 > 적용하기

 

 

 

- 데이터 정제 (결측치 처리)

결측치 처리 > std_ym 컬럼 처리방법: 지정값, 지정값 : 199001 > 나머지 컬럼의 처리 방법 -> 처리안함 -> 적용하기

 

 

- 데이터 정제 (std_ym 형식 표준화)

파생 변수 > 연산식 : paste0(std_ym,"01"), 파생변수명 : std_ym > 적용

 

 

 

- 데이터 정제 (컬럼명 및 컬럼 타입 변경)

컬럼변경 > 기존 std_ym 컬럼 체크 해제 > 새로 생성한 std_ym_1 컬럼을 드래그해 상단으로 이동 > std_ym으로 이름 변경 > character 타입으로 타입 변경 > 적용

CSV 파일 다운로드 > sk_flow_in_total.csv로 저장

 

 

- 추출한 파일 QGIS에서 보기

레이어 추가 > 구분자로 분리된 텍스트 레이어 추가 > sk_flow_in_total.csv 추가

* 글자가 깨져보이면 인코딩 변경

 

레이어 우클릭 > 좌표계 설정 > 레이어 좌표계 설정 > 카텍 네비게이션용 좌표계 설정

 

 

- 시도단위 구분자 추가를 위한 데이터 생성

빅재미로 돌아가 파생변수 생성

파생 변수 > 연산식 : str_sub(ADMI_CD,1,4), 파생변수명 : ADMI_CD_2 > 적용

CSV 파일 다운로드 > sk_flow_in_total_V2.csv로 변경

 

 

- QGIS로 포천지역 필터링

레이어 추가 > 구분자로 분리된 텍스트 레이어 추가 > sk_flow_in_total_V2.csv 추가

레이어 우클릭 > 좌표계 설정 > 레이어 좌표계 설정 > 카텍 네비게이션용 좌표계 선택

 

레이어 우클릭 > 필터설정 > "ADMI_CD_2" = 4165 추가(포천지역 필터링)

 

 

포천지역만 필터링 된 결과

 

 

 

 

- 관광지이름 라벨로 설정

경기도관광지_XY 레이어 우클릭 > 속성 > 라벨

단일 라벨 설정 > 값 : 관광지명

텍스트,버퍼,음영 등 바꿔서 원하는 스타일로 지정 (글자 크기는 20 권장)

 

 

 

- 경기도 관광지_XY 필터,버퍼 생성

경기도 관광지_XY 레이어 우클릭 > 필터 설정

 

경기도 관광지_XY > 벡터 > 공간처리도구 > 버퍼

거리 3000, 세그먼트 20

 

 

- 공간질의

플러그인 > 플러그인 관리 및 설치 > 공간 질의 설치

 

 

sk_flow_in_total_V2 레이어 우클릭 > 내보내기 > 다른이름으로 저장 > 포천시_버퍼결합 (선택된 개체만 저장에 체크)

 

- 속성 결합

포천시_버퍼결합 레이어 오른쪽 클릭 > 벡터 > 데이터 관리 도구 > 위치를 이용하여 속성을 조인 

 

 

joined layer 마우스 우클릭 > 내보내기 > 다른이름으로 저장 > 쉼표로 구분된 값 저장 > 포천시관광객분석.csv

 

 

- 빅재미로 차트 생성

포천시관광객분석.csv 파일 불러오기 > 피봇테이블 >

행기준 : 관광지명

연산대상 : man_flow_1부터 5까지

 

 

 

스타차트로 시각화

 

 

 

- 속성값 결합

레이어 > 레이어 추가 > 구분자로 구분된 텍스트 레이어 추가 > sk_flow_out_total_P0.csv

벡터> 데이터 관리 도구 > 위치를 이용하여 속성을 조인 

 

-중심점

조인된 레이어 선택 > 버퍼 > 도형 도구 > 중심점

 

 

중심점 레이어 오른쪽 마우스 > 속성 > 심볼 > 크기 옆의 메뉴버튼

댓글