[ 분석 모델 개요 ]
- 분석 배경 및 목적
빅데이터 기반의 정책의사결정 지원체계 마련을 통해
지자체 현안 반영 분석결과 도출
빅데이터 기반의 분석 + 지역별 관광/축제 활성화 + 맞춤형 정책 수립 지원
- 분석 프로세스
- 분석 활용 데이터
[ 실습 ]
- 데이터 다운로드
통계 > 관광자원통계 > 관광지 > 통계다운로드
- 경기도 데이터 추출
1. 다운로드한 통계에서 경기도 데이터 형성을 위해 14개 지점 확인
2. 분석을 위해 기초 관광지 지점 파일 생성
3. 인터넷 지도 사이트(네이버 지도 등)에서 각 지점 주소정보 확인 후 지오코딩 툴로 필요 데이터 수집
지도 사이트에서 관광지 주소 조회 > 지오코딩 툴에서 좌표계 설정(카텍) > 지오코딩 툴 입력 주소란에 주소 입력(한 건씩 처리) > 필요데이터를 앞에서 만든 엑셀에 복사(광역시/시군구/행정동/법정동/X좌표/Y좌표/주소)
14개 관광지 반복
지점정보를 모두 입력 후 CSV로 저장
(다른이름으로 저장 > CSV(쉼표로 분리) > 경기도관광지_XY.csv로 저장
- 카텍 좌표계 생성
QGIS 실행
TMS for Korea 플러그인 이용해 지도 호출
설정>사용자 정의 좌표계 > 우측 상단 + 눌러 새로운 좌표계 생성
+proj=tmerc +lat_0=38 +lon_0=128 +k=0.9999 +x_0=400000 +y_0=600000 +ellps=bessel +units=m +no_defs +towgs84=-115.80,474.99,674.11,1.16,-2.31,-1.63,6.43
- 레이어 추가
레이어 추가 > 구분자로 분리된 텍스트 레이어 추가>경기도관광지_XY.csv
레이어 우클릭 > 좌표계 설정 > 레이어 좌표계 설정 > 카텍 네비게이션용 좌표계 선택
레이어 우클릭 > 속성 > 심볼 > 크기 5 설정
- 한국행정구역 데이터
한국행정구역분류(2020.7.1. 기준) 다운로드
엑셀파일 열고 법정동코드 연계 자료분석용 탭 선택
현재 탭에서 필요한 컬럼(시도, 시군구, 행정구역명, 행정동(행정기관명), 법정동, 행정기관코드) 만 따로 CSV 저장 > 파일명 : 한국행정구역_수정파일.csv
- 필요 데이터 수집 및 확인
- 빅재미에서 유동인구 데이터 불러오기
sk_flow_in_2017.CSV, sk_flow_in_2018.CSV 워크플로우로 불러오기
데이터 병합 > ROW 확장 > 적용하기
컬럼 변경 > V1 컬럼 제외(불필요컬럼 삭제) > 컬럼명 변경 stdr_ym -> std_ym (불일치 컬럼명 변경) > BLK_CD 컬럼타입 numeric (타입 일치) > 적용하기
- QGIS 활용을 위한 좌표 추가(조인)
BLK_V4_GG.csv 워크플로우로 불러오기
컬럼변경된 유동인구데이터와 BLK_V4_GG 데이터 조인
데이터 조인 > Right Outer Join > BLK_CD의 타입을 numeric으로 변경 > BLK_CD 기준 체크 박스 체크 > 적용하기
- 데이터 정제 (결측치 처리)
결측치 처리 > std_ym 컬럼 처리방법: 지정값, 지정값 : 199001 > 나머지 컬럼의 처리 방법 -> 처리안함 -> 적용하기
- 데이터 정제 (std_ym 형식 표준화)
파생 변수 > 연산식 : paste0(std_ym,"01"), 파생변수명 : std_ym > 적용
- 데이터 정제 (컬럼명 및 컬럼 타입 변경)
컬럼변경 > 기존 std_ym 컬럼 체크 해제 > 새로 생성한 std_ym_1 컬럼을 드래그해 상단으로 이동 > std_ym으로 이름 변경 > character 타입으로 타입 변경 > 적용
CSV 파일 다운로드 > sk_flow_in_total.csv로 저장
- 추출한 파일 QGIS에서 보기
레이어 추가 > 구분자로 분리된 텍스트 레이어 추가 > sk_flow_in_total.csv 추가
* 글자가 깨져보이면 인코딩 변경
레이어 우클릭 > 좌표계 설정 > 레이어 좌표계 설정 > 카텍 네비게이션용 좌표계 설정
- 시도단위 구분자 추가를 위한 데이터 생성
빅재미로 돌아가 파생변수 생성
파생 변수 > 연산식 : str_sub(ADMI_CD,1,4), 파생변수명 : ADMI_CD_2 > 적용
CSV 파일 다운로드 > sk_flow_in_total_V2.csv로 변경
- QGIS로 포천지역 필터링
레이어 추가 > 구분자로 분리된 텍스트 레이어 추가 > sk_flow_in_total_V2.csv 추가
레이어 우클릭 > 좌표계 설정 > 레이어 좌표계 설정 > 카텍 네비게이션용 좌표계 선택
레이어 우클릭 > 필터설정 > "ADMI_CD_2" = 4165 추가(포천지역 필터링)
포천지역만 필터링 된 결과
- 관광지이름 라벨로 설정
경기도관광지_XY 레이어 우클릭 > 속성 > 라벨
단일 라벨 설정 > 값 : 관광지명
텍스트,버퍼,음영 등 바꿔서 원하는 스타일로 지정 (글자 크기는 20 권장)
- 경기도 관광지_XY 필터,버퍼 생성
경기도 관광지_XY 레이어 우클릭 > 필터 설정
경기도 관광지_XY > 벡터 > 공간처리도구 > 버퍼
거리 3000, 세그먼트 20
- 공간질의
플러그인 > 플러그인 관리 및 설치 > 공간 질의 설치
sk_flow_in_total_V2 레이어 우클릭 > 내보내기 > 다른이름으로 저장 > 포천시_버퍼결합 (선택된 개체만 저장에 체크)
- 속성 결합
포천시_버퍼결합 레이어 오른쪽 클릭 > 벡터 > 데이터 관리 도구 > 위치를 이용하여 속성을 조인
joined layer 마우스 우클릭 > 내보내기 > 다른이름으로 저장 > 쉼표로 구분된 값 저장 > 포천시관광객분석.csv
- 빅재미로 차트 생성
포천시관광객분석.csv 파일 불러오기 > 피봇테이블 >
행기준 : 관광지명
연산대상 : man_flow_1부터 5까지
스타차트로 시각화
- 속성값 결합
레이어 > 레이어 추가 > 구분자로 구분된 텍스트 레이어 추가 > sk_flow_out_total_P0.csv
벡터> 데이터 관리 도구 > 위치를 이용하여 속성을 조인
-중심점
조인된 레이어 선택 > 버퍼 > 도형 도구 > 중심점
중심점 레이어 오른쪽 마우스 > 속성 > 심볼 > 크기 옆의 메뉴버튼
'Database & Bigdata > 공공 빅데이터 청년 인턴십' 카테고리의 다른 글
[ 최종 프로젝트 - 시각화 ] 교통안전시설물 대체 및 추가 입지 선정 빅데이터 분석 (0) | 2020.09.24 |
---|---|
[ 최종 프로젝트 - 개요 및 데이터 전처리 ] 교통안전시설물 대체 및 추가 입지 선정 빅데이터 분석 (1) | 2020.09.16 |
[ DAY 17 ] 표준분석모델실습 - 민원분야 (0) | 2020.09.15 |
[ DAY 16 ] 표준분석모델실습 - 전기차 충전 인프라 설치 입지 선정(천안) (0) | 2020.09.14 |
[ DAY 15 ] 빅데이터 분석Tool을 이용한 분석 ( BigZAMi, QGIS 분석 실습 ) (2) | 2020.09.11 |
댓글