본문 바로가기

Database & Bigdata54

[DAY 5] R로 배우는 통계 이해 - 통계적 실험과 유의성 검정 [ 4.2 가설 검정 ] 1. 가설 검정 2. 유의수준 설정 3. 검정방법 설정 4. P값 산출 5. P값 > 유의수준 이면 귀무가설 채택(H0) P값 실험 설계 -> 데이터 수집 -> 추론 및 결론 도출 - A/B 검정 두 처리 방법/제품/절차 중 어느 쪽이 우월하다는 것을 입증하기 위해 실험군을 두 그룹으로 나눠 진행하는 실험 처리군 : 특정 처리에 노출된 대상들의 집단 대조군 : 어떠한 처리도 하지않은 대상들의 집단 - 귀무가설 / H0 영가설 우연에 의한 결과라는 가설 .. 2020. 8. 28.
[DAY 4] R로 배우는 통계 이해 - 탐색적 데이터 분석, 데이터 표본 분포 [ 2.1 정형화된 데이터의 요소 ] - 정형 데이터의 종류 수치 데이터 연속형 데이터 : ex) 풍속, 지속 시간 등 실수 데이터 이산형 데이터 : ex) 사건의 발생 빈도 등 정수 데이터 범주형 데이터 : 비순서형 (명목형) 범주 데이터 : 예) 도시명(대전, 부산, 서울), 참/거짓 등 순서형 범주 데이터 : 예) 평점 등 [ 2.2 테이블 데이터 ] - 테이블 데이터 데이터 분석에서 가장 대표적으로 사용되는 형태 ex) 엑셀 - 스프레드시트, 데이터베이스 - 테이블 열 : 피처/특징/속성/변수 행 : 레코드 / 관측값/사례/기록값 [ 2.3 위치 추정 - 평균 ] - 데이터를 살펴보는 가장 기초적인 단계는 각 피쳐(변수)의 '대푯값'을 구하는 것 - 대푯값 : 대부분의 값이 어디쯤에 위치하는지 .. 2020. 8. 27.
[DAY 3-4] R로 배우는 통계 이해 - R 프로그래밍이해 / 통계기초 [ DAY 3 ] 1. R설치 및 기본 설정 [R과 R studio] R : 통계 계산 및 그래픽을 위한 언어 및 환경 R studio : R을 위한 통합개발환경(IDE) [ R studio 기본 설정 ] 라이브러리(패키지)의 설치 및 사용 - install.packages("ggplot2") : 라이브러리 설치는 라이브러리 파일을 하드디스크(보조 기억장치)에 저장 - library(ggplot2) : 라이브러리 부착은 하드디스크에서 주 기억 장치로 적재 - search() 부착된 라이브러리 목록 확인 * 컴퓨터를 끄거나 R 스튜디오를 닫는 경우 주 기억 장치에 있던 라이브러리는 지워짐 2. 데이터형과 연산 [ 데이터형 ] 변수에 값 저장 : =, 을 통한 대입 ex) x 5) # x 요소값이 모두 5보.. 2020. 8. 27.
[SQLD] SQL 최적화의 원리 - 옵티마이저와 실행 계획, 옵티마이저 종류, 인덱스, 실행 계획, 옵티마이저 조인 1. 옵티마이저 (Optimizer) - SQL 개발자가 SQL을 작성해 실행할 때, 옵티마이저는 SQL을 어떻게 실행할 것인지를 계획하게 됨 (즉, 실행 계획을 수립하고 SQL을 실행) - 옵티마이저는 SQL을 실행 계획을 수립하고, SQL을 실행하는 데이터베이스 관리 시스템의 소프트웨어 - 동일한 결과가 나오는 SQL도 어떻게 실행하느냐에 따라서 성능이 달라짐 - 옵티마이저의 실행 계획은 SQL 성능에 아주 중요한 역할을 함 2. 옵티마이저 특징 - 옵티마이저는 데이터 딕셔너리에 있는 오브젝트 통계, 시스템 통계 등의 정보를 사용해서 예상되는 비용 산정 - 옵티마이저는 여러 개의 실행 계획 중에서 최저비용을 가지고 있는 계획을 선택해서 SQL을 실행 3. 옵티마이저의 필.. 2020. 8. 25.