분류 전체보기133 [DAY 5] R로 배우는 통계 이해 - 회귀와 예측 [ 5.1 단순선형회귀 ] 상관분석 vs 단순 선형 회귀분석 상관분석 : 두 양적 자료의 선형관계 (또는 연관) 유무를 통계적 관점으로 다룰 수 있지만 두 자료의 선형 관계식 제시는 X 상관관계 : 두 변수 사이의 전체적인 관련 강도를 측정하는 것이라면, 회귀는 관계 자체를 정량화하는 방법이라는 점에서 차이가 있음 단순 선형 회귀분석 : 두 자료의 선형식과 설명식과 설명할 수 없는 오차항(확률변수)으로 만들어진 모형 ex) 키가 170일 때, 몸무게값 파악 가능 - 회귀모델 한 변수와 또 다른 변수의 크기에 어떤 관계를 정량화 하는 법 - 단순선형회귀 모델 선형관계(즉, 직선)을 이용해서 변수 X로 부터 변수 Y를 예측 한 변수와 또 다른 변수의 크기에 어떤 관계를 정량화 하는 방법 Y = b0+b1 .. 2020. 8. 28. [DAY 5] R로 배우는 통계 이해 - 통계적 실험과 유의성 검정 [ 4.2 가설 검정 ] 1. 가설 검정 2. 유의수준 설정 3. 검정방법 설정 4. P값 산출 5. P값 > 유의수준 이면 귀무가설 채택(H0) P값 실험 설계 -> 데이터 수집 -> 추론 및 결론 도출 - A/B 검정 두 처리 방법/제품/절차 중 어느 쪽이 우월하다는 것을 입증하기 위해 실험군을 두 그룹으로 나눠 진행하는 실험 처리군 : 특정 처리에 노출된 대상들의 집단 대조군 : 어떠한 처리도 하지않은 대상들의 집단 - 귀무가설 / H0 영가설 우연에 의한 결과라는 가설 .. 2020. 8. 28. [DAY 4] R로 배우는 통계 이해 - 탐색적 데이터 분석, 데이터 표본 분포 [ 2.1 정형화된 데이터의 요소 ] - 정형 데이터의 종류 수치 데이터 연속형 데이터 : ex) 풍속, 지속 시간 등 실수 데이터 이산형 데이터 : ex) 사건의 발생 빈도 등 정수 데이터 범주형 데이터 : 비순서형 (명목형) 범주 데이터 : 예) 도시명(대전, 부산, 서울), 참/거짓 등 순서형 범주 데이터 : 예) 평점 등 [ 2.2 테이블 데이터 ] - 테이블 데이터 데이터 분석에서 가장 대표적으로 사용되는 형태 ex) 엑셀 - 스프레드시트, 데이터베이스 - 테이블 열 : 피처/특징/속성/변수 행 : 레코드 / 관측값/사례/기록값 [ 2.3 위치 추정 - 평균 ] - 데이터를 살펴보는 가장 기초적인 단계는 각 피쳐(변수)의 '대푯값'을 구하는 것 - 대푯값 : 대부분의 값이 어디쯤에 위치하는지 .. 2020. 8. 27. [DAY 3-4] R로 배우는 통계 이해 - R 프로그래밍이해 / 통계기초 [ DAY 3 ] 1. R설치 및 기본 설정 [R과 R studio] R : 통계 계산 및 그래픽을 위한 언어 및 환경 R studio : R을 위한 통합개발환경(IDE) [ R studio 기본 설정 ] 라이브러리(패키지)의 설치 및 사용 - install.packages("ggplot2") : 라이브러리 설치는 라이브러리 파일을 하드디스크(보조 기억장치)에 저장 - library(ggplot2) : 라이브러리 부착은 하드디스크에서 주 기억 장치로 적재 - search() 부착된 라이브러리 목록 확인 * 컴퓨터를 끄거나 R 스튜디오를 닫는 경우 주 기억 장치에 있던 라이브러리는 지워짐 2. 데이터형과 연산 [ 데이터형 ] 변수에 값 저장 : =, 을 통한 대입 ex) x 5) # x 요소값이 모두 5보.. 2020. 8. 27. 이전 1 ··· 27 28 29 30 31 32 33 34 다음