본문 바로가기
똑똑해지기/Data Statistics + Probability

통계학이란?

by 굴러다니는 감자의 모험 2021. 4. 22.
반응형

1. 통계학

불확실한 상황 하에서 데이터에 근거하여 과학적인 의사결정과 예측을 돕기 위한 이론과 방법의 체계를 다루는 학문이 통계학이다. 이때, 어떤 목적에 따라 수집된 정보를 데이터라고 하며 합리적인 의사결정을 내리기 위해 수집/요약/분석/표현하는 과학을 통계라고 한다.

 

2. 모집단

통계 분석의 연구대상이 되는 모든 개체들의 집합으로 올바른 의사결정을 하기 위해 관심을 갖고 연구해야 할 대상을 말한다.

  • 유한모집단 : 유한개 자료로 구성된 모집단
  • 무한모집단 : 무한개 자료로 구성된 모집단
  • 모집단 크기 : 모집단 자료의 수

 

3. 표본(sample)

모집단의 특성을 파악하기 위해 모집단으로부터 일정한 규칙에 의해 추출한 모집단의 부분집합이다.

 

예를 들어보자.

 

강원도 홍천군 학생들의 가장 선호하는 머리스타일을 찾기 위해선 홍천군 관내의 모든 초/중/고등학교의 학생들을 조사해야한다. 그러나 이는 시간도 오래걸릴 뿐더러 그 수가 많기에 한명한명 조사하기는 어려운 방법이다.

그러니 각 학교에 학년당 한 반의 학생만 추려 데이터를 모아 분석해내면 꽤 유의미한 결과를 얻을 수 있다는 거다.

 

  • 표본의 크기 : 표본을 이루는 자료의 수
  • ROI(Region of interest) : 관심영역, 데이터 샘플

 

4. 모수(parameter)

모집단의 특성을 나타내는 수치로서 올바른 의사결정을 위해 특별히 관심을 갖는 모수를 연구 대상으로 한다.

평균, 분산, 표준편차, 비율 등이 모수로서 동작할 수 있다.

 

5. 통계적 추론

모집단의 특성(평균, 분산, 비율)을 추측하는 것으로 추정이나 가설 검정이 있다.

 

6. 통계량

모집단의 특성을 추측하기 위해 사용하는 표본의 함수다.

 

7. 추정량

모수를 추정하는데 사용하는 통계량이다. 표본평균, 표본분산, 표본비율 등이다.

 

8. 데이터 척도의 유형

명목척도 순서척도 구간척도 비율척도
순서와 크기 등 의미 없음 순서의미 있지만
간격의미 없음
순서&간격의미 있으나
비율의미
x
순서&간격&비율
모두 의미 있음
성별차번호 직급계급 화씨온도표준점수 무게길이농도압력속도 

 

9. 통계학의 구성 체계

 

통계학은 기술통계학과 추측통계학으로 나뉜다.

기술통계학을 통해 데이터 정리 및 요약, 통계량 계산, 그래픽 표현을 수행하고 이를 기반으로 추측 통계학을 통해 가설검정이나 모순추정, 회귀분석 등을 이용해 유의미한 결과를 도출해낸다.

 

10. 통계적 의사결정 절차

모집단을 샘플링하여 표본을 만들어낸 후 기술통계 - 추측통계를 통해 가치 있는 정보를 내어 최종 의사결정을 내린다는 흐름으로 이해하면 쉽다.

 

 

반응형

'똑똑해지기 > Data Statistics + Probability' 카테고리의 다른 글

통계와 자료의 종류  (2) 2021.04.23
확률이란?  (0) 2021.04.16