기술통계
- 수집한 자료를 분석하여 대상들의 속성을 파악하는 통계방법
- 중심경향값 : 전체 자료를 대표할 수 있는 수치들
+ 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로 나눈 수치
+ 중앙값 : 최대값과 최소값의 정가운데 수치
+ 최빈값 : 가장 많은 빈도를 보이는 수치
- 분산도 : 전체 자료가 얼마나 퍼져 있는 지를 알 수 있는 수치들
+ 분산 : 각 자료가 평균으로 부터 떨어진 거리(편차)들을 제곱한 수치들의
총합을 전체 자료의 수로 나눈 수치
+ 표준편차 : 분산의 제곱을 취한 수치
- 상관계수 : 두 변수 간의 관계의 크기
- 회귀계수 : 독립변수(원인)가 종속변수(결과)에 미치는 영향의 크기
추리통계(추론통계)
- 모집단을 대표하는 표본을 추출하고 표본의 기술통계를 이용하여 모집단의 속성들을
유추하는 통계방법
- 신뢰구간
+ 추리통계에서 예측한 모집단의 특성이 위치할 가능성이 높은 구간
+ 표본에서 구해지는 기술통계값들을 이용하여 계산되며,
95%,99%,99.9% 신뢰수준에서 따라 달라진다.
(숫자가 높아질수록 정확성이 높아진다. 정확성을 높이기위해 신뢰구간을 높인다.)
- 모집단 : 연구 또는 분석이 이루어지는 전체 대상
+ 전수조사하는게 제일 좋으나 불가능에 가깝다.
- 표본 : 모집단에서 추출한 일부로, 모집단의 속성들을 유추하는데 사용
+ 확률표본추출방법 : 무작위로 표본을 추출하는 방법으로 모집단을
대표할 가능성이 높은 방법
+비확률표본추출방법 : 조사자의 편의나 판단에 의해서 표본을 추출하는
방법으로 모집단을 대표하지않을 가능성이 존재하는방법
표본을 얼마나 추출해야 모집단을 대표할수있을까
- 중심극한정리
+ 표본이 30 이상으로 충분히 클 때
1) 모집단의 분포와 상관없이 표본은 정규분포
2) 표본의 평균 = 모집단의 평균
3) 표본의 분산 = (모집단의 분산)/(표본의수)
- 자유도
+ 평균을 유지하면서 자유롭게 어떠한 값도 가질 수 있는 사례의 수 (N-1)
ex)모집단의 평균이 3일때 네개의 표본을 추출했을경우 3개는
자유롭게뽑고 나머지하나는 평균에 맞춰줘야한다.
'개발 소발 > 기초 통계' 카테고리의 다른 글
기초통계 | 척도,도수분포표,그래프 란? (0) | 2018.12.12 |
---|