척도

척도에 따라 분석방법이 달라진다.


척도의 원칙

- 포괄성 : 척도 안에 모든 경우의 수가 포함되어야 한다는 원칙

ex) 잘못된 예 : 고졸, 전문대졸, 4년대졸, 대학원졸

    잘된 예 : 고졸 이하, 전문대졸, 4년대졸, 대학원졸 이상

    모든 경우의 수가 포함되어야 한다.

- 상호배타성 : 척도 안에 중복되는 경우의 수가 없어야 한다는 원칙

ex) 잘못된 예 : 1백만원 이하, 1백만원 ~ 2백만원 

    잘된 예 : 1백만원 이하, 1백만원 초과 ~2백만원 이상

    겹치는 것이 없어야한다.


포괄성, 상호배타성을 기초로 4가지 척도로 구분된다.


명목척도

- 측정이 이루어지는 항목들이 상호배타적인 특성만 가진척도

ex) 남성, 여성

서열척도

- 명목척도들 중 항목들 간에 서열이나 순위가 존재하는 척도

ex) 무학, 초졸, 중졸, 고졸, 전문대졸, 4년대졸등등


등간척도

- 서열척도들 중 항목들 간의 간격이 일정한 척도

ex) 매우불만족,약간불만족,보통,약간만족,매우만족

비율척도

- 등간척도 중 아무 것도 없는 상태를 '0'으로 정할 수 있는 척도

ex) 20세 이하,21~30세,31~40세,41~50세

0이라는 개념은 아직 태어나지않음을 뜻함

반대로 온도는 0도 아래도 있기에 비율척도가 아님


도수분포표,그래프


도수분포표와 그래프는 모아진 데이터를 일목요연하게 보여주는 방법이다.


도수분포표

- 수집된 자료를 쉽게 이해할 수 있도록 일목요연하게 정리된 표로,

  특정 항목 또는 특정 범위에 속하는 빈도수를 나타낸 표

  ex) 연령대가 28, 30, 31, 33, 35, 41, 42가 있다면

      특정범위는 20 초과 30 이하, 30초과 40이하, 40초과 50이하

      빈도수는 1, 4, 2 합계 7로 표현한다.


그래프

- 막대그래프

+ 비연속형 변수(명목척도 및 서열척도)에 사용되는 그래프로,

  각 항목에 속하는 빈도수를 나타낸 그래프


- 히스토그램

+ 연속형 변수(등간척도 및 서열척도)에 사용되는 그래프로,

  일정 범위에 속하는 빈도수를 나타낸 그래프

- 선그래프

+ 히스토그램의 끝 부분을 선으로 연결한 그래프

'개발 소발 > 기초 통계' 카테고리의 다른 글

기초통계 | 기술통계,추리통계 란?  (0) 2018.12.11

기술통계

- 수집한 자료를 분석하여 대상들의 속성을 파악하는 통계방법

- 중심경향값 : 전체 자료를 대표할 수 있는 수치들

+ 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로 나눈 수치 

+ 중앙값 : 최대값과 최소값의 정가운데 수치

+ 최빈값 : 가장 많은 빈도를 보이는 수치

- 분산도 : 전체 자료가 얼마나 퍼져 있는 지를 알 수 있는 수치들

+ 분산 : 각 자료가 평균으로 부터 떨어진 거리(편차)들을 제곱한 수치들의

총합을 전체 자료의 수로 나눈 수치

+ 표준편차 : 분산의 제곱을 취한 수치


- 상관계수 : 두 변수 간의 관계의 크기


- 회귀계수 : 독립변수(원인)가 종속변수(결과)에 미치는 영향의 크기

추리통계(추론통계)

- 모집단을 대표하는 표본을 추출하고 표본의 기술통계를 이용하여 모집단의 속성들을

  유추하는 통계방법

- 신뢰구간

+ 추리통계에서 예측한 모집단의 특성이 위치할 가능성이 높은 구간

+ 표본에서 구해지는 기술통계값들을 이용하여 계산되며,

  95%,99%,99.9% 신뢰수준에서 따라 달라진다.

  (숫자가 높아질수록 정확성이 높아진다. 정확성을 높이기위해 신뢰구간을 높인다.)


- 모집단 : 연구 또는 분석이 이루어지는 전체 대상

+ 전수조사하는게 제일 좋으나 불가능에 가깝다.


- 표본 : 모집단에서 추출한 일부로, 모집단의 속성들을 유추하는데 사용

+ 확률표본추출방법 :  무작위로 표본을 추출하는 방법으로 모집단을 

      대표할 가능성이 높은 방법

+비확률표본추출방법 : 조사자의 편의나 판단에 의해서 표본을 추출하는

      방법으로 모집단을 대표하지않을 가능성이 존재하는방법


표본을 얼마나 추출해야 모집단을 대표할수있을까

- 중심극한정리 

+ 표본이 30 이상으로 충분히 클 때

1) 모집단의 분포와 상관없이 표본은 정규분포

2) 표본의 평균 = 모집단의 평균

3) 표본의 분산 = (모집단의 분산)/(표본의수)


- 자유도

+ 평균을 유지하면서 자유롭게 어떠한 값도 가질 수 있는 사례의 수 (N-1)

  ex)모집단의 평균이 3일때 네개의 표본을 추출했을경우 3개는 

     자유롭게뽑고 나머지하나는 평균에 맞춰줘야한다.

'개발 소발 > 기초 통계' 카테고리의 다른 글

기초통계 | 척도,도수분포표,그래프 란?  (0) 2018.12.12

+ Recent posts