<그래프>
범주형자료 요약
1. 막대그래프(bar graph): 막대 높이가 상대도수에 비례(세로 = 상대도수), 전체 막대의 길이의 합 = 1 ※도수일 수도 있음
2. 원형그래프(pie graph): 부채꼴 넓이가 상대도수에 비례

양적자료 요약
3. 히스토그램(histogram): 기둥의 넓이가 상대도수에 비례(가로x세로 = 상대도수), 전체 직사각형의 넓이의 합 = 1
4. 줄기-잎 그림(stem-and-leaf display): 세로 열은 줄기, 각 줄기에서 나열된 가로 행은 잎, 계급에 속하는 자료의 원래값을 보여줌

이차원자료 요약
5. 분할표(또는 교차표, contingency table): 계급별로 각 특성을 나누어 표로 정리
6. 산점도(scatter plot): 두 자료가 모두 연속적인 경우, 두 특성의 변화 관계 파악(positive인지 negative인지)

<결합분포(Joint distribution)>
두 특성값(키, 몸무게)을 갖는 이차원 모집단의 분포
※주변분포: 결합분포로부터 합산된 값들

<공분산 (covariance)>
두 특성값을 각각의 평균으로 뺀 것들의 곱의 평균

<상관관계 (correlation coefficient)>
두 특성값을 각각 표준화시킨 것들의 곱의 평균, -1≤ p(rho) ≤1
공분산에서 두 특성값의 표준편차의 곱을 나누어주면 상관관계가 됨

<모집단 분포>
모집단의 특성값이 흩어져 있는 상태를 나타내기 위해, 합이 1이 되는 양수들을 각 특성값에 대응시켜 나타낸 것이다. 특성값은 이산적(discrete)인 경우와 연속적(continuous)인 경우가 있다.

자료의 개수를 늘리면서 계급의 간격을 줄이면 히스토그램은 곡선으로 수렴한다. 히스토그램에서 상대도수의 합은 1이므로, 곡선 아래의 넓이는 1이다. 구간(a, b)사이에서 상대도수의 합은 구간(a, b) 곡선 아래의 넓이가 되고, 이는 관측값이 구간(a,b)에 속할 확률(probability)이 된다. 곡선을 확률밀도곡선(probability density curve)이라하고, 곡선을 나타내는 함수를 확률밀도함수(probability density function), p(x)라 한다.

<제p백분위수>
특성값들 중 p%이상이 그 값보다 같거나 작고 (100-p)% 이상이 그 값보다 같거나 크게되는 값
1. 제25백분위수: 제1사분위수(first quartile) = Q1
2. 제50백분위수: 제2사분위수(Second quartile) = Q2 = 중앙값(median)
3. 제75백분위수: 제3사분위수(Third quartile) = Q3

<중심위치>
-모평균(Mean)
-중앙값(Median)
-최빈값(Mode)

<산포>
-모표준편차(Standard Deviaiton)
-모분산(Variance)
-사분위수범위(Interquantile, IQR): Q3-Q1

<모집단과 표본 개념>
1. 모집단(population): 조사의 대상이 되는 집단 전체
2. 표본(sample): 모집단 전체 중 여론조사를 위하여 일부를 선택한 것
3. 표본오차(sampling error): 모집단이 아닌 표본에서 조사함으로써 불가피하게 발생되는 오차

<자료의 형태>
1. 양적변수: 수치적인 특성을 가지는 변수
1-1. 연속변수: 구간 내의 모든 연속적인 값을 취할 수 있는 경우 ex) 키, 몸무게, 부피
1-2. 이산변수: 셀 수 있거나 유한한 경우 ex) 사고 발생횟수, 불량품 수
2. 질적변수(범주형변수): 비수치적인 사실적 특성을 나타내는 변수

<자료측정의 척도>
자료가 어떤 척도에 따라 작성되었는지에 따라 통계적 처리방법에 차이가 존재
1. 명목척도(nominal scale): 분류,명명을 위해 이름만 존재
ex) 성별, 직업, 종교 , A=B, A≠B
2. 순서척도(ordinal scale): 서열관계 즉, 순서/순위가 존재
ex) 건강상태(양호/보통/나쁨), 학년, A>B, A=B, A<B
3. 구간척도(interval scale): 덧셈/뺄셈 가능하지만 절대영점이 없으므로 곱셈, 나눗셈 불가
ex) 온도, 시간, (A-B)+(B-C)=(A-C)
4. 비율척도(ratio scale): 곱셈, 나눗셈 가능
ex) 면적, 길이, 불량품 개수, A=kB이고 B=mC 이면 A=kmC(단 k,m≠0)

+ Recent posts