728x90
◆ 데이터의 퍼짐 정도를 측정하는 값들에 대한 개념에 대하여 공부했습니다.
→ 데이터 집합이 얼마나 퍼져 있는지를 알아보는데 사용하는 값들로 산포도, 편차, 분산, 표준편차 등이 있습니다.
▶산포도 (dispersion)
- 자료의 변량들이 흩어져 있는 정도를 수로 나타낸 값
- 산포도가 크면 변량들이 평균으로 부터 멀리 떨어져 있다, 변동성이 커진다.
- 산포도가 작으면 변량들이 평균 주위에 밀집, 변동성이 작아진다.
▶편차
- 변량에서 평균을 뺀 값 (편차 = 변량 - 평균)
- 그렇기 때문에 편차의 총 합은 항상 0이다.
▶분산(variance)
- 편차의 제곱을 n-1로 나눔 (n-1값이 표본의 자유도가 되기 때문)
- 데이터가 얼마나 퍼져 있는지 알아볼 수 있다.
▶표준편차(Standard Deviation)
- 자료의 산포도를 나타내는 수치, 분산의 양의 제곱근
728x90
'자격증 > [ADsP]' 카테고리의 다른 글
[ADsP]데이터 마트와 데이터 웨어하우스 (0) | 2023.02.16 |
---|---|
[ADsP] 가설검정 (귀무가설, 대립가설, 제 1종 오류, 제 2종 오류) (0) | 2023.02.03 |