본문 바로가기
728x90

자격증11

[ADsP] 편차, 분산, 표준편차 구분하기 ◆ 데이터의 퍼짐 정도를 측정하는 값들에 대한 개념에 대하여 공부했습니다. → 데이터 집합이 얼마나 퍼져 있는지를 알아보는데 사용하는 값들로 산포도, 편차, 분산, 표준편차 등이 있습니다. ▶산포도 (dispersion) - 자료의 변량들이 흩어져 있는 정도를 수로 나타낸 값 - 산포도가 크면 변량들이 평균으로 부터 멀리 떨어져 있다, 변동성이 커진다. - 산포도가 작으면 변량들이 평균 주위에 밀집, 변동성이 작아진다. ▶편차 - 변량에서 평균을 뺀 값 (편차 = 변량 - 평균) - 그렇기 때문에 편차의 총 합은 항상 0이다. ▶분산(variance) - 편차의 제곱을 n-1로 나눔 (n-1값이 표본의 자유도가 되기 때문) - 데이터가 얼마나 퍼져 있는지 알아볼 수 있다. ▶표준편차(Standard De.. 2023. 2. 20.
[ADsP]데이터 마트와 데이터 웨어하우스 ▶ 데이터 마트 (Data Mart) - 데이터 웨어하우스와 사용자 사이의 중간층에 위치함 - 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스 - 데이터 마트 내 데이터는 대부분 데이터 웨어하우스로부터 가져오기도 하고 자체적으로 수집될 수도 있다. ▶ 데이터 웨어하우스 (Data Warehouse) - 사용자의 의사 결정에 도움을 주기 위해 데이터베이스에 축적된 데이터를 공통의 형식으로 변환해서 관리하는 데이터베이스 - 데이터 웨어하우스는 방대한 조직 내에서 분산 운영되는 각각의 데이터 베이스 관리 시스템들을 효율적으로 통합하여 조정ㆍ관리한다. ※ - 데이터 마트를 만들 때 가장 중요한 데이터들은 데이터 웨어하우스로부터 받아오는 데이터 - 받아온 데이터를 처리과정을 통해 분석에 적절하게 활용할 수.. 2023. 2. 16.
[ADsP] 가설검정 (귀무가설, 대립가설, 제 1종 오류, 제 2종 오류) ▶ 가설검정 - 모집단에 대한 어떤 가설을 설정한 뒤에 표본관찰을 통해 그 가설의 채택여부를 결정하는 분석방법 - 귀무가설과 대립가설 중 하나를 선택하는 과정 ▶ 유의수준(Significance Level, α) - 귀무가설이 옳은데도 이를 기각하는 확률의 크기 - 제 1종 오류의 최대 허용 한계 - 유의수준 0.05(5%) : 100번의 실험에서 1종 오류를 범하는 최대 허용 한계가 5번 ▶ 귀무가설(Null Hypothesis) ▶ 대립가설(Alternative Hypothesis) ▶ 제 1종 오류 : 귀무가설이 옳은데도 귀무가설을 기각하게 되는 오류 ▶ 제 2종 오류: 귀무가실이 옳지 않은데도 귀무가설을 채택하게 되는 오류 ▶ 유의확률 (p-value) - 1종 오류를 범할 확률 - 귀무가설을 지.. 2023. 2. 3.
728x90