1. 지난 시간 정리
지난 시간에는 모집단과 표본집단의 개념과 그에 따른 평균, 분산, 표준편차의 공식에 대해 공부했습니다. 또한, 표본이 정규분포를 따를 경우 신뢰구간을 설정하는 방법과 신뢰도에 관해서도 알아봤습니다. 오늘은 해당 신뢰구간을 직접 그래프로 그려보고 예시문제를 풀어보겠습니다.
2023.10.28 - [통계공부] - [통계공부] 5. 모집단과 표본집단 (신뢰구간 및 신뢰도 공식)
2. 95% 신뢰구간
일상적으로 사용하는 신뢰도는 90%, 95%, 99%가 있습니다. 해당 그래프는 지오지브라 홈페이지에서 시각화했습니다.
95% 신뢰도 적용 시, 표준정규분포 공식을 적분하여 면적이 0.95가 나오는 부분을 찾으니 x값(그래프상)의 범위가 -1.96부터 1.96까지가 나왔습니다. 해당 부분은 전체 면적 1에서 0.95를 뺀 0.05를 2로 나눈 0.025입니다.
3. 99% 신뢰구간
99% 신뢰도 적용시, 표준정규분포 공식을 적분하여 면적이 0.99가 나오는 부분을 찾으니 x값(그래프상)의 범위가 -2.58부터 2.58까지가 나왔습니다. 해당 부분은 전체 면적 1에서 0.99를 뺀 0.01를 2로 나눈 0.005입니다.
참고로, 100% 신뢰도는 -무한대부터 무한대까지의 적분이므로 사실상 의미가 없습니다.
4. 모집단, 표본집단 예시 문제
문제) 우리나라 직장인들의 월 평균 월급이 얼마인지 알아보려고 한다. 100명을 임의로 선택하여 본 결과, 그들의 평균이 2,500,000원이라는 것을 알았다. 모집단의 표준편차가 30만 원이고, 모집단이 정규분포를 이룬다고 가정할 때, 우리나라 직장인들의 평균 월급의 90% 신뢰구간, 95% 신뢰구간, 99% 신뢰구간을 구하여라.
해당 문제 및 예시문제는 아래 파일을 첨부해 놓겠습니다.
신뢰구간 공식은 지금까지 공부했던 아래 공식을 이용하겠습니다.
문제에서, 표본집단을 100명, 표본평균이 2,500,000원, 모집단의 표준편차가 300,000원이라고 나와있습니다.
해당 계수를 신뢰구간 공식에 적용하면 아래와 같습니다.
해당 신뢰도를 계산하면 최종적으로 아래와 같습니다.
5. 엑셀로 쉽게 신뢰구간 알아보기
엑셀에서 "CONFIDENCE.NORM" 이라는 함수를 이용해서 "정규분포"를 사용하는 모집단 평균의 신뢰구간을 구할 수 있습니다. 해당 함수는 3개의 인수가 필요합니다.
첫 번째, 알파값은 신뢰도입니다. 90%는 0.1, 95%는 0.05, 99%는 0.01입니다.
두 번째, 모집단의 표준편차입니다.
세 번째, 표본의 크기(표본집단의 수, 데이터 수)입니다.
위에서 풀어본 문제를 해당 함수에 적용시키면 아래와 같습니다.
신뢰도 90% =CONFIDENCE.NORM(0.1,300000,100)
신뢰도 95% =CONFIDENCE.NORM(0.05,300000,100)
신뢰도 99% =CONFIDENCE.NORM(0.01,300000,100)
함수 적용 시 정답과 똑같이 나옵니다.
6. 모집단의 표준편차를 모를 때?
지금까지는 모집단의 표준편차 σ를 알고 있다고 가정했습니다. 그러나 실제로 모집단의 표준편차를 알고 있는 경우는 매우 드뭅니다. 예시로 어떤 회사에서 "게임"을 개발하여 출시전에 이 게임에 대한 호감도를 조사한다고 가정해본다. 그러나, 우리나라 전체 인구에 대해 조사할수 없으며, 전체를 조사할 수 없으니 모집단의 평균과 표준편차를 알수 없다.
이럴때는 "t분포" 를 사용합니다. t분포도 나중에 포스팅에서 다루어 보도록 하겠습니다.
'데이터 공부 > 통계 공부' 카테고리의 다른 글
[통계공부] 8. 기초통계량의 종류(중심경향성, 퍼짐정도, 왜도, 첨도) (0) | 2023.11.14 |
---|---|
[통계공부] 7. 기술통계와 추론통계의 이해와 차이점 (0) | 2023.11.13 |
[통계공부] 5. 모집단과 표본집단 (신뢰구간 및 신뢰도 공식) (0) | 2023.10.28 |
[통계공부] 4. 표준정규분포 및 표준화 (예시문제 학습) (0) | 2023.10.25 |
[통계공부] 3. 정규분포의 특징과 수식 (0) | 2023.10.24 |