본문 바로가기
반응형

데이터 공부26

[통계공부] 8. 기초통계량의 종류(중심경향성, 퍼짐정도, 왜도, 첨도) 1. 중심경향성 (Measures of Central Tendency) 중심경향성은 데이터의 중심이 어디에 있는지를 나타내는 통계량을 말합니다. 대표적인 중심경향성 지표로는 평균, 중앙값, 최빈값이 있습니다. 1.1. 평균 (Mean) 데이터의 모든 값을 더한 후 데이터의 개수로 나눈 값으로, 데이터의 대략적인 중심을 나타냅니다. 예를 들어, 세 명의 학생의 시험 점수가 각각 70, 80, 90이라면, 평균은 (70 + 80 + 90) / 3 = 80이 됩니다. 또한, 평균의 종류는 다양하면 그중 대표적으로 산술평균, 가중평균, 기하평균등이 있습니다. 이에 관한 내용은 다음 포스팅에서 다루어 보겠습니다. 2023.11.17 - [통계공부] - [통계공부] 9. 평균의 종류(산술평균, 기하평균, 조화평균,.. 2023. 11. 14.
[통계공부] 7. 기술통계와 추론통계의 이해와 차이점 1. 기술통계 (Descriptive Statistics) 기술통계는 데이터를 요약하고 설명하는 통계학의 한 분야입니다. 이는 데이터 집합의 주요 특성을 간결하게 표현하여 이해를 돕는 것이 목적입니다. 기술통계는 중심경향성(평균, 중앙값, 최빈값)과 분산정도(표준편차, 범위, 사분위수) 등을 계산하여 데이터의 특성을 정량화합니다. 2. 추론통계 (Inferential Statistics) 추론통계는 주어진 데이터의 표본을 사용하여 모집단에 대한 결론을 도출하거나 예측하는 통계학의 분야입니다. 모집단은 전체 집단을 나타내며, 추론통계는 표본 데이터를 기반으로 모집단에 대한 통계적 추론을 수행합니다. 이는 불확실성을 고려하여 모집단에 대한 확률적인 일반화를 시도합니다. 2023.10.28 - [통계공부] -.. 2023. 11. 13.
[통계공부] 6. 모집단, 표본집단 그래프로 이해하기(예시문제) 1. 지난 시간 정리 지난 시간에는 모집단과 표본집단의 개념과 그에 따른 평균, 분산, 표준편차의 공식에 대해 공부했습니다. 또한, 표본이 정규분포를 따를 경우 신뢰구간을 설정하는 방법과 신뢰도에 관해서도 알아봤습니다. 오늘은 해당 신뢰구간을 직접 그래프로 그려보고 예시문제를 풀어보겠습니다. 2023.10.28 - [통계공부] - [통계공부] 5. 모집단과 표본집단 (신뢰구간 및 신뢰도 공식) [통계공부] 5. 모집단과 표본집단 (신뢰구간 및 신뢰도 공식) 1. 모집단과 표본집단 1.1. 모집단 (Population) - 모집단은 특정 관심 대상의 전체 집합을 나타냅니다. 이것은 연구자가 조사하려는 모든 개체 또는 항목을 포함합니다. 모집단은 종종 크고 다양하며 informyun.com 2. 95% 신뢰.. 2023. 10. 30.
[통계공부] 5. 모집단과 표본집단 (신뢰구간 및 신뢰도 공식) 1. 모집단과 표본집단 1.1. 모집단 (Population) - 모집단은 특정 관심 대상의 전체 집합을 나타냅니다. 이것은 연구자가 조사하려는 모든 개체 또는 항목을 포함합니다. 모집단은 종종 크고 다양하며, 관심 대상에 따라 다를 수 있습니다. - 예를 들어, 만약 특정 제품의 품질을 조사하고자 한다면 해당 제품의 모든 제품이 모집단이 될 것이며, 모든 사람의 연령을 조사하려면 모든 인구가 모집단이 될 것입니다. 1.2. 표본집단 (Sample) - 표본집단은 모집단에서 무작위로 선택된 부분 집합을 나타냅니다. 표본은 모집단을 대표하고자 하는 목적으로 사용됩니다. - 표본집단은 모집단에서 데이터 수집의 비용, 시간 및 노력을 줄이는 데 도움을 줍니다. 또한 통계적 분석 및 추론을 수행할 때 표본 데이.. 2023. 10. 28.
[통계공부] 4. 표준정규분포 및 표준화 (예시문제 학습) 1. 표준정규분포(Standard Normal Distribution) 표준정규분포는 평균이 0이고 표준편차가 1인 정규분포를 의미합니다. 이 분포는 종 모양의 곡선으로, 정규분포를 따르는 확률 변수를 표준화하는 데 사용됩니다. 표준정규분포를 따르는 확률 변수는 Z로 표시되며, 평균을 0, 표준편차를 1로 조정한 값이 Z 값입니다. 표준정규분포의 확률 밀도 함수는 다음과 같이 표현됩니다 표준정규분포는 통계 분석에서 중요한 이유는 다음과 같습니다 - 데이터를 표준정규분포로 표준화하면, 서로 다른 데이터 집단을 비교하거나 통계 분석하기가 더 쉬워집니다. - 통계적 가설 검정에서 p-값을 계산하는 데 사용됩니다. 2. 표준화(Standardization) 표준화는 데이터의 평균을 0으로, 표준편차를 1로 조정.. 2023. 10. 25.
[통계공부] 3. 정규분포의 특징과 수식 1. 정규분포: 확률 분포의 핵심 정규분포는 확률과 통계학에서 핵심적인 역할을 하는 확률 분포 중 하나입니다. 이 분포는 다양한 현상과 데이터 세트에서 관찰되며, 평균과 표준편차를 통해 완전하게 정의됩니다. 아래에서 정규분포의 특징, 수식, 활용, 그리고 중요성에 대해 자세히 알아보겠습니다. 2. 정규분포의 특징 1. 대칭성 정규분포는 평균을 중심으로 좌우 대칭을 이루는 형태를 갖습니다. 이는 데이터가 평균 주변에 대체로 균등하게 분포한다는 것을 의미합니다. 2. 평균과 중앙값 동일 정규분포의 평균값과 중앙값(중위수)은 동일합니다. 이는 분포의 중심이 평균에 위치한다는 것을 나타냅니다. 3. 정점 위치 정규분포의 종 모양 모양은 정규분포의 정점(peak)이 평균에 위치한다는 특징을 가지고 있습니다. 4... 2023. 10. 24.
[통계공부] 2.평균, 편차, 분산, 표준편차 1. 평균 (Mean) 평균은 데이터 집합의 중심 위치를 나타내는 통계적 지표로, 모든 데이터 포인트의 합을 데이터의 개수로 나눈 값입니다. 이것은 데이터의 대표값 중 하나로, 집단의 전반적인 경향을 파악하는 데 사용됩니다. 평균 = (모든 데이터 값의 합) / (데이터 개수) 평균은 중심 경향을 파악할 때 유용하며, 예를 들어, 평균 급여, 평균 시간, 평균 성적 등을 계산하는 데 자주 사용됩니다. 2. 편차 (Deviation) 편차는 각 데이터 포인트와 평균 간의 차이를 나타내는 값입니다. 편차는 데이터가 어떻게 평균 주변에 분포하는지를 이해하는 데 도움을 줍니다. 편차 = 각 데이터 값 - 평균 편차는 각 데이터 값이 평균으로부터 얼마나 떨어져 있는지를 측정합니다. 이것은 데이터 분석에서 개별 데.. 2023. 10. 23.
[통계공부] 1. 변량,도수,도수분포표,상대도수,히스토그램 1. 변량 (Variable): 변량은 연구나 관찰 대상에서 관심을 가지는 속성 또는 특성을 나타냅니다. 예를 들어, 학생들의 키, 나이, 성적 등은 모두 변량입니다. 이러한 변량은 데이터 분석의 기반을 형성합니다. 아래 100명의 학생들의 임의의 점수를 통해 학습해보겠습니다. 해당 포스팅의 공부 내용 및 자료는 하단에 첨부해 놓았습니다. 2. 도수 (Frequency): 도수는 특정 구간 또는 범주 내에 발생한 관찰값의 수를 나타냅니다. 도수는 데이터의 분포를 이해하고 시각화하기 위한 핵심 개념입니다. 아래 표는 위 변량을 일정한 계급으로 나누어 표로 나타낸 것입니다. 이를 도수분포표 라고 칭합니다. 각 계급은 0점부터 100점까지를 10개의 계급으로 나눈것입니다. 여기서 계급의 크기 즉 계급의 간격은.. 2023. 10. 22.
반응형

loading