본문 바로가기
반응형

상관계수2

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 상관계수와 결정계수 이론 살펴보기 상관계수와 결정계수는 데이터 분석과 통계학에서 중요한 개념으로, 두 변수 간의 관계를 이해하고 모델의 설명력을 평가하는 데 사용됩니다. 이 포스팅에서는 상관계수와 결정계수의 정의, 계산 방법, 해석, 그리고 각각의 한계점과 유용성을 다룰 것입니다. 1. 상관계수 (Correlation Coefficient)정의 상관계수는 두 변수 간의 선형적 관계를 측정하는 지표로, -1에서 1 사이의 값을 가집니다. 주로 피어슨 상관계수(Pearson Correlation Coefficient)가 사용되며, 이는 두 변수의 공분산을 각각의 표준편차로 나눈 값으로 계산됩니다. 상관계수의 값에 따라 두 변수 간의 관계를 다음과 같이 해석할 수 있습니다: +1: 완벽한 양의 상관관계 (두 변수는 동일한 방향으로 완벽히 변화.. 2024. 8. 22.
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 산점도, 3D 산점도, 회귀선 1. 데이터 추출산점도 데이터 시각화에서는 가장 많이 사용하는 bmi 데이터셋을 가지고 해 보겠습니다.임의로 chat GPT에게 1000명의 bmi 데이터를 만들어달라고 요청했습니다. 2. 산점도 만들기 (키 Vs bmi)bmi는 몸무게를 키의 제곱으로 나눈 값입니다. 그렇게 때문에 키가 클수록 bmi 가 낮아지는 양상을 확인할 수 있습니다. 산점도 색상 구분은 성별로 구분했으며, 산점도 크기는 bmi의 크기로 표현했습니다.그래프의 오른쪽으로 갈수록 산점도의 점이 작아지는 모습을 볼 수 있습니다. 산점도 속성에 있는 Lines & Curves 기능 중 straight Fit 기능을 사용하여 산점도 내 회귀선을 추가할 수 있다.Label and Tooltip에서 원하는 레퍼런스도 추가할 수 있다. 기본적으.. 2024. 8. 21.
반응형

loading