1. 데이터 추출
- 산점도 데이터 시각화에서는 가장 많이 사용하는 bmi 데이터셋을 가지고 해 보겠습니다.
- 임의로 chat GPT에게 1000명의 bmi 데이터를 만들어달라고 요청했습니다.
2. 산점도 만들기 (키 Vs bmi)
bmi는 몸무게를 키의 제곱으로 나눈 값입니다. 그렇게 때문에 키가 클수록 bmi 가 낮아지는 양상을 확인할 수 있습니다.
산점도 색상 구분은 성별로 구분했으며, 산점도 크기는 bmi의 크기로 표현했습니다.
그래프의 오른쪽으로 갈수록 산점도의 점이 작아지는 모습을 볼 수 있습니다.
산점도 속성에 있는 Lines & Curves 기능 중 straight Fit 기능을 사용하여 산점도 내 회귀선을 추가할 수 있다.
Label and Tooltip에서 원하는 레퍼런스도 추가할 수 있다. 기본적으로 곡선 식과, R^2 값을 선택해 주었다.
R^2 : 상관계수
회귀선 근처에 있는 점들을 Marking 해보니 대략 250개 정도의 값이 회귀선 근처에 몰려있었다. 상관계수인 0.256인 이유를 확인할 수 있다.
3. 산점도 만들기 (몸무게 Vs bmi)
이번에는 몸무게와 bmi 간의 상관관계를 산점도로 표현한 그래프이다. 키와 비교했던 그래프와 다르게, 몸무게가 증가하면 bmi 수치도 증가하는 양의 상관관계를 보이는 것을 확인할 수 있다.
4. 3D 산점도 만들기 (키 Vs 몸무게 Vs bmi)
3D 산점도 또한 만드는 방식은 동일하다. X, Y 축에 몸무게와 키 칼럼을 넣고 Z축에 bmi 컬럼을 넣었다.
색상은 남, 여로 구분, 크기는 bmi로 구분했다.
그래프를 돌려 X축에 키, Y축에 bmi 데이터가 오도록 만들었다. 맨 처음 만들었던 모습과 동일하게 키가 커질수록 bmi가 작아지는 모습을 확인할 수 있다.
이번에는 X축에 몸무게, Y축에 bmi 데이터가 오도록 만들었다. 동일하게 몸무게가 커질수록 bmi가 커지는 모습을 확인 할 수 있다.
오늘은 이와 같이 bmi 데이터 셋을 이용해서 간단히 산점도를 그려보는 연습을 해봤습니다. 다음 포스팅에서는 해당 데이터를 가지고 Box Plot을 그려보는 실습을 해보겠습니다.
2024.08.21 - [데이터 공부/데이터 시각화] - [데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot 실습
'데이터 공부 > 데이터 시각화' 카테고리의 다른 글
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Heat map 숫자형 Vs 숫자형 2. (0) | 2024.08.29 |
---|---|
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 선형회귀 (Linear Regression) 숫자형 Vs 숫자형 1. (1) | 2024.08.28 |
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot 실습 (0) | 2024.08.27 |
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 데이터의 종류 살펴보기 (0) | 2024.08.26 |
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot이란?(실습데이터 추가) (0) | 2024.08.25 |