본문 바로가기
데이터 공부/데이터 시각화

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 산점도, 3D 산점도, 회귀선

by 으잇짜 2024. 8. 21.
반응형

 

1. 데이터 추출

  • 산점도 데이터 시각화에서는 가장 많이 사용하는 bmi 데이터셋을 가지고 해 보겠습니다.
  • 임의로 chat GPT에게 1000명의 bmi 데이터를 만들어달라고 요청했습니다.

chat GPT를 이용해 bmi 데이터 셋을 확보
chat GPT를 이용해 bmi 데이터 셋을 확보

 

2. 산점도 만들기 (키 Vs bmi)

bmi는 몸무게를 키의 제곱으로 나눈 값입니다. 그렇게 때문에 키가 클수록 bmi 가 낮아지는 양상을 확인할 수 있습니다.

 

산점도 색상 구분은 성별로 구분했으며, 산점도 크기는 bmi의 크기로 표현했습니다.

그래프의 오른쪽으로 갈수록 산점도의 점이 작아지는 모습을 볼 수 있습니다.

키 Vs bmi 그래프 속성
키 Vs bmi 그래프 속성

 

산점도 속성에 있는 Lines & Curves 기능 중 straight Fit 기능을 사용하여 산점도 내 회귀선을 추가할 수 있다.

Label and Tooltip에서 원하는 레퍼런스도 추가할 수 있다. 기본적으로 곡선 식과, R^2 값을 선택해 주었다.

 

R^2 : 상관계수

회귀선 근처에 있는 점들을 Marking 해보니 대략 250개 정도의 값이 회귀선 근처에 몰려있었다. 상관계수인 0.256인 이유를 확인할 수 있다.

산점도 내 회귀선 추가
산점도 내 회귀선 추가
상관계수와의 관계
상관계수와의 관계
최종 그래프
최종 그래프

 

3. 산점도 만들기 (몸무게 Vs bmi)

이번에는 몸무게와 bmi 간의 상관관계를 산점도로 표현한 그래프이다. 키와 비교했던 그래프와 다르게, 몸무게가 증가하면 bmi 수치도 증가하는 양의 상관관계를 보이는 것을 확인할 수 있다.

몸무게와 bmi의 상관관계 산점도
몸무게와 bmi의 상관관계 산점도

4. 3D 산점도 만들기 (키 Vs 몸무게 Vs bmi)

 

3D 산점도 또한 만드는 방식은 동일하다. X, Y 축에 몸무게와 키 칼럼을 넣고 Z축에 bmi 컬럼을 넣었다.

색상은 남, 여로 구분, 크기는 bmi로 구분했다.

3D 산점도
3D 산점도

 

그래프를 돌려 X축에 키, Y축에 bmi 데이터가 오도록 만들었다. 맨 처음 만들었던 모습과 동일하게 키가 커질수록 bmi가 작아지는 모습을 확인할 수 있다.

 

이번에는 X축에 몸무게, Y축에 bmi 데이터가 오도록 만들었다. 동일하게 몸무게가 커질수록 bmi가 커지는 모습을 확인 할 수 있다.

각 방향에서 바라본 3D 산점도
각 방향에서 바라본 3D 산점도

 

오늘은 이와 같이 bmi 데이터 셋을 이용해서 간단히 산점도를 그려보는 연습을 해봤습니다. 다음 포스팅에서는 해당 데이터를 가지고 Box Plot을 그려보는 실습을 해보겠습니다.

 

2024.08.21 - [데이터 공부/데이터 시각화] - [데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot 실습

 

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot 실습

1. Box plot 만들기 데이터는 이전 포스팅 첨부파일에 있던 bmi 데이터를 활용해서 만들어 보겠습니다.bmi 데이터로 box plot 차트를 생성하면 기본적으로 아래와 같이 생성되는 모습을 확인할 수 있

informyun.com

 

반응형

loading