본문 바로가기
반응형

상관관계 분석3

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Dendrogram 숫자형 Vs 숫자형 3. 1. 계층적 군집 분석의 기본 개념 계층적 군집 분석(Hierarchical Clustering)은 데이터 포인트들 간의 유사성 또는 거리를 기반으로 데이터를 계층적으로 그룹화하는 방법입니다. 이 기법은 탑다운 방식(Divisive, 분할법) 또는 바텀업 방식(Agglomerative, 집합법)으로 수행될 수 있습니다.탑다운 방식: 전체 데이터를 하나의 큰 군집으로 보고, 점차 분할하여 개별 데이터 포인트로 나뉩니다.바텀업 방식: 모든 데이터 포인트를 각각 하나의 군집으로 시작하고, 가장 유사한 것들끼리 병합해 나가면서 하나의 큰 군집으로 합쳐집니다. Spotfire에서 주로 사용하는 방식은 바텀업 방식입니다. 2. 계층적 군집 방법의 종류군집 비교 방법군집 간 거리 정의 방식장점단점★평균 연결법(Ave.. 2024. 8. 30.
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Heat map 숫자형 Vs 숫자형 2. 1. 전체 상관관계 분석Data Relationships 이전에 했던 상관관계 분석은 종속변수 mpg(연비)에 대해서 다른 integer 항목들과의 상관관계를 살펴봤습니다.이번에는 종속변수와, 독립변수를 1:1로 매칭시켜서 상관관계를 Heat map 형태로 확인해 보겠습니다.위와 같이 종속변수 Y칸에도 mpg 이외 항목도 전부 추가, 독립변수 X칸에도 mpg를 추가.2. Heat map 생성 아래와 같이 Heat map을 3개 생성했습니다. X축에는 X값, Y축에는 Y값, Cell Value 값에는 각각 p-value, R값, R^2 값을 넣었습니다. p-value는 모두 매우 작은 값이 나왔으며, 이는 상관관계가 있음을 확인했습니다. (인관관계는 증명 X) R값에 경우는 음/양 의 상관관계를 확인하기 .. 2024. 8. 29.
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 선형회귀 (Linear Regression) 숫자형 Vs 숫자형 1. 1. Auto-MPG 데이터셋Auto-MPG 데이터 분석 리포트 https://www.kaggle.com/datasets/uciml/autompg-dataset?resource=download Auto-mpg datasetMileage per gallon performances of various carswww.kaggle.com 이 리포트는 Auto-MPG 데이터셋을 기반으로 한 분석 결과를 요약한 것입니다. Auto-MPG 데이터셋은 1970년대와 1980년대 초에 미국에서 판매된 자동차의 연비(MPG, Miles Per Gallon)와 관련된 다양한 변수들을 포함하고 있습니다. 이 데이터셋은 차량 성능과 연비 간의 관계를 분석하는 데 유용하며, 총 398개의 레코드와 9개의 변수를 포함하고 있습니다.. 2024. 8. 28.
반응형

loading