반응형 데이터 전처리2 [데이터 시각화] Spotfire로 데이터 시각화 해보기 - 데이터의 종류 살펴보기 데이터는 다양한 형태로 존재하며, 이를 이해하기 위해 데이터의 유형을 분류하는 것이 중요합니다. 데이터의 주요 유형에는 연속형 자료, 이산형 자료, 순위형 자료, 명목형 자료가 있습니다. 각 유형의 특징과 예시는 다음과 같습니다. 1. 연속형 자료 (Continuous Data)특징연속형 자료는 특정 범위 내에서 무한히 많은 값을 가질 수 있는 데이터입니다. 이는 보통 실수(real number)로 표현되며, 측정 단위에 따라 소수점까지 포함할 수 있습니다. 연속형 자료는 주로 물리적, 시간적, 양적 측정에서 나타납니다. 두 점 사이에 존재하는 값들을 포함할 수 있으며, 변수가 정해진 범위 내에서 모든 값을 취할 수 있습니다. 예시키 : 160.5 cm, 175.3 cm 등과 같이 측정된 키는 특정 범.. 2024. 8. 26. [데이터 시각화] Spotfire로 데이터 시각화 해보기 - 상관계수와 결정계수 이론 살펴보기 상관계수와 결정계수는 데이터 분석과 통계학에서 중요한 개념으로, 두 변수 간의 관계를 이해하고 모델의 설명력을 평가하는 데 사용됩니다. 이 포스팅에서는 상관계수와 결정계수의 정의, 계산 방법, 해석, 그리고 각각의 한계점과 유용성을 다룰 것입니다. 1. 상관계수 (Correlation Coefficient)정의 상관계수는 두 변수 간의 선형적 관계를 측정하는 지표로, -1에서 1 사이의 값을 가집니다. 주로 피어슨 상관계수(Pearson Correlation Coefficient)가 사용되며, 이는 두 변수의 공분산을 각각의 표준편차로 나눈 값으로 계산됩니다. 상관계수의 값에 따라 두 변수 간의 관계를 다음과 같이 해석할 수 있습니다: +1: 완벽한 양의 상관관계 (두 변수는 동일한 방향으로 완벽히 변화.. 2024. 8. 22. 이전 1 다음 반응형