데이터는 다양한 형태로 존재하며, 이를 이해하기 위해 데이터의 유형을 분류하는 것이 중요합니다. 데이터의 주요 유형에는 연속형 자료, 이산형 자료, 순위형 자료, 명목형 자료가 있습니다. 각 유형의 특징과 예시는 다음과 같습니다.
1. 연속형 자료 (Continuous Data)
특징
연속형 자료는 특정 범위 내에서 무한히 많은 값을 가질 수 있는 데이터입니다. 이는 보통 실수(real number)로 표현되며, 측정 단위에 따라 소수점까지 포함할 수 있습니다. 연속형 자료는 주로 물리적, 시간적, 양적 측정에서 나타납니다. 두 점 사이에 존재하는 값들을 포함할 수 있으며, 변수가 정해진 범위 내에서 모든 값을 취할 수 있습니다.
예시
키 : 160.5 cm, 175.3 cm 등과 같이 측정된 키는 특정 범위 내에서 소수점까지 다양한 값을 가질 수 있습니다.
체중 : 60.7 kg, 82.3 kg 등과 같이 연속적인 값으로 나타낼 수 있습니다.
시간 : 12.34초, 45.67초와 같이 측정할 수 있습니다.
2. 이산형 자료 (Discrete Data)
특징
이산형 자료는 특정 값들만 가질 수 있는 데이터입니다. 주로 정수(integer)로 표현되며, 연속적인 값 사이에 존재하는 값은 포함되지 않습니다. 주로 개수, 횟수 등 셀 수 있는 경우에 사용됩니다. 이산형 자료는 값들 사이에 간격이 있으며, 그 간격은 고정되어 있습니다.
예시
학생 수 : 20명, 35명 등과 같이 학생의 수는 정수로 표현됩니다.
동전 던지기 결과 : 앞면(0) 또는 뒷면(1)과 같은 값만 가질 수 있습니다.
자동차의 바퀴 수 : 4개, 2개 등과 같이 특정 값만 가집니다.
3. 순위형 자료 (Ordinal Data)
특징
순위형 자료는 값들 간의 순서 또는 등급이 중요시되는 데이터입니다. 각 값은 다른 값보다 크거나 작다고 순서를 매길 수 있지만, 값들 간의 간격이 일정하지 않을 수 있습니다. 순위형 자료는 순서나 서열을 표현하기 위해 사용되며, 순위 간의 간격은 측정되지 않거나 의미가 없을 수 있습니다.
예시
고객 만족도 : 매우 만족(5), 만족(4), 보통(3), 불만족(2), 매우 불만족(1)과 같은 순위가 있습니다.
등수 : 1등, 2등, 3등과 같이 순서가 있는 데이터입니다.
학점 : A, B, C, D, F와 같은 성적 등급.
4. 명목형 자료 (Nominal Data)
특징
명목형 자료는 카테고리 간의 차이를 나타내는 데이터로, 순서가 없고 단지 이름이나 라벨에 해당하는 값입니다. 값 간에 서열이나 순위가 존재하지 않으며, 단지 분류 목적으로 사용됩니다. 이러한 데이터는 주로 범주형 데이터로서, 숫자로 표시되더라도 이는 순서나 크기를 의미하지 않습니다.
예시
성별 : 남성, 여성과 같은 카테고리.
혈액형 : A형, B형, AB형, O형과 같은 범주.
국가 : 미국, 한국, 일본 등과 같이 특정 국가를 나타내는 데이터.
'데이터 공부 > 데이터 시각화' 카테고리의 다른 글
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Heat map 숫자형 Vs 숫자형 2. (0) | 2024.08.29 |
---|---|
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 선형회귀 (Linear Regression) 숫자형 Vs 숫자형 1. (1) | 2024.08.28 |
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot 실습 (0) | 2024.08.27 |
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Box plot이란?(실습데이터 추가) (0) | 2024.08.25 |
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 산점도, 3D 산점도, 회귀선 (0) | 2024.08.21 |