본문 바로가기
데이터 공부/데이터 시각화

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 데이터의 종류 살펴보기

by 으잇짜 2024. 8. 26.
반응형

데이터는 다양한 형태로 존재하며, 이를 이해하기 위해 데이터의 유형을 분류하는 것이 중요합니다. 데이터의 주요 유형에는 연속형 자료, 이산형 자료, 순위형 자료, 명목형 자료가 있습니다. 각 유형의 특징과 예시는 다음과 같습니다.

 

데이터의 종류
데이터의 종류

 

1. 연속형 자료 (Continuous Data)

특징


연속형 자료는 특정 범위 내에서 무한히 많은 값을 가질 수 있는 데이터입니다. 이는 보통 실수(real number)로 표현되며, 측정 단위에 따라 소수점까지 포함할 수 있습니다. 연속형 자료는 주로 물리적, 시간적, 양적 측정에서 나타납니다. 두 점 사이에 존재하는 값들을 포함할 수 있으며, 변수가 정해진 범위 내에서 모든 값을 취할 수 있습니다.

 

예시


: 160.5 cm, 175.3 cm 등과 같이 측정된 키는 특정 범위 내에서 소수점까지 다양한 값을 가질 수 있습니다.
체중 : 60.7 kg, 82.3 kg 등과 같이 연속적인 값으로 나타낼 수 있습니다.
시간 : 12.34초, 45.67초와 같이 측정할 수 있습니다.

 

2. 이산형 자료 (Discrete Data)

특징

 

이산형 자료는 특정 값들만 가질 수 있는 데이터입니다. 주로 정수(integer)로 표현되며, 연속적인 값 사이에 존재하는 값은 포함되지 않습니다. 주로 개수, 횟수 등 셀 수 있는 경우에 사용됩니다. 이산형 자료는 값들 사이에 간격이 있으며, 그 간격은 고정되어 있습니다.

 

예시


학생 수 : 20명, 35명 등과 같이 학생의 수는 정수로 표현됩니다.
동전 던지기 결과 : 앞면(0) 또는 뒷면(1)과 같은 값만 가질 수 있습니다.
자동차의 바퀴 수 : 4개, 2개 등과 같이 특정 값만 가집니다.

 

3. 순위형 자료 (Ordinal Data)

특징


순위형 자료는 값들 간의 순서 또는 등급이 중요시되는 데이터입니다. 각 값은 다른 값보다 크거나 작다고 순서를 매길 수 있지만, 값들 간의 간격이 일정하지 않을 수 있습니다. 순위형 자료는 순서나 서열을 표현하기 위해 사용되며, 순위 간의 간격은 측정되지 않거나 의미가 없을 수 있습니다.

 

예시


고객 만족도 : 매우 만족(5), 만족(4), 보통(3), 불만족(2), 매우 불만족(1)과 같은 순위가 있습니다.
등수 : 1등, 2등, 3등과 같이 순서가 있는 데이터입니다.
학점 : A, B, C, D, F와 같은 성적 등급.

 

4. 명목형 자료 (Nominal Data)

특징


명목형 자료는 카테고리 간의 차이를 나타내는 데이터로, 순서가 없고 단지 이름이나 라벨에 해당하는 값입니다. 값 간에 서열이나 순위가 존재하지 않으며, 단지 분류 목적으로 사용됩니다. 이러한 데이터는 주로 범주형 데이터로서, 숫자로 표시되더라도 이는 순서나 크기를 의미하지 않습니다.

 

예시


성별 : 남성, 여성과 같은 카테고리.
혈액형 : A형, B형, AB형, O형과 같은 범주.
국가 : 미국, 한국, 일본 등과 같이 특정 국가를 나타내는 데이터.

 

반응형

loading