본문 바로가기

ADsP 데이터분석 준전문가 자격증 도전

데이터의 이해 _정성적 데이터와 정량적 데이터

데이터는 추론과 추정의 근거를 이루는 사실이다. 

 

 

데이터 유형

 

1장 1절 데이터의 정보에서 간혹 정성적 데이터와 정량적 데이터의 차이점을 묻는 문제가 출제된다고 합니다. 

두 데이터의 차이점을 잘 이해하고 가야할 것 같아요.

 

정성적 데이터는 언어나 문자로 표현된 데이터라고 할 수 있습니다. 

우리가 많이 보는 쿠팡의 리뷰, 인터뷰, 언론 보도 모두 정성적 데이터라고 할 수 있겠죠. 

정성적 데이터는 '비정형 데이터'로 비구조화된 데이터, 미리 정의된 데이터 모델이 없거나 정의된 방식으로 정리되지 않은 정보를 말합니다. 따라서 정보를 일정한 구조로 저장하고 검색하고 분석하는데 많은 비용이 소모되겠지요.

 

정량적 데이터는 수치, 도형, 기호 등 바로 측정할 수 있는 데이터입니다. 

쿠팡의 별점이나 수능 등급, ~% 상승, 하락, 여성/남성, 나이 등이 모두 정량적 데이터라고 할 수 있습니다. 

정량적 데이터는 정성적 데이터와 달리 '정형데이터'로서 구조화 된 데이터입니다. 미리 정해진 규칙에 따라 데이터를 보면 쉽게 의미를 파악할 수 있는 데이터라고 할 수 있습니다. 통계분석에 용이하며 구조화되어 있기 때문에 데이터 처리에 비용소모가 적은 편입니다.

 

구분 형태 특징
정성적 데이터 언어나 문자 등 '설명'이 필요한 데이터 -회사 매출이 증가함
-해당 제품은 손잡이가 있어 사용하기에 용이함
-검은색 털을 가진 길고양이가 많이 있음
-언론, 인터뷰, 이메일, 관찰 등을 통해 얻을 수 있다.
-저장, 검색, 분석에 많은 비용이 소모된다.
-비정형데이터
정량적 데이터  수치, 도형, 기호 등 바로 측정할 수 있는 데이터 -회사 매출이 25% 증가함
-해당 제품의 손잡이에 대한 만족도가 80% 이상임
-우리동네에 검은색 털을 가진 고양이가 다섯마리 있음.
-서베이 등을 통해 얻을 수 있다. 
-정형화 된 데이터로 비용소모가 적음

 

 


참고. 데이터분석 준전무가 합격을 위한 완벽 요약집(DATA DU)