- 적절한 차트를 활용한 데이터 시각화는 청중에게 설득력 있는 메시지를 전달 할 수 있다.
- 복잡한 차트나 잘못된 차트의 사용은 혼란을 야기시킬 수 있으므로, 차트를 선택하기에 앞서 신중한 고민이 필요하다.
<적절한 차트 사용을 통한 기대효과>
- 복잡하고 어려운 개념을 알기 쉽게 설명할 수 있다
- 전달하고자 하는 메시지를 명확히 할 수 있다
- 중요 포인트를 청중의 기억에 깊이 각인시킬 수 있다
- 자주 쓰는 차트들을 의도에 따라 네 가지 그룹으로 나눌 수 있다.
- 집단 간 데이터 비교 분석
- 데이터 집합의 구성 분석
- 변수들 간의 관계 분석
- 데이터의 분포 분석
1. 비교 분석에 주로 사용되는 차트
- 비교 분석은 다양한 항목 간에 어떠한 차이가 있는지를 명확히 보고자 할 때 사용
- 표보다 차트를 사용하는 것이 직관적이다
① 막대 차트(Bar Chart)
- 항목의 수치를 막대 길이로 표현해, 항목 간의 상대적인 비교를 직관적으로 표현한 차트
- 항목의 이름이 긴 경우, 수직 막대 차트보다는 수평 막대 차트가 가시성이 좋다
- 매출 실적이나 품질 관리 분야에 많이 사용
장점 | 단점 |
- 여러 개 항목 간 비교가 수월하다 - 5개 이상의 항목들 간 비교도 빠르고 직관적이다 - 테이블 요약보다 데이터 경향을 이해하기 쉽다 - 항목들의 증가/감소 경향을 쉽게 파악할 수 있다 - 전문적 지식이 없어도 쉽게 이해할 수 있다 |
- 차트 축 범위를 의도적으로 전달해 메시지가 왜곡될 수 있다 - 막대 길이가 비슷한 경우 정확한 수치적 차이를 알기 어렵다 |
* 막대 차트 사용 시 주의점
1) 데이터를 직관적으로 이해하기 쉽게 나열
2) 3차원 그래프를 남용하지 말기
3) 막대 축을 과장되지 않게 사용하기
4) 색상을 활용
② 라인 차트(Line Chart)
- 데이터의 각 점을 선으로 이어서 시각화한 차트
- 시간에 따른 데이터의 변화를 보고 싶을 때 주로 사용
- 금융 분야, 품질 관리 분야에서 많이 사용
장점 | 단점 |
- 시간에 따른 데이터 경향을 분석할 때 효과적 - 데이터에 트렌드가 있는 경우 강한 인상을 줄 수 있다 - 데이터의 작은 변화도 쉽게 포착할 수 있다 - 여러 항목 간의 비교가 쉽다 |
- 항목 간 데이터가 비슷하면 라인이 겹쳐 구분이 어렵다 - 데이터 범위가 매우 크면 라인 차트로 표현하기 힘들다 - 이상치가 있으면 다른 값들의 변화를 파악하기 어렵다 |
* 라인 차트 사용 시 주의점
1) 글자 삽입을 최소화
2) 여러 라인을 사용할 때는 색상 대비를 활용
3) 너무 많은 라인 차트를 사용하지 말자
2. 구성 분석에 주로 사용되는 차트
- 구성 분석은 데이터 항목들이 어떠한 비율로 구성되어 있는지를 파악하기 위해 사용
- 파이 차트, 영역 차트, 누적 막대 차트, 폭포수 차트 등이 있다
① 파이 차트(Pie Chart)
- 파이의 각 조각이 어떠한 비율로 전체 파이를 차지하고 있는지를 시각화한 차트
- 구성 성분의 비율을 쉽게 파악할 수 있다
- 설문지 분석을 수행할 때 자주 사용된다
장점 | 단점 |
- 다양한 항목들의 상대적인 비율을 쉽게 이해할 수 있다 - 각 조각의 크기를 토대로 상대적 비율을 직관적으로 파악 - 대용량 데이터도 쉽게 요약해서 설명한다 - 지도 차트에 적용되어 추가적인 정보를 제공할 수 있다 |
- 비교 항목이 많으면 구분이 힘들어 진다 - 파이의 종류가 많아지면 복잡하고 지저분해진다 - 하나의 데이터 변수만 다룰 수 있다 - 하나의 변수에 대한 상대적 비율만 나타내므로, 다양한 변수를 소개할 수 없다 - 전체 데이터의 크기가 어떤지 쉽게 감이 오지 않는다 - 상대적 비율에 초점을 맞추기 때문에, 데이터 세트 크기 여부를 쉽게 판별하기 어렵다 |
* 파이 차트 사용 시 주의점
1) 항목의 개수는 5개 이하가 되도록 차트를 시각화
- 항목의 개수가 너무 많으면 차트가 복잡하고 지저분해지기 때문에 차트를 읽기 힘들어진다. 되도록 항목의 개수를 5개 이하로 설정하여 충분한 정보가 차트를 통해 전달되록 해야 한다
2) 3차원 파이 차트를 남용하지 말기
3차원 파이 차트를 잘못 사용하면 특정 파이 조각이 다른 조각보다 더 크게 과장되어 보일 수 있다. 동일한 크기의 파이도 3차원으로 나타내면 차이가 있는 것처럼 보일 수 있다.
3. 관계 분석에 주로 사용되는 차트
- 관계 분석은 변수들 간 어떠한 관련성이 있는지를 알아보고자 할 때 사용되는 분석법
- 분산형 차트, 버블 차트 등이 있다
① 분산형 차트(Scatter Plot)
- 두 변수 간에 어떠한 관련성이 있는지를 파악하고자 할 때 사용되는 차트
- X축에는 영향을 주는 변수인 독립 변수를 나타내고, Y축에는 영향을 받는 변수인 종속 변수를 배치하여 두 변수의 상관관계를 나타낸다
- 이상치가 나타난 기계적/환경적 원인을 조사해 품질 개선 및 관리에 활용할 수 있다
- 매출과 순익에 대한 관계성을 직관적으로 이해할 수 있다
장점 | 단점 |
- 두 변수 간의 관계에 대한 경향을 파악할 수 있다 - 모든 데이터의 실제 수치를 차트에 담아낸다 - 이상치나 특이점을 쉽게 포착할 수 있다 |
- 대용량 데이터를 시각화하는 데 어려움이 있다 - 3개 이상의 변수 간의 관계는 분석하기 어렵다 - 세 변수의 관계를 보고 싶을 때는 버블차트를 사용할 수 있다 - 두 변수의 상관관계를 수치로 알려주지 않는ㄷ => 상관계수를 추가로 고려할 수 있다 |
* 분산형 차트 사용 시 주의점
1) 회귀 방정식을 사용하면 변수들의 관계를 더욱 명확하게 이해할 수 있다
2) 색상을 활용하자
4. 분포 분석에 주로 사용되는 차트
- 데이터가 어떠한 패턴을 보이는지 알고자 할 때 사용하는 분석법
- 히스토그램, 분산형 차트 등이 있다
① 히스토그램(Histogram)
- 여러 개의 막대를 이용해 데이터의 분포 형태를 시각적으로 표현한 차트
- 데이터의 분포 경향을 시각화하고 어떠한 구간의 데이터들이 더욱 밀집되어 있는지 파악할 수 있게 해준다
- 신뢰성(공학)분야에서는 히스토그램을 활용해 기계나 제품의 수명이 어떠한 분포를 나타내는지 분석할 때 사용한다
- 소득 분포나 인구 분포 등 여러 분야에서 사용될 수 있다
장점 | 단점 |
- 데이터 분포 형태를 파악하기 쉽다 - 대용량의 데이터도 쉽게 처리할 수 있다 - 이상치를 쉽게 판별할 수 있다 - 주류 데이터들은 밀집하게 되고, 동떨어진 값은 쉽게 발견할 수 있다 - 비대칭도를 확인할 수 있다 |
- 개별 데이터의 정확한 값을 읽기 힘들다 - 분포 형태가 히스토그램 구간 너비에 영향을 받는다 - 계급을 너무 잘거나 넓게 잡으면 분포 형태가 정확하게 나타나지 않는다 - 두 가지 이상의 변수들을 비교하기 힘들다 |
* 히스토그램 사용 시 주의사항
1) 적절한 구간의 수를 정하기
구간(계급)의 수는 보통 5개~20개가 적당하다. 보통 log2(N)개 정도의 계급의 수를 예상한다. 하지만 데이터의 특성에 따라 적정 구간 개수가 달라지므로 여러 번의 시도를 통해 적절한 개수를 결정하는 것이 좋다.
2) 구간의 경계선 값을 명확히 설정
구간의 간격을 소수점이나 비 균등하게 설정하는 것보다 5배수나 10배수처럼 균등하게 나누어지는 값을 경계값으로 설정하는 것이 차트를 해석할 때 더욱 수월하다.
마무리
완벽한 차트는 조재하지 않는다. 각 차트의 장단점을 이해하고 프로젝트에 맞는 차트를 선택하는 것이 중요하다.
차트를 적절히 사용하면 전달하고자 하는 메세지를 더욱 강조할 수 있다.
목적 | 차트 |
비교 분석 | 막대 차트, 라인 차트, 방사형 차트 |
구성 분석 | 파이 차트, 영역 차트, 누적 막대 차트, 폭포수 차트 |
관계 분석 | 분산형 차트, 버블 차트 |
분포 분석 | 히스토그램, 분산형 차트 |
참고
https://r-charts.com/correlation/scatter-plot-group/
https://apexcharts.com/javascript-chart-demos/bubble-charts/simple/