산포도 (사분위수, 범위, 분산, 표준편차)
- 데이터의 중심이 어디 있는지만으로는 자료의 분석이 쉽지 않다 - 두 데이터가 주어졌을 때, 둘의 평균이 같더라도 흩어진 정도는 다를 수 있다( 평균점수가 같은 A반과 B반) - 산포도는 주어진 데이터가 얼마나 퍼져있는지를 나타낸다 - 0에 가까울수록 값이 몰려 있고, 값이 클수록 값이 넓게 퍼져있다 1. 범위(range) - 범위는 산포도를 나타내는 가장 간단한 통계치이다 - 범위는 가장 큰 값에서 가장 작은 값을 뺀 값이다 - 이상치에 민감하다(튀는 값 하나만 있더라도 범위가 매우 커진다) def data_range(xs): return max(xs)-min(xs) 2. 사분위수(quartile) - 사분위수는 자료를 정렬한 후에 백분율을 4 등분한 각 점을 의미한다 제1사분위수 제2사분위수 제3사..