zenn.skin 무료버전 배포중!
자세히보기

DataScience 56

DataScience
중심 경향성 (평균, 중앙값, 최빈값)

1. 중심 경향성 - '중심 경향성'은 데이터의 중심이 어디 있는지를 나타내는 지표이다 - 평소에 우리가 자주 사용하는 평균도 중심 경향성을 나타내는 지표 중 하나이다 - 중심 경향성을 알면 분포의 중앙을 알 수 있어 데이터의 특성을 파악하기 쉬워진다 - 평균, 중앙값, 최빈값 등이 있다 2. 평균(mean) - 평균은 전체 주어진 자료의 값을 모두 더한 후 자료의 개수로 나눈 값이다 - N개의 자료가 주어질 때 임의 하나의 값이 1증가시켜도 전체 평균은 1/N만큼 증가한다 - 데이터가 바뀌어도 값의 변화가 급격하지 않다 - 이상치(특이값)에 민감하다(튀는 값이 하나 있으면 평균이 크게 바뀌어 버린다) 3. 중앙값(median) - 중앙값은 전체 데이터의 정중앙에 있는 값을 의미한다 - 데이터의 개수가 ..

DataScience
기하분포의 정의와 평균

1. 기하 랜덤 변수 - 시행을 계속할 때, 언제 처음으로 성공하는지를 나타낸다 - 성공확률이 p일 때, 실패할 확률은 1-p이다 - 총 x번 시행할 동안 x-1번은 실패하고 x번째에서 성공하게 될 확률을 나타낸다 위처럼 처음으로 성공할 확률을 나타낼 때 기하 분포를 사용할 수 있다. 2. 평균 기하 분포의 평균을 2가지 방법으로 구해보자 1. 미분과 무한등비급수의 합을 이용 2. 공식을 이용한 풀이 3. 분산 - 마찬가지로 미분과 무한등비급수를 이용하여 구할 수 있다