목록Study/밑바닥부터 시작하는 데이터 과학 (2)
Koo's.Co
correlation을 이용하면 두 변수간의 선형관계를 확인할 수 있습니다. 회귀 분석을 이용하면 두 변수의 선형관계에 대해 좀 더 자세히 확인할 수 있습니다. 독립변수 x와 종속변수 y의 관계는 위와 같은 관계식으로 나타낼 수 있습니다. 이 때 엡실론은 모델이 고려하지 못한 오류를 의미합니다. 다음은 모델이 예측할 종속변수값을 나타냅니다. def predict(alpha: float, beta: float, x_i: float) -> float: return beta*x_i + alpha 실제값과 모델 예측값의 차이에 해당하는 오류는 다음과 같습니다. def error(alpha: float, beta: float, x_i: float, y_i: float) -> float: return predict..
베이즈 정리는 다음과 같습니다. NaiveBayesClassifier는 베이즈 정리를 이용해 분류 문제를 해결하는 모델입니다. 베이즈 정리 (Bayes' theorem) koosco.tistory.com 베이즈 정리에 대한 내용은 이전에 포스팅한 내용을 참고하면 됩니다. 1. Spam Filter n개의 단어가 주어질 때, 각 단어들이 메시지에 포함되는 경우를 확률로 나타낼 수 있습니다. 여기서는 스팸 메일인지 구분하기 위해 메시지가 스팸인 사건을 S라 정의하겠습니다. i번째 단어가 각각 스팸 메시지와 햄 메시지에 포함될 확률을 위와 같이 나타낼 수 있습니다. 나이브 베이즈 분류기의 핵심은 각 요소(단어)들이 모두 독립이라는 점에 있습니다. 각각의 요소들이 모두 독립이라면 각 확률들의 곱으로 나타낼 수 ..