skinOptions.hljs
[통계] Gaussian/Multinomial Naive Bayes Classification(가우시안/다항 나이브 베이즈 분류)
·
공부정리/통계
나이브 베이즈 분류 예시) 테니스를 좋아하는 한 사람이 있다고 하자. 만약, 이 사람이 1. 날씨가 좋고 2. 습도가 낮은 날에 테니스를 칠 확률은 얼마나 되는가? 주어진 데이터에 따라 경우가 다르겠지만, "1. 이 사람이 테니스를 많이 칠 수록, 2. 테니스를 쳤을 때, 해당 날씨가 좋고 습도가 낮은 경우가 많을 때"일수록 이 사람이 날씨가 좋고 습도가 낮은 날에 테니스를 칠 확률이 높아진다. 조건부 확률 이를 수학적 개념을 통해 알아보자. 먼저, 조건부 확률에 대해서 알 필요가 있다. 이해하기 쉽도록 "B가 주어졌을 때 사건 A의 조건부 확률"은 아래와 같다. 조건부 확률 이는 B사건 중에서 A사건이 동시에 발생한 경우를 나타낸다. 즉, 위의 예시에서 좋은 날씨와 낮은 습도가 고정되어 있을 때, 테니..
[통계] 표준화(Standard)와 정규화, 분산과 공분산
·
공부정리/통계
분산은 평균으로부터 얼마나 떨어져 있는 지를 표현한 것인데, 평균에서부터 떨어진 거리가 평균적으로 표현된 것입니다. 공분산이라는 것은 두 개의 데이터가 각각의 평균으로부터 얼마나 떨어져 있는가를 보는데 있어 두 변수가 얼마나 함께 변하는지를 확인한 것입니다. 데이터의 모든 특성의 범위를 같게 만들어주는 방법 교차검증을 위해 Train-Test로 분리하였을 경우 전체 데이터가 아닌 훈련 데이터에 대해서만 fit()을 적용해야한다. 1. StandardScaler - 평균 = 0 / 표준편차 = 1 - 표준화 Standardization 스크래치 코드 def standardize(x): """Standardize the original data set.""" return (x - x.mean(axis=0))..