'공부정리/통계' 카테고리의 글 목록

나이브 베이즈 분류 예시) 테니스를 좋아하는 한 사람이 있다고 하자. 만약, 이 사람이 1. 날씨가 좋고 2. 습도가 낮은 날에 테니스를 칠 확률은 얼마나 되는가? 주어진 데이터에 따라 경우가 다르겠지만, "1. 이 사람이 테니스를 많이 칠 수록, 2. 테니스를 쳤을 때, 해당 날씨가 좋고 습도가 낮은 경우가 많을 때"일수록 이 사람이 날씨가 좋고 습도가 낮은 날에 테니스를 칠 확률이 높아진다. 조건부 확률 이를 수학적 개념을 통해 알아보자. 먼저, 조건부 확률에 대해서 알 필요가 있다. 이해하기 쉽도록 "B가 주어졌을 때 사건 A의 조건부 확률"은 아래와 같다. 조건부 확률 이는 B사건 중에서 A사건이 동시에 발생한 경우를 나타낸다. 즉, 위의 예시에서 좋은 날씨와 낮은 습도가 고정되어 있을 때, 테니..

분산은 평균으로부터 얼마나 떨어져 있는 지를 표현한 것인데, 평균에서부터 떨어진 거리가 평균적으로 표현된 것입니다. 공분산이라는 것은 두 개의 데이터가 각각의 평균으로부터 얼마나 떨어져 있는가를 보는데 있어 두 변수가 얼마나 함께 변하는지를 확인한 것입니다. 데이터의 모든 특성의 범위를 같게 만들어주는 방법 교차검증을 위해 Train-Test로 분리하였을 경우 전체 데이터가 아닌 훈련 데이터에 대해서만 fit()을 적용해야한다. 1. StandardScaler - 평균 = 0 / 표준편차 = 1 - 표준화 Standardization 스크래치 코드 def standardize(x): """Standardize the original data set.""" return (x - x.mean(axis=0))..

티스토리툴바