[Data Science from Scratch] Chapter 11. machine learning

2022. 7. 21. 15:32·공부정리/Data Science
728x90
반응형

참고 서적

도서명: Data Science from Scratch
(밑바닥부터 시작하는 데이터 과학)
저자 : Joel Grus
출판 : 프로그래밍 인사이트

Ch 11. machine learning

11.1 modeling

출처: https://blog.lgcns.com/2212

 

machine learning: 데이터를 통해 모델을 만들고 사용하는 것 (책의 정의)

 

model: 다양한 변수간의 수학적(혹은 확률적) 관계를 식으로 표현한 것

 

 

 

11.2 What Is Machine Learning?

  • supervised learning: 데이터에 정답이 포함
  • unsupervised learning: 데이터에 정답이 포함되지 X
  • semi-supervised learning: 데이터의일부분에만 정답이 포함되어있음

 

  • online learning: 새로 들어오는 데이터를 통해 모델을 끈임없이 조정
  • reinforcement learning: 연속된 예측 뒤 모델이 얼마나 잘 예측했는지 파악

 

11.3 Regression & Classification

 

11.3 Evaluation Metrics Of Regression & Classification 

출처:  http://www.sbr.ai/news/articleView.html?idxno=878

11.4 Overfitting and Underfitting

과적합은 파라미터의 개수가 상대적으로 학습용 데이터의 개수보다 많을 때 일어난다.

 

Underfitting

모델의 성능이 학습 데이터에서도 좋지 않은 경우를 의미한다. 보통 언더피팅이 발생하면 해당 모델은 문제에서 적합하지 않다는 것을 의미하며, 새로운 모델을 찾아봐야한다.

 

Regularization

NN가 training data의 중요한 정보만 담고, 부수적, 우연적, 특수한 정보를 담지 않게 하는 방법

Weight Decay

penalty는 가중치의 값들의 합이기 때문에 학습시에 penalty를 낮추는 것은 정보를 잃게 만드는 역할을 한다. 다만 덜 중요한(적은) 정보는 결과적으로 더 중요한(많은) 정보에 비해서 더 남지 못하게 될 것이다.

 

출처: minjung-s.log 

 

 

 

728x90
반응형

'공부정리 > Data Science' 카테고리의 다른 글

[Data Science from Scratch] chapter 12. KNN  (0) 2022.07.28
[Data Science from Scratch] ch.11 additional note  (0) 2022.07.25
[Data Science from Scratch] ch.7, 8 additional note - Gradient Descent without FrameWork!  (0) 2022.07.20
[Data Science from Scratch] Ch 4, 5, 6 additional note  (0) 2022.07.13
[Data Science from Scratch] ch 4. Linear Algebra - (1) Vector  (0) 2022.07.07
'공부정리/Data Science' 카테고리의 다른 글
  • [Data Science from Scratch] chapter 12. KNN
  • [Data Science from Scratch] ch.11 additional note
  • [Data Science from Scratch] ch.7, 8 additional note - Gradient Descent without FrameWork!
  • [Data Science from Scratch] Ch 4, 5, 6 additional note
sillon
sillon
꾸준해지려고 합니다..
    반응형
  • sillon
    sillon coding
    sillon
  • 전체
    오늘
    어제
    • menu (614)
      • notice (2)
      • python (68)
        • 자료구조 & 알고리즘 (23)
        • 라이브러리 (19)
        • 기초 (8)
        • 자동화 (14)
        • 보안 (1)
      • coding test - python (301)
        • Programmers (166)
        • 백준 (76)
        • Code Tree (22)
        • 기본기 문제 (37)
      • coding test - C++ (5)
        • Programmers (4)
        • 백준 (1)
        • 기본기문제 (0)
      • 공부정리 (5)
        • 신호처리 시스템 (0)
        • Deep learnig & Machine lear.. (41)
        • Data Science (18)
        • Computer Vision (17)
        • NLP (40)
        • Dacon (2)
        • 모두를 위한 딥러닝 (강의 정리) (4)
        • 모두의 딥러닝 (교재 정리) (9)
        • 통계 (2)
      • HCI (23)
        • Haptics (7)
        • Graphics (11)
        • Arduino (4)
      • Project (21)
        • Web Project (1)
        • App Project (1)
        • Paper Project (1)
        • 캡스톤디자인2 (17)
        • etc (1)
      • OS (10)
        • Ubuntu (9)
        • Rasberry pi (1)
      • App & Web (9)
        • Android (7)
        • javascript (2)
      • C++ (5)
        • 기초 (5)
      • Cloud & SERVER (8)
        • Git (2)
        • Docker (1)
        • DB (4)
      • Paper (7)
        • NLP Paper review (6)
      • 데이터 분석 (0)
        • GIS (0)
      • daily (2)
        • 대학원 준비 (0)
      • 영어공부 (6)
        • job interview (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    programmers
    Python
    백준
    소수
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
sillon
[Data Science from Scratch] Chapter 11. machine learning
상단으로

티스토리툴바