[Data Science from Scratch] Chapter 11. machine learning
·
공부정리/Data Science
참고 서적 도서명: Data Science from Scratch (밑바닥부터 시작하는 데이터 과학) 저자 : Joel Grus 출판 : 프로그래밍 인사이트 Ch 11. machine learning 11.1 modeling machine learning: 데이터를 통해 모델을 만들고 사용하는 것 (책의 정의) model: 다양한 변수간의 수학적(혹은 확률적) 관계를 식으로 표현한 것 11.2 What Is Machine Learning? supervised learning: 데이터에 정답이 포함 unsupervised learning: 데이터에 정답이 포함되지 X semi-supervised learning: 데이터의일부분에만 정답이 포함되어있음 online learning: 새로 들어오는 데이터를 통..
Programmers / 위장 / Python 파이썬
·
coding test - python/Programmers
*문제 출처는 프로그래머스에 있습니다. 문제 제목: 위장 (2단계 - 해시문제) 문제 사이트: https://school.programmers.co.kr/learn/courses/30/lessons/42578 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 설명 스파이들은 매일 다른 옷을 조합하여 입어 자신을 위장합니다. 예를 들어 스파이가 가진 옷이 아래와 같고 오늘 스파이가 동그란 안경, 긴 코트, 파란색 티셔츠를 입었다면 다음날은 청바지를 추가로 입거나 동그란 안경 대신 검정 선글라스를 착용하거나 해야 합니다. 종류 이름 얼굴 동그란 안경, 검정..
[핵심 머신러닝] 수치예측, 범주예측 (분류) - 강의 정리
·
공부정리/Deep learnig & Machine learning
이 게시글은 김성범 교수님의 유튜브 강의를 정리한 내용입니다. 내용과 사진의 각 출처는 김성범 교수님께 있음을 미리 알립니다. 해당 게시글 강의 영상: https://www.youtube.com/watch?v=FfUHRuUxQiY&t=4s [핵심 머신러닝] 수치예측, 범주예측 (분류) X (원인): 독립변수, 예측변수, 입력변수 Y (결과): 종속변수, 반응변수, 출력변수 예측 모델링: 관계를 잘 찾는 함수식을 찾는 것 연속형 데이터: 데이터 자체를 숫자로 표현 예) 가격, 길이, 압력, 두께 범주형 데이터: 원칙적으로 숫자로 표시할 수 없는 데이터 예) 제품 불량 여부 (양품/ 불량), 보험 사기 여부(정상/ 비정상) 수치 예측 데이터 (Regression) y값이 없는 x값의 데이터가 올 때, y값을..
[Data Science from Scratch] ch.7, 8 additional note - Gradient Descent without FrameWork!
·
공부정리/Data Science
참고 서적 도서명: Data Science from Scratch (밑바닥부터 시작하는 데이터 과학) 저자 : Joel Grus 출판 : 프로그래밍 인사이트 Ch 8. Gredient Decente - Linear Regression 직접 경사하강법 구현해보기 본 코드는 프레임워크(Scikit-Learn, Tensorflow...etc) 없이 구현한 코드입니다. 구현 순서 sample data 수집 data 정제하기 (회귀, 분류 등 문제 확인) 하이퍼파라미터 설정 Optimizer & Loss Function Select Evaluation Visualizing 해당 코드는 Sample Data를 수집하지 않고, 임의의 데이터를 사용한 것입니다. 1. Sample Data 수집 2. 데이터 정제 (SK..
Programmers / 다리를 지나는 트럭 / Python 파이썬
·
coding test - python/Programmers
*문제 출처는 프로그래머스에 있습니다. 문제 제목: 다리를 지나는 트럭 (2단계) 문제 사이트: https://school.programmers.co.kr/learn/courses/30/lessons/42583 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 트럭 여러 대가 강을 가로지르는 일차선 다리를 정해진 순으로 건너려 합니다. 모든 트럭이 다리를 건너려면 최소 몇 초가 걸리는지 알아내야 합니다. 다리에는 트럭이 최대 bridge_length대 올라갈 수 있으며, 다리는 weight 이하까지의 무게를 견딜 수 있습니다. 단, 다리에 완전히 오르지 않은..
Programmers / H-index / Python 파이썬
·
coding test - python/Programmers
*문제 출처는 프로그래머스에 있습니다. 문제 제목: H-index (2단계) 문제 사이트: H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다. 어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다. 어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요. 제한사항 과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다. 논문별 인용..
문제 / 이분 검색 / Python 파이썬
·
coding test - python/기본기 문제
문제 제목: 이분 검색 임의의 N개의 숫자가 입력으로 주어집니다. N개의 수를 오름차순으로 정렬한 다음 N개의 수 중 한 개의 수인 M이 주어지면 이분검색으로 M이 정렬된 상태에서 몇 번째에 있는지 구하는 프로그램을 작성하세요. 단 중복값은 존재하지 않습니다. ▣ 입력설명 첫 줄에 한 줄에 자연수 N(3
[Data Science from Scratch] Ch 4, 5, 6 additional note
·
공부정리/Data Science
참고 서적 도서명: Data Science from Scratch (밑바닥부터 시작하는 데이터 과학) 저자 : Joel Grus 출판 : 프로그래밍 인사이트 Ch 4. 선형대수 4.1 거리 유사도 측정방법 Euclidean Distance 두 점 p, q사이의 유클리디안 거리를 구하면 이 두 점의 최단거리가 된다. 다음 코드는 넘파이 라이브러리를 활용하여 두 점 사이의 유클리디안 거리를 이용한 코드이다. 두 가지 개체의 속성값들이 여러개 일 경우 이들 속성값들에 의한 두 개체 사이의 유사도를 구할 때 자주 사용함 import numpy as np point1 = np.array((1, 1)) point2 = np.array((2, 2)) dist = np.linalg.norm(point1 - point2..
[Data Science from Scratch] ch 4. Linear Algebra - (1) Vector
·
공부정리/Data Science
* 이 포스트는 여러 참고 서적과 구글링 내용을 바탕으로 작성하였습니다. 서적 내용의 흐름에 맞게 작성하되, 여러 내용을 보충하여 작성하였습니다. 참고 서적 도서명: Data Science from Scratch (밑바닥부터 시작하는 데이터 과학) 저자 : Joel Grus 출판 : 프로그래밍 인사이트 도서명: 인공지능을 위한 수학 저자 : 이시카와 아키히코 출판 : 프리렉 ch 4. Linear Algebra 선형대수학(Linear Algebra)는 벡터 공간(Vector space)과 선형 변환(Linear transeformation)을 중심으로 한 학문 체계를 말하며, 다양한 분야에서 폭 넓게 사용하고 있다. 선형대수를 많이 활용하는 이유는 방대한 양의 데이터나 복잡한 시스템을 비교적 간단하게 표..
[Data Science from Scratch] Chepter 1,2,3 Additional note
·
공부정리/Data Science
참고 서적 도서명: Data Science from Scratch (밑바닥부터 시작하는 데이터 과학) 저자 : Joel Grus 출판 : 프로그래밍 인사이트 이 포스팅은 '밑바닥부터 시작하는 데이터과학' 도서를 공부하면서 추가적으로 공부하거나, 새롭게 알게된 내용들을 정리하였습니다. Contents Collections module Random module re Automated Testing and assert Data Visualization 1. Collections - Container datatypes 1. Counter 2. ChainMap 3. defaultdict 4. OrderedDict 5. namedtuple Collection 파이썬의 collections 모듈은 파이썬에 내장된 일..
[기초] Altair / 데이터 시각화
·
python/라이브러리
보호되어 있는 글입니다.
Programmers / 기능 개발 / Python 파이썬
·
coding test - python/Programmers
*문제 출처는 프로그래머스에 있습니다. 문제 제목: 기능 개발 (2단계) 문제 사이트: https://programmers.co.kr/learn/courses/30/lessons/42586 코딩테스트 연습 - 기능개발 프로그래머스 팀에서는 기능 개선 작업을 수행 중입니다. 각 기능은 진도가 100%일 때 서비스에 반영할 수 있습니다. 또, 각 기능의 개발속도는 모두 다르기 때문에 뒤에 있는 기능이 앞에 있는 programmers.co.kr 문제 설명 프로그래머스 팀에서는 기능 개선 작업을 수행 중입니다. 각 기능은 진도가 100%일 때 서비스에 반영할 수 있습니다. 또, 각 기능의 개발속도는 모두 다르기 때문에 뒤에 있는 기능이 앞에 있는 기능보다 먼저 개발될 수 있고, 이때 뒤에 있는 기능은 앞에 있는..