728x90
반응형
reference
자연어처리 - 노가다 없는 텍스트 분석을 위한 한국어 NLP
https://www.slideshare.net/kimhyunjoonglovit/pycon2017-koreannlp 이전에 소개한 '한국어 채팅 데이터로 머신러닝하기'에서 사용된 cohesion tokenizer(결합 토크나이저)에 대해 자세히 설명한 슬라이드입니다. 토크
aidev.co.kr
github
https://github.com/lovit/soynlp
728x90
반응형
'공부정리 > NLP' 카테고리의 다른 글
[NLP] 한국어 임베딩 1장 - 서론 (1) | 2022.09.30 |
---|---|
[NLP] 한국어 전처리 기법 모음 (0) | 2022.09.29 |
[NLP] 캐글 영화 리뷰 분석 튜토리얼 3 - (1) K-means로 군집화(Clustering) 하고 학습, 예측하기 - 강의 정리 (0) | 2022.08.29 |
[NLP] 캐글 영화 리뷰 분석 튜토리얼 2 - (3) 평균 feature vector 구하기 - 강의 정리 (0) | 2022.08.29 |
[NLP] 캐글 영화 리뷰 분석 튜토리얼 2 - (2) Gensim을 통해 벡터화, t-SNE로 시각화하기 - 강의 정리 (0) | 2022.08.29 |