728x90
Py-Hanspell
pip install git+https://github.com/ssut/py-hanspell.git
Py-Hanspell은 네이버 한글 맞춤법 검사기를 바탕으로 만들어진 패키지입니다.
from hanspell import spell_checker
sent = "맞춤법 틀리면 외 않되? 쓰고싶은대로쓰면돼지 "
spelled_sent = spell_checker.check(sent)
hanspell_sent = spelled_sent.checked
print(hanspell_sent)
맞춤법 틀리면 왜 안돼? 쓰고 싶은 대로 쓰면 되지
이 패키지는 띄어쓰기 또한 보정합니다. PyKoSpacing에 사용한 예제를 그대로 사용해봅시다.
spelled_sent = spell_checker.check(new_sent)
hanspell_sent = spelled_sent.checked
print(hanspell_sent)
print(kospacing_sent) # 앞서 사용한 kospacing 패키지에서 얻은 결과
김철수는 극 중 두 인격의 사나이 이광수 역을 맡았다. 철수는 한국 유일의 태권도 전승자를 가리는 결전의 날을 앞두고 10년간 함께 훈련한 사형인 유연제(김광수 분)를 찾으러 속세로 내려온 인물이다.
김철수는 극중 두 인격의 사나이 이광수 역을 맡았다. 철수는 한국 유일의 태권도 전승자를 가리는 결전의 날을 앞두고 10년간 함께 훈련한 사형인 유연재(김광수 분)를 찾으러 속세로 내려온 인물이다.
PyKoSpacing과 결과가 거의 비슷하지만 조금 다릅니다.
출처
728x90
'공부정리 > NLP' 카테고리의 다른 글
[NLP] 허깅페이스(Huggingface)에 로그인하여 내 모델 포팅(porting)하기 / 토큰 발급, 허깅페이스 로그인, 모델 포팅 (0) | 2023.01.31 |
---|---|
[NLP] KorQuAD 1.0 데이터셋 기계독해 MRC 구현 / BERT fine-turning (0) | 2023.01.27 |
[NLP] PyKoSpacing로 띄어쓰기 교정하기 (1) | 2022.11.16 |
mecab 설치 (with ubuntu, konlpy) (0) | 2022.11.11 |
[NLP Project] 3. 데이터 학습을 위한 준비 (학습 데이터와 테스트데이터) (0) | 2022.11.05 |