일단 내가 사용하고 있는 anaconda 가상환경의 경로를 알아야 한다.
anaconda prompt 창을 열어 가장 먼저 나오는 경로를 찾으면 된다.
해당 경로에서 anaconda 폴더를 찾고 envs로 들어간다.
envs에서 내가 사용중인 가상환경폴더로 들어간다. 그러면 다음과 같이 보일 것이다.
이제 여기서 konlpy폴더를 찾아야 하는데 그냥 검색창에 konlpy 입력해서 나오는 폴더를 찾으면 된다.
위 사진처럼 보인다면 성공이다.
이제 java폴더에서 open-korean-text-2.1.0압축파일을 해제한다.
압축해제한 폴더에서 org > openkoreantext > processor > util 을 찾는다.
일단 명사부터 수정하기 위해 noun을 들어가 후 원하는 파일을 연다.
나는 일단 이렇게 추가했다.
그리고 귀여움의 경우는 형태소가 어떻게 구성되는지 몰라서
util > typos > typos.txt에서
이렇게 추가했다. 이제 아까 압축해제했던 폴더를 다시 jar로 압축해야되는데
윈도우에서는 그냥 압축이안되고 cmd명령어로 해야된다.
근데이게 내 java 버전에서는 안되서 일단 그냥 zip파일로 압축한다.
이제 원래 있던 open-korean-text-2.1.0 파일을 버리고 zip파일을 jar로 변환하면 된다.
ZIP JAR 변환 (온라인 무료) — Convertio << 여기 사이트에서 zip파일을 업로드하면 변환해준다.
변환한 파일로 zip파일을 대체하고 다시 주피터노트북으로 돌아간다.
대충 테스트 해보니 잘 된 것 같다.
그럼 이제 이때까지 한 작업을 함수화하면 끝이다.
reference
https://haystar.tistory.com/11