KoalaNLP¶
소개¶
한국어 형태소 및 구문 분석기의 모음인, KoalaNLP의 Python 판본입니다.
이 프로젝트는 서로 다른 형태의 형태소 분석기를 모아, 동일한 인터페이스 아래에서 사용할 수 있도록 하는 것이 목적입니다.
Hannanum: KAIST의 한나눔 형태소 분석기와 NLP_HUB 구문분석기
KKMA: 서울대의 꼬꼬마 형태소/구문 분석기
KOMORAN: Junsoo Shin님의 코모란 v3.3.9
OKT: OpenKoreanText의 오픈 소스 한국어 처리기
Eunjeon: 은전한닢 프로젝트의 SEunjeon(S은전)
Arirang: 이수명님의 Arirang Morpheme Analyzer 1-1
RHINO: 최석재님의 RHINO v3.7.8
Daon: 김상준님의 Daon 분석기
ETRI: ETRI의 공공 인공지능 Open API
주1-1 Arirang 분석기의 출력을 형태소분석에 적합하게 조금 다듬었으므로, 원본과 약간 다른 결과를 낼 수도 있습니다.
Kakao의 카이(Khaiii) v0.4 (별도설치 필요: 설치법)
울산대학교의 UTagger 2018년 10월 31일자 (별도설치 필요: 설치법)
주1-2 UTagger의 2019-7 버전도 공개되어 있지만, 리눅스 개발환경을 위한 라이브러리 파일이 공개되어있지 않아 지원하지 않습니다.
bab2min님의 Kiwi (별도설치 필요:
pip install kiwipiepy
)