koalanlp / kr.bydelta.koala.utagger

Package kr.bydelta.koala.utagger

울산대학교 UTagger 형태소 분석기의 Wrapper를 정의합니다.

해당 API는 울산대학교 자연어처리연구실에서 개발한 것으로, 원본 분석기의 저작권은 해당 연구실에 있으며, 형태소 분석기는 울산대학교 자연어처리 연구실에서 확인 가능합니다.

원본의 저작권 조항은 아래와 같으며, KoalaNLP 코드의 저작권 조항은 MIT license를 따릅니다.

참고

utagger 분석기는 C로 개발되어, 현재 KoalaNLP가 자동으로 설치하는 범위에는 포함되지 않습니다. 따라서, 사용 전 분석기의 설치가 필요합니다.

울산대는 미리 컴파일 된 파일을 제공하므로, 설치 자체가 복잡한 편은 아니니 여기를 참조하여 설치해보세요. (단, 일부 환경에서는 지원하지 않습니다.)

참고로, KoalaNLP가 Travis CI에서 패키지를 자동 테스트하기 위해 구현된 bash script는 여기에 있습니다.

참고 Travis CI에서 울산대 FTP로 접근할 때, 다운로드에 시간이 오래 걸리기 때문에, KoalaNLP의 CI Test 과정에서는 울산대 Tagger에서 일부 사전을 null 처리 한 사전들을 사용하므로, Shell script 실행시 울산대 사전을 그대로 받는지 확인하십시오.

자바 및 스칼라 개발자를 위한 노트

Types

Tagger

UTagger 품사 분석 API의 Wrapper입니다.

class Tagger : CanTagOnlyASentence<List<UWord>?>

UMorpheme

UTagger의 형태소 JSON 표현 규격

data class UMorpheme

UTagger

UTagger 분석기 Wrapper

class UTagger

UTaggerLibrary

UTagger Shared object와 소통하기 위한 JNA Wrapper

interface UTaggerLibrary

UWord

UTagger의 어절 JSON 표현 규격

data class UWord