koalanlp / kr.bydelta.koala.khaiii

Package kr.bydelta.koala.khaiii

Kakao Khaiii 형태소 분석기의 Wrapper를 정의합니다.

해당 API는 Kakao 개발한 것으로, 원본 분석기의 저작권은 Kakao에 있으며, 형태소 분석기는 Khaiii 형태소 분석기에서 확인 가능합니다.

원본의 저작권 조항은 Apache 2.0을 따르며, KoalaNLP 코드의 저작권 조항은 MIT license를 따릅니다.

참고

khaiii 분석기는 C++으로 개발되어, 현재 KoalaNLP가 자동으로 설치하는 범위에는 포함되지 않습니다. 따라서, 사용 전 분석기의 설치가 필요합니다.

Python3.6 및 CMake 3.10+만 설치되어 있다면 설치 자체가 복잡한 편은 아니니 여기를 참조하여 설치해보세요. (단, v0.1에서는 빌드시에만 'python3' 호출시 'python3.6'이 연결되어야 합니다.)

참고로, KoalaNLP가 Travis CI에서 패키지를 자동 테스트하기 위해 구현된 bash script는 여기에 있습니다.

자바 및 스칼라 개발자를 위한 노트

Types

Khaiii

Khaiii 분석기 Wrapper

class Khaiii

KhaiiiConfig

Khaiii 설정

data class KhaiiiConfig

KhaiiiLibrary

Khaiii Shared object와 소통하기 위한 JNA Wrapper

interface KhaiiiLibrary

KhaiiiLoggerType

Khaiii에서 설정된 Logger 유형들.

enum class KhaiiiLoggerType

KhaiiiMorph

Khaiii API에서 출력하는 형태소 결과 Struct의 JNA 대응 Class

open class KhaiiiMorph

KhaiiiWord

Khaiii API에서 출력하는 어절 결과 Struct의 JNA 대응 Class

open class KhaiiiWord

Tagger

Khaiii 품사 분석 API의 Wrapper입니다.

class Tagger : CanTagOnlyASentence<KhaiiiWord?>

Extensions for External Classes

java.util.logging.Level

kotlin.String

Properties

posTagsInKhaiii

Khaiii.analyzeBeforeErrorPatch의 결과를 해석하기 위해, Khaiii에서 사용하는 태그들의 순서를 그대로 가져왔습니다.

val posTagsInKhaiii: List<String>

Functions

fromSejongPOS

입력받은 세종 품사 표기를 카이 분석기의 품사 표기로 변환합니다.

fun POS.fromSejongPOS(): String