koalanlp / kr.bydelta.koala.proc

Package kr.bydelta.koala.proc

KoalaNLP가 사용하는, 또는 사용할 API Interface를 정의합니다.

자바 및 스칼라 개발자를 위한 노트

Types

CanAnalyzeProperty

Sentence 객체에 property를 추가할 수 있는 interface입니다. INTERMEDIATE는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

interface CanAnalyzeProperty<INTERMEDIATE>

CanCompileDict

사용자 사전추가 기능을 위한 interface입니다.

interface CanCompileDict

CanDisambiguateSense

다의어 분별 (Word sense disambiguation)을 수행하는 Interface입니다. 매개변수 T는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

interface CanDisambiguateSense<T> : CanAnalyzeProperty<T>

CanExtractResource

Jar Resource에 포함된 모형을 임시디렉터리에 압축해제하기 위한 interface입니다.

abstract class CanExtractResource

CanLabelSemanticRole

의미역 분석(Semantic Role Labeling)을 수행하는 Interface입니다. 매개변수 T는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

interface CanLabelSemanticRole<T> : CanAnalyzeProperty<T>

CanParseDependency

의존구문분석을 수행하는 Interface입니다. 매개변수 T는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

interface CanParseDependency<T> : CanAnalyzeProperty<T>

CanParseSyntax

구문분석을 수행하는 Interface입니다. 매개변수 T는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

interface CanParseSyntax<T> : CanAnalyzeProperty<T>

CanRecognizeEntity

개체명 인식 (Named Entity Recognition)을 수행하는 Interface입니다. 매개변수 T는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

interface CanRecognizeEntity<T> : CanAnalyzeProperty<T>

CanResolveCoref

상호참조 해소, 공지시어 해소 (Coreference Resolution) 또는 대용어 분석 (Anaphora Resolution)을 수행하는 Interface입니다.

interface CanResolveCoref<T> : CanAnalyzeProperty<T>

CanSplitSentence

문장분리기 Interface

interface CanSplitSentence

CanTag

품사분석기의 최상위 인터페이스입니다.

interface CanTag

CanTagAParagraph

문단1개, 문장1개가 분석가능한 품사분석기 interface. 원본 분석기는 문장 분석 결과를 S 타입으로 돌려줍니다.

abstract class CanTagAParagraph<S> : CanTagASentence<S>

CanTagASentence

문장 1개가 분석가능한 품사분석기 interface. 원본 분석기는 문장 분석 결과를 S 타입으로 돌려줍니다.

abstract class CanTagASentence<S> : CanTag

CanTagOnlyAParagraph

문장1개는 불가하지만, 문단1개가 분석가능한 품사분석기 interface. 원본 분석기는 문장 분석 결과를 S 타입으로 돌려줍니다.

abstract class CanTagOnlyAParagraph<S> : CanTag

CanTagOnlyASentence

문단1개는 불가하지만, 문장1개가 분석가능한 품사분석기 interface. 원본 분석기는 문장 분석 결과를 S 타입으로 돌려줍니다.

abstract class CanTagOnlyASentence<S> : CanTag

DicEntry

Dictionary Entry 타입: 표면형을 나타내는 String 값과, 품사태그를 나타내는 POS값으로 구성.

typealias DicEntry = Pair<String, POS>

SentenceSplitter

세종 태그셋에 기반한 Heuristic 문장분리기

object SentenceSplitter