Tagger

koalanlp/proc. Tagger

형태소 분석기

참고

형태소 는 의미를 가지는 요소로서는 더 이상 분석할 수 없는 가장 작은 말의 단위로 정의됩니다.

형태소 분석 은 문장을 형태소의 단위로 나누는 작업을 의미합니다.

예) '문장을 형태소로 나눠봅시다'의 경우,

  • 문장/일반명사, -을/조사,
  • 형태소/일반명사, -로/조사,
  • 나누-(다)/동사, -어-/어미, 보-(다)/동사, -ㅂ시다/어미

로 대략 나눌 수 있습니다.

아래를 참고해보세요.

  • Morpheme 형태소를 저장하는 형태.
  • POS 형태소의 분류를 담은 Enum class

Constructor

new Tagger(apinon-null, optionsopt)

Source:

품사분석기를 초기화합니다.

Example
import { Tagger } from 'koalanlp/proc';
import { KMR } from 'koalanlp/API';

let tagger = new Tagger(KMR);
tagger("문장을 분석해봅니다. 이렇게요.");
Parameters:
Name Type Attributes Default Description
api API

사용할 품사분석기의 유형.

options Object <optional>
{}
Properties
Name Type Attributes Default Description
apiKey string <optional>
''

ETRI 분석기의 경우, ETRI에서 발급받은 API Key (2.2.0에서 삭제 예정)

etriKey string <optional>
''

ETRI 분석기의 경우, ETRI에서 발급받은 API Key

useLightTagger boolean <optional>
false

코모란(KMR) 분석기의 경우, 경량 분석기를 사용할 것인지의 여부. (2.2.0에서 삭제 예정)

kmrLight boolean <optional>
false

코모란(KMR) 분석기의 경우, 경량 분석기를 사용할 것인지의 여부.

khaResource string <optional>
''

Khaiii 분석기의 경우, 리소스 파일이 위치한 폴더.

khaPreanal string <optional>
true

Khaiii 분석기의 경우, 기분석 사전을 사용할지의 여부.

khaErrorpatch string <optional>
true

Khaiii 분석기의 경우, 오분석 사전 사용 여부

khaRestore string <optional>
true

Khaiii 분석기의 경우, 형태소 재구성 여부

isAsyncDefault boolean <optional>
true

객체를 함수처럼 사용할 때, 즉 processor("문장")과 같이 사용할 때, 기본 호출을 async로 할 지 선택합니다. 기본값은 Asynchronous 호출입니다.

Methods

(async) tag(…text) → {Array.<Sentence>}

Source:

문단(들)을 품사분석합니다. (Asynchronous)

Parameters:
Name Type Attributes Description
text string | Array.<string> <repeatable>

분석할 문단들. 텍스트와 string 리스트 혼용 가능. (가변인자)

Returns:

분석된 결과 (Flattened list)

Type
Array.<Sentence>

tagSync(…text) → {Array.<Sentence>}

Source:

문단(들)을 품사분석합니다. (Synchronous)

Parameters:
Name Type Attributes Description
text string | Array.<string> <repeatable>

분석할 문단들. 텍스트와 string 리스트 혼용 가능. (가변인자)

Returns:

분석된 결과 (Flattened list)

Type
Array.<Sentence>

(async) tagSentence(…textnon-null) → {Array.<Sentence>}

Source:

문장을 품사분석합니다. 각 인자 하나를 하나의 문장으로 간주합니다. (Asynchronous)

Parameters:
Name Type Attributes Description
text string <repeatable>

분석할 문장(들). (가변인자)

Returns:

분석된 결과.

Type
Array.<Sentence>

tagSentenceSync(…textnon-null) → {Array.<Sentence>}

Source:

문장을 품사분석합니다. 각 인자 하나를 하나의 문장으로 간주합니다. (Synchronous)

Parameters:
Name Type Attributes Description
text string <repeatable>

분석할 문장(들). (가변인자)

Returns:

분석된 결과.

Type
Array.<Sentence>