Morpheme

koalanlp/data. Morpheme

형태소를 저장하는 [Property] class입니다.

참고

형태소 는 의미를 가지는 요소로서는 더 이상 분석할 수 없는 가장 작은 말의 단위로 정의됩니다.

형태소 분석 은 문장을 형태소의 단위로 나누는 작업을 의미합니다.

예) '문장을 형태소로 나눠봅시다'의 경우,

  • 문장/일반명사, -을/조사,
  • 형태소/일반명사, -로/조사,
  • 나누-(다)/동사, -어-/어미, 보-(다)/동사, -ㅂ시다/어미

로 대략 나눌 수 있습니다.

아래를 참고해보세요.

  • Tagger 형태소 분석기의 최상위 Interface
  • POS 형태소의 분류를 담은 Enum class

Constructor

new Morpheme(valuenon-null)

Source:

형태소를 생성합니다.

Parameters:
Name Type Description
value Object

형태소 값 객체

Properties
Name Type Attributes Description
surface string

형태소 표면형

tag string | POS

형태소 품사 태그

originalTag string <optional>

형태소 품사 원본 표기

reference Object <optional>

Java 형태소 객체

Members

id :number

Source:

형태소의 어절 내 위치

Type:
  • number

word :Word

Source:

형태소의 상위 어절.

Type:
  • Word

wordSense :number

Source:

형태소의 의미 어깨번호.

Type:
  • number

entities :Array.<Entity>

Source:

개체명 분석을 했다면, 현재 형태소가 속한 개체명 값을 돌려줍니다.

[참고]

개체명 인식 은 문장에서 인물, 장소, 기관, 대상 등을 인식하는 기술입니다.

예) '철저한 진상 조사를 촉구하는 국제사회의 목소리가 커지고 있는 가운데, 트럼프 미국 대통령은 되레 사우디를 감싸고 나섰습니다.'에서, 다음을 인식하는 기술입니다.

  • '트럼프': 인물
  • '미국' : 국가
  • '대통령' : 직위
  • '사우디' : 국가

아래를 참고해보세요.

Type:
  • Array.<Entity>

surface :string

Source:

형태소 표면형 String

Type:
  • string

tag :POS

Source:

세종 품사표기

Type:
  • POS

originalTag :string

Source:

원본 형태소 분석기의 품사 String (없으면 undefined)

Type:
  • string

Methods

getSurface() → {string}

Source:
Returns:

형태소 표면형 String

Type
string

getTag() → {POS}

Source:
Returns:

세종 품사표기

Type
POS

getOriginalTag() → {string}

Source:
Returns:

원본 형태소 분석기의 품사 String (없으면 undefined)

Type
string

getId() → {number}

Source:
Returns:

형태소의 어절 내 위치입니다.

Type
number

getWordSense() → {number}

Source:

다의어 분석 결과인, 이 형태소의 사전 속 의미/어깨번호 값을 돌려줍니다.

다의어 분석을 한 적이 없다면 undefined를 돌려줍니다.

Returns:

의미/어깨번호 값

Type
number

getEntities() → {Array.<Entity>}

Source:

개체명 분석을 했다면, 현재 형태소가 속한 개체명 값을 돌려줍니다.

[참고]

개체명 인식 은 문장에서 인물, 장소, 기관, 대상 등을 인식하는 기술입니다.

예) '철저한 진상 조사를 촉구하는 국제사회의 목소리가 커지고 있는 가운데, 트럼프 미국 대통령은 되레 사우디를 감싸고 나섰습니다.'에서, 다음을 인식하는 기술입니다.

  • '트럼프': 인물
  • '미국' : 국가
  • '대통령' : 직위
  • '사우디' : 국가

아래를 참고해보세요.

Returns:

[Entity]의 목록입니다. 분석 결과가 없으면 빈 리스트

Type
Array.<Entity>

getWord() → {Word}

Source:
Returns:

이 형태소를 포함하는 단어를 돌려줍니다.

Type
Word

isNoun() → {boolean}

Source:

체언(명사, 수사, 대명사) 형태소인지 확인합니다.

Returns:

체언이라면 true

Type
boolean

isPredicate() → {boolean}

Source:

용언(동사, 형용사) 형태소인지 확인합니다.

Returns:

용언이라면 true

Type
boolean

isModifier() → {boolean}

Source:

수식언(관형사, 부사) 형태소인지 확인합니다.

Returns:

수식언이라면 true

Type
boolean

isJosa() → {boolean}

Source:

관계언(조사) 형태소인지 확인합니다.

Returns:

관계언이라면 true

Type
boolean

hasTag(partialTagnon-null) → {boolean}

Source:

세종 품사 [tag]가 주어진 품사 표기 [partialTag] 묶음에 포함되는지 확인합니다.

예) "N"은 체언인지 확인하고, "NP"는 대명사인지 확인

단축명령

[참고]

  • 분석불능범주(NA, NV, NF)는 체언(N) 범주에 포함되지 않습니다.
  • 세종 품사표기는 POS 를 참고하세요.
  • 품사 표기는 비교표 에서 확인가능합니다.
Parameters:
Name Type Description
partialTag string

포함 여부를 확인할 상위 형태소 분류 품사표기

Returns:

포함되는 경우 True.

Type
boolean

hasTagOneOf(…tags) → {boolean}

Source:

세종 품사 [tag]가 주어진 품사 표기들 [tags] 묶음들 중 하나에 포함되는지 확인합니다.

예) hasTagOneOf("N", "MM")의 경우, 체언 또는 관형사인지 확인합니다.

단축명령

[참고]

  • 분석불능범주(NA, NV, NF)는 체언(N) 범주에 포함되지 않습니다.
  • 세종 품사표기는 POS 를 참고하세요.
  • 품사 표기는 비교표 에서 확인가능합니다.
Parameters:
Name Type Attributes Description
tags string <repeatable>

포함 여부를 확인할 상위 형태소 분류 품사표기들 (가변인자)

Returns:

하나라도 포함되는 경우 True.

Type
boolean

hasOriginalTag(partialTagnon-null) → {boolean}

Source:

원본 품사 [originalTag]가 주어진 품사 표기 [partialTag] 묶음에 포함되는지 확인합니다.

예) 지정된 원본 품사가 없으면 (즉, None이면) false를 반환합니다.

단축명령

[참고]

  • 분석불능범주(NA, NV, NF)는 체언(N) 범주에 포함되지 않습니다.
  • 세종 품사표기는 POS 를 참고하세요.
  • 품사 표기는 비교표 에서 확인가능합니다.
Parameters:
Name Type Description
partialTag string

포함 여부를 확인할 상위 형태소 분류 품사표기

Returns:

포함되는 경우 True.

Type
boolean

equals()

Source:

toString()

Source: