koalanlp / kr.bydelta.koala.proc / CanDisambiguateSense

CanDisambiguateSense

interface CanDisambiguateSense<T> : CanAnalyzeProperty<T> (source)

다의어 분별 (Word sense disambiguation)을 수행하는 Interface입니다. 매개변수 T는 각 분석기에서 문장을 분석한 결과물의 중간 형태, 즉 분석기의 입력 형태입니다.

참고

다의어 분별은 동일한 단어의 여러 의미를 구분하는 작업입니다. 예) '말1'은 다음 의미를 갖는 다의어이며, 다의어 분별 작업은 이를 구분합니다.

  1. 사람의 생각이나 느낌 따위를 표현하고 전달하는 데 쓰는 음성 기호.
  2. 음성 기호로 생각이나 느낌을 표현하고 전달하는 행위. 또는 그런 결과물.
  3. 일정한 주제나 줄거리를 가진 이야기.

동형이의어 분별은 동일한 형태지만 다른 의미를 갖는 어절을 구분하는 작업입니다. 예) '말'은 다음과 같은 여러 동형이의어의 표면형입니다.

  1. '말1': 사람의 생각이나 느낌 따위를 표현하고 전달하는 데 쓰는 음성 기호
  2. '말2': 톱질을 하거나 먹줄을 그을 때 밑에 받치는 나무
  3. '말3': 곡식, 액체, 가루 따위의 분량을 되는 데 쓰는 그릇
  4. '말4': 말과의 포유류 ...

아래를 참고해보세요.

사용법 예제

분석기 ParserCanDisambiguateSense를 상속받았다면,

Kotlin

// 문장에서 바로 분석할 때
val parser = Parser()
val sentences = parser.analyze("문장 2개입니다. 결과는 목록이 됩니다.") // 또는 parser("문장 2개입니다. 결과는 목록이 됩니다.")

// 타 분석기에서 분석한 다음 이어서 분석할 때
val taggedSentence: Sentence = ...
val sentence = parser.analyze(taggedSentence) // 또는 parser(taggedSentence)

val taggedSentList: List<Sentence> = ...
val sentences = parser.analyze(taggedSentList) // 또는 parser(taggedSentList)

Scala + koalanlp-scala

import kr.bydelta.koala.Implicits._
// 문장에서 바로 분석할 때
val parser = new Parser()
val sentences = parser.analyze("문장 2개입니다. 결과는 목록이 됩니다.") // 또는 parser("문장 2개입니다. 결과는 목록이 됩니다.")

// 타 분석기에서 분석한 다음 이어서 분석할 때
val taggedSentence: Sentence = ...
val sentence = parser.analyze(taggedSentence) // 또는 parser(taggedSentence)

val taggedSentList: java.util.List[Sentence] = ...
val sentences = parser.analyze(taggedSentList) // 또는 parser(taggedSentList)

Java

// 문장에서 바로 분석할 때
Parser parser = Parser()
List<Sentence> sentences = parser.analyze("문장 2개입니다. 결과는 목록이 됩니다.") // 또는 parser.invoke("문장 2개입니다. 결과는 목록이 됩니다.")

// 타 분석기에서 분석한 다음 이어서 분석할 때
Sentence taggedSentence = ...
Sentence sentence = parser.analyze(taggedSentence) // 또는 parser.invoke(taggedSentence)

List<Sentence> taggedSentList = ...
List<Sentence> sentences = parser.analyze(taggedSentList) // 또는 parser.invoke(taggedSentList)

Since
2.0.0