koalanlp / kr.bydelta.koala.proc / SentenceSplitter

SentenceSplitter

object SentenceSplitter (source)

세종 태그셋에 기반한 Heuristic 문장분리기

다음 조건에 따라 문장을 분리합니다:

  1. 열린 괄호나 인용부호가 없고,
  2. 숫자나 외국어로 둘러싸이지 않은 문장부호(POS.SF)가 어절의 마지막에 왔을 경우.

사용법 예제

SentenceSplitter는 이미 singleton object이므로 초기화가 필요하지 않습니다.

Kotlin

val sentence = ... //Tagged result
val split = SentenceSplitter.sentences(sentence)
// 또는
val split = SentenceSplitter(sentence)

Scala + koalanlp-scala

import kr.bydelta.koala.Implicits._
val sentence = ... //Tagged result
val split = SentenceSplitter.sentences(sentence)
// 또는
val split = SentenceSplitter(sentence)

Java

Sentence sentence = ... //Tagged result
List<Sentence> split = SentenceSplitter.sentences(sentence);
// 또는
List<Sentence> split = SentenceSplitter.invoke(sentence);

Since
1.x

Functions

invoke

분석결과를 토대로 문장을 분리함.

operator fun invoke(para: Iterable<Word>): List<Sentence>

sentences

분석결과를 토대로 문장을 분리함.

fun sentences(para: Iterable<Word>): List<Sentence>