Sentence

koalanlp/data. Sentence

문장을 저장하는 Class 입니다.

Constructor

new Sentence(value)

Source:

문장을 만듭니다.

Parameters:
Name Type Description
value Object | Array.<Word>

자바 문장 객체 또는 어절의 Array.

Extends

  • ImmutableArray.<Word>

Members

syntaxTree :SyntaxTree

Source:

구문분석을 했다면, 최상위 구구조(Phrase)를 돌려줍니다.

[참고]

구문구조 분석 은 문장의 구성요소들(어절, 구, 절)이 이루는 문법적 구조를 분석하는 방법입니다.

예) '나는 밥을 먹었고, 영희는 짐을 쌌다'라는 문장에는 2개의 절이 있습니다

  • 나는 밥을 먹었고
  • 영희는 짐을 쌌다

각 절은 3개의 구를 포함합니다

  • 나는, 밥을, 영희는, 짐을: 체언구
  • 먹었고, 쌌다: 용언구

아래를 참고해보세요.

  • Parser 구문구조 분석을 수행하는 interface.
  • Word#phrase 어절의 직속 상위 [SyntaxTree]를 가져오는 API
  • SyntaxTree 구문구조를 저장하는 형태
  • PhraseTag 구구조의 형태 분류를 갖는 Enum 값
Type:
  • SyntaxTree

dependencies :Array.<DepEdge>

Source:

의존구문분석을 했다면, 문장에 포함된 모든 의존구조의 목록을 돌려줍니다.

[참고]

의존구조 분석 은 문장의 구성 어절들이 의존 또는 기능하는 관계를 분석하는 방법입니다.

예) '나는 밥을 먹었고, 영희는 짐을 쌌다'라는 문장에는

가장 마지막 단어인 '쌌다'가 핵심 어구가 되며,

  • '먹었고'가 '쌌다'와 대등하게 연결되고
  • '나는'은 '먹었고'의 주어로 기능하며
  • '밥을'은 '먹었고'의 목적어로 기능합니다.
  • '영희는'은 '쌌다'의 주어로 기능하고,
  • '짐을'은 '쌌다'의 목적어로 기능합니다.

아래를 참고해보세요.

  • Parser 의존구조 분석을 수행하는 interface.
  • Word#governorEdge 어절이 지배당하는 상위 의존구조 [DepEdge]를 가져오는 API
  • Word#dependentEdges 어절이 직접 지배하는 하위 의존구조 [DepEdge]의 목록를 가져오는 API
  • PhraseTag 의존구조의 형태 분류를 갖는 Enum 값 (구구조 분류와 같음)
  • DependencyTag 의존구조의 기능 분류를 갖는 Enum 값
  • DepEdge 의존구문구조의 저장형태
Type:
  • Array.<DepEdge>

roles :Array.<RoleEdge>

Source:

의미역 분석을 했다면, 문장에 포함된 의미역 구조의 목록을 돌려줌.

[참고]

의미역 결정 은 문장의 구성 어절들의 역할/기능을 분석하는 방법입니다.

예) '나는 밥을 어제 집에서 먹었다'라는 문장에는

동사 '먹었다'를 중심으로

  • '나는'은 동작의 주체를,
  • '밥을'은 동작의 대상을,
  • '어제'는 동작의 시점을
  • '집에서'는 동작의 장소를 나타냅니다.

아래를 참고해보세요.

Type:
  • Array.<RoleEdge>

entities :Array.<Entity>

Source:

개체명 분석을 했다면, 문장의 모든 개체명 목록을 돌려줍니다.

[참고]

개체명 인식 은 문장에서 인물, 장소, 기관, 대상 등을 인식하는 기술입니다.

예) '철저한 진상 조사를 촉구하는 국제사회의 목소리가 커지고 있는 가운데, 트럼프 미국 대통령은 되레 사우디를 감싸고 나섰습니다.'에서, 다음을 인식하는 기술입니다.

  • '트럼프': 인물
  • '미국' : 국가
  • '대통령' : 직위
  • '사우디' : 국가

아래를 참고해보세요.

Type:
  • Array.<Entity>

corefGroups :Array.<CoreferenceGroup>

Source:

문장 내에 포함된 공통 지시어 또는 대용어들의 묶음을 제공합니다.

[참고]

공지시어 해소 는 문장 내 또는 문장 간에 같은 대상을 지칭하는 어구를 찾아 묶는 분석과정입니다.

예) '삼성그룹의 계열사인 삼성물산은 같은 그룹의 계열사인 삼성생명과 함께'라는 문장에서

  • '삼성그룹'과 '같은 그룹'을 찾아 묶는 것을 말합니다.

영형대용어 분석 은 문장에서 생략된 기능어를 찾아 문장 내 또는 문장 간에 언급되어 있는 어구와 묶는 분석과정입니다.

예) '나는 밥을 먹었고, 영희도 먹었다'라는 문장에서,

  • '먹었다'의 목적어인 '밥을'이 생략되어 있음을 찾는 것을 말합니다.

아래를 참고해보세요.

  • CorefResolver 공지시어 해소, 대용어 분석기 interface
  • Entity#corefGroup 해당 개체명이 포함된 개체명 묶음 [CoreferenceGroup]을 반환하는 API
  • CoreferenceGroup 동일한 대상을 지칭하는 개체명을 묶는 API
Type:
  • Array.<CoreferenceGroup>

nouns :Array.<Word>

Source:

체언(명사, 수사, 대명사) 및 체언 성격의 어휘를 포함하는 어절들을 가져옵니다.

  • 포함: 체언, 명사형 전성어미 [POS.ETN], 명사 파생 접미사 [POS.XSN]
  • 제외: 관형형 전성어미 [POS.ETM], 동사/형용사/부사 파생 접미사 [POS.XSV], [POS.XSA], [POS.XSM]
  • 가장 마지막에 적용되는 어미/접미사를 기준으로 판정함

[참고]

전성어미 는 용언 따위에 붙어 다른 품사의 기능을 수행하도록 변경하는 어미입니다. 예) '멋지게 살다'를 '멋지게 삶'으로 바꾸는 명사형 전성어미 '-ㅁ'이 있습니다. 원 기능은 동사이므로 부사의 수식을 받고 있습니다.

파생접미사 는 용언의 어근이나 단어 따위에 붙어서 명사로 파생되도록 하는 접미사입니다. 예) 역시 '살다'를 '삶'으로 바꾸는 명사파생 접미사 '-ㅁ'이 있습니다. 이 경우 명사이므로 '멋진 삶'과 같이 형용사의 수식을 받습니다.

Type:
  • Array.<Word>

verbs :Array.<Word>

Source:

용언(동사, 형용사) 및 용언 성격의 어휘를 포함하는 어절들을 가져옵니다.

  • 포함: 용언, 동사 파생 접미사 [POS.XSV]
  • 제외: 명사형/관형형 전성어미 [POS.ETN], [POS.ETM], 명사/형용사/부사 파생 접미사 [POS.XSN], [POS.XSA], [POS.XSM]
  • 가장 마지막에 적용되는 어미/접미사를 기준으로 판정함

[참고]

전성어미 는 용언 따위에 붙어 다른 품사의 기능을 수행하도록 변경하는 어미입니다. 예) '멋지게 살다'를 '멋지게 삶'으로 바꾸는 명사형 전성어미 '-ㅁ'이 있습니다. 원 기능은 동사이므로 부사의 수식을 받고 있습니다.

파생접미사 는 용언의 어근이나 단어 따위에 붙어서 명사로 파생되도록 하는 접미사입니다. 예) 역시 '살다'를 '삶'으로 바꾸는 명사파생 접미사 '-ㅁ'이 있습니다. 이 경우 명사이므로 '멋진 삶'과 같이 형용사의 수식을 받습니다.

Type:
  • Array.<Word>

modifiers :Array.<Word>

Source:

수식언(관형사, 부사) 및 수식언 성격의 어휘를 포함하는 어절들을 가져옵니다.

  • 포함: 수식언, 관형형 전성어미 [POS.ETM], 형용사/부사 파생 접미사 [POS.XSA], [POS.XSM]
  • 제외: 명사형 전성어미 [POS.ETN], 명사/동사 파생 접미사 [POS.XSN], [POS.XSV]
  • 가장 마지막에 적용되는 어미/접미사를 기준으로 판정함

[참고]

전성어미 는 용언 따위에 붙어 다른 품사의 기능을 수행하도록 변경하는 어미입니다. 예) '멋지게 살다'를 '멋지게 삶'으로 바꾸는 명사형 전성어미 '-ㅁ'이 있습니다. 원 기능은 동사이므로 부사의 수식을 받고 있습니다.

파생접미사 는 용언의 어근이나 단어 따위에 붙어서 명사로 파생되도록 하는 접미사입니다. 예) 역시 '살다'를 '삶'으로 바꾸는 명사파생 접미사 '-ㅁ'이 있습니다. 이 경우 명사이므로 '멋진 삶'과 같이 형용사의 수식을 받습니다.

Type:
  • Array.<Word>

Methods

getSyntaxTree() → {SyntaxTree}

Source:

구문분석을 했다면, 최상위 구구조(Phrase)를 돌려줍니다.

[참고]

구문구조 분석 은 문장의 구성요소들(어절, 구, 절)이 이루는 문법적 구조를 분석하는 방법입니다.

예) '나는 밥을 먹었고, 영희는 짐을 쌌다'라는 문장에는 2개의 절이 있습니다

  • 나는 밥을 먹었고
  • 영희는 짐을 쌌다

각 절은 3개의 구를 포함합니다

  • 나는, 밥을, 영희는, 짐을: 체언구
  • 먹었고, 쌌다: 용언구

아래를 참고해보세요.

  • Parser 구문구조 분석을 수행하는 interface.
  • Word#phrase 어절의 직속 상위 [SyntaxTree]를 가져오는 API
  • SyntaxTree 구문구조를 저장하는 형태
  • PhraseTag 구구조의 형태 분류를 갖는 Enum 값
Returns:

최상위 구구조 [SyntaxTree]. 분석 결과가 없으면 undefined.

Type
SyntaxTree

getDependencies() → {Array.<DepEdge>}

Source:

의존구문분석을 했다면, 문장에 포함된 모든 의존구조의 목록을 돌려줍니다.

[참고]

의존구조 분석 은 문장의 구성 어절들이 의존 또는 기능하는 관계를 분석하는 방법입니다.

예) '나는 밥을 먹었고, 영희는 짐을 쌌다'라는 문장에는

가장 마지막 단어인 '쌌다'가 핵심 어구가 되며,

  • '먹었고'가 '쌌다'와 대등하게 연결되고
  • '나는'은 '먹었고'의 주어로 기능하며
  • '밥을'은 '먹었고'의 목적어로 기능합니다.
  • '영희는'은 '쌌다'의 주어로 기능하고,
  • '짐을'은 '쌌다'의 목적어로 기능합니다.

아래를 참고해보세요.

  • Parser 의존구조 분석을 수행하는 interface.
  • Word#governorEdge 어절이 지배당하는 상위 의존구조 [DepEdge]를 가져오는 API
  • Word#dependentEdges 어절이 직접 지배하는 하위 의존구조 [DepEdge]의 목록를 가져오는 API
  • PhraseTag 의존구조의 형태 분류를 갖는 Enum 값 (구구조 분류와 같음)
  • DependencyTag 의존구조의 기능 분류를 갖는 Enum 값
  • DepEdge 의존구문구조의 저장형태
Returns:

문장 내 모든 의존구문구조 [DepEdge]의 목록. 분석 결과가 없으면 빈 리스트.

Type
Array.<DepEdge>

getRoles() → {Array.<RoleEdge>}

Source:

의미역 분석을 했다면, 문장에 포함된 의미역 구조의 목록을 돌려줌.

[참고]

의미역 결정 은 문장의 구성 어절들의 역할/기능을 분석하는 방법입니다.

예) '나는 밥을 어제 집에서 먹었다'라는 문장에는

동사 '먹었다'를 중심으로

  • '나는'은 동작의 주체를,
  • '밥을'은 동작의 대상을,
  • '어제'는 동작의 시점을
  • '집에서'는 동작의 장소를 나타냅니다.

아래를 참고해보세요.

Returns:

문장 속의 모든 의미역 구조 [RoleEdge]의 목록. 분석 결과가 없으면 빈 리스트.

Type
Array.<RoleEdge>

getEntities() → {Array.<Entity>}

Source:

개체명 분석을 했다면, 문장의 모든 개체명 목록을 돌려줍니다.

[참고]

개체명 인식 은 문장에서 인물, 장소, 기관, 대상 등을 인식하는 기술입니다.

예) '철저한 진상 조사를 촉구하는 국제사회의 목소리가 커지고 있는 가운데, 트럼프 미국 대통령은 되레 사우디를 감싸고 나섰습니다.'에서, 다음을 인식하는 기술입니다.

  • '트럼프': 인물
  • '미국' : 국가
  • '대통령' : 직위
  • '사우디' : 국가

아래를 참고해보세요.

Returns:

문장에 포함된 모든 [Entity]의 목록입니다.

Type
Array.<Entity>

getCorefGroups() → {Array.<CoreferenceGroup>}

Source:

문장 내에 포함된 공통 지시어 또는 대용어들의 묶음을 제공합니다.

[참고]

공지시어 해소 는 문장 내 또는 문장 간에 같은 대상을 지칭하는 어구를 찾아 묶는 분석과정입니다.

예) '삼성그룹의 계열사인 삼성물산은 같은 그룹의 계열사인 삼성생명과 함께'라는 문장에서

  • '삼성그룹'과 '같은 그룹'을 찾아 묶는 것을 말합니다.

영형대용어 분석 은 문장에서 생략된 기능어를 찾아 문장 내 또는 문장 간에 언급되어 있는 어구와 묶는 분석과정입니다.

예) '나는 밥을 먹었고, 영희도 먹었다'라는 문장에서,

  • '먹었다'의 목적어인 '밥을'이 생략되어 있음을 찾는 것을 말합니다.

아래를 참고해보세요.

  • CorefResolver 공지시어 해소, 대용어 분석기 interface
  • Entity#corefGroup 해당 개체명이 포함된 개체명 묶음 [CoreferenceGroup]을 반환하는 API
  • CoreferenceGroup 동일한 대상을 지칭하는 개체명을 묶는 API
Returns:

공통된 대상을 묶은 [CoreferenceGroup]의 목록. 없다면 빈 리스트.

Type
Array.<CoreferenceGroup>

getNouns() → {Array.<Word>}

Source:

체언(명사, 수사, 대명사) 및 체언 성격의 어휘를 포함하는 어절들을 가져옵니다.

  • 포함: 체언, 명사형 전성어미 [POS.ETN], 명사 파생 접미사 [POS.XSN]
  • 제외: 관형형 전성어미 [POS.ETM], 동사/형용사/부사 파생 접미사 [POS.XSV], [POS.XSA], [POS.XSM]
  • 가장 마지막에 적용되는 어미/접미사를 기준으로 판정함

[참고]

전성어미 는 용언 따위에 붙어 다른 품사의 기능을 수행하도록 변경하는 어미입니다. 예) '멋지게 살다'를 '멋지게 삶'으로 바꾸는 명사형 전성어미 '-ㅁ'이 있습니다. 원 기능은 동사이므로 부사의 수식을 받고 있습니다.

파생접미사 는 용언의 어근이나 단어 따위에 붙어서 명사로 파생되도록 하는 접미사입니다. 예) 역시 '살다'를 '삶'으로 바꾸는 명사파생 접미사 '-ㅁ'이 있습니다. 이 경우 명사이므로 '멋진 삶'과 같이 형용사의 수식을 받습니다.

Returns:

체언 또는 체언 성격의 어휘를 포함하는 어절의 목록

Type
Array.<Word>

getVerbs() → {Array.<Word>}

Source:

용언(동사, 형용사) 및 용언 성격의 어휘를 포함하는 어절들을 가져옵니다.

  • 포함: 용언, 동사 파생 접미사 [POS.XSV]
  • 제외: 명사형/관형형 전성어미 [POS.ETN], [POS.ETM], 명사/형용사/부사 파생 접미사 [POS.XSN], [POS.XSA], [POS.XSM]
  • 가장 마지막에 적용되는 어미/접미사를 기준으로 판정함

[참고]

전성어미 는 용언 따위에 붙어 다른 품사의 기능을 수행하도록 변경하는 어미입니다. 예) '멋지게 살다'를 '멋지게 삶'으로 바꾸는 명사형 전성어미 '-ㅁ'이 있습니다. 원 기능은 동사이므로 부사의 수식을 받고 있습니다.

파생접미사 는 용언의 어근이나 단어 따위에 붙어서 명사로 파생되도록 하는 접미사입니다. 예) 역시 '살다'를 '삶'으로 바꾸는 명사파생 접미사 '-ㅁ'이 있습니다. 이 경우 명사이므로 '멋진 삶'과 같이 형용사의 수식을 받습니다.

Returns:

용언 또는 용언 성격의 어휘를 포함하는 어절의 목록

Type
Array.<Word>

getModifiers() → {Array.<Word>}

Source:

수식언(관형사, 부사) 및 수식언 성격의 어휘를 포함하는 어절들을 가져옵니다.

  • 포함: 수식언, 관형형 전성어미 [POS.ETM], 형용사/부사 파생 접미사 [POS.XSA], [POS.XSM]
  • 제외: 명사형 전성어미 [POS.ETN], 명사/동사 파생 접미사 [POS.XSN], [POS.XSV]
  • 가장 마지막에 적용되는 어미/접미사를 기준으로 판정함

[참고]

전성어미 는 용언 따위에 붙어 다른 품사의 기능을 수행하도록 변경하는 어미입니다. 예) '멋지게 살다'를 '멋지게 삶'으로 바꾸는 명사형 전성어미 '-ㅁ'이 있습니다. 원 기능은 동사이므로 부사의 수식을 받고 있습니다.

파생접미사 는 용언의 어근이나 단어 따위에 붙어서 명사로 파생되도록 하는 접미사입니다. 예) 역시 '살다'를 '삶'으로 바꾸는 명사파생 접미사 '-ㅁ'이 있습니다. 이 경우 명사이므로 '멋진 삶'과 같이 형용사의 수식을 받습니다.

Returns:

수식언 또는 수식언 성격의 어휘를 포함하는 어절의 목록

Type
Array.<Word>

surfaceString(delimiteropt, non-null) → {string}

Source:

어절의 표면형을 이어붙이되, 지정된 [delimiter]로 띄어쓰기 된 문장을 반환합니다.

Parameters:
Name Type Attributes Default Description
delimiter string <optional>
' '

어절 사이의 띄어쓰기 방식. 기본값 = 공백(" ")

Returns:

띄어쓰기 된 문장입니다.

Type
string

singleLineString() → {string}

Source:

품사분석 결과를, 1행짜리 String으로 변환합니다.

Returns:

품사분석 결과를 담은 1행짜리 String.

Type
string

toString()

Source: