koalanlp / kr.bydelta.koala.khaiii / kotlin.String / byteAlignment

byteAlignment

fun String.byteAlignment(): List<Int> (source)

주어진 string의 UTF-8 바이트 표현에 맞춰 문자 index를 표기함. 예) '한글 english'는 (0,0,0, 1,1,1, 2, 3, 4, 5, 6, 7, 8, 9)가 됨

Return
각 바이트당 실제 string의 문자 위치를 표현한 list