자소처리 라이브러리
Library/NLP Library 2014. 6. 2. 21:28 |형태소 분석기를 만드는 도중 자소를 분리, 결합, 유니코드 변환기능이 필요하여 만들어 둔 라이브러리이다.
메소드 |
기능 |
int analysisInitial(char) |
들어온 char문자을 초성, 중성, 종성, 기타로 분류 초성 1, 중성 2, 종성 3, 그외 -1 |
char changeInitial(char) |
유니코드 'ㄱ'과 초성과 종성의 'ㄱ'은 유니코드값이 다르다. 그래서 자소분리된 유니코드가 들어올 경우 완성형 유니코드의 값으로 변경 시켜준다. ex) 초성'ㄱ'을 input으로 사용시 유니코드 'ㄱ'가 output으로 나온다. |
String fusionInitial(String) |
String에 저장된 자소 유니코드들을 결합하여 완성형 한글코드로 변경 시켜준다. 그냥 완성형 유니코드로 자소를 쓸 경우는 작동 하지 않는다. ex) (자소분리된)ㄱ ㅏㅁㄱㅣ -> 감기 |
String getInitialToString(String) |
완성형 유니코드를 자소분리된 유니코드로 분리할 때 사용된다. 반환형은 String타입 ex) 감기 -> ㄱㅏㅁㄱㅣ |
char[] getInitialToChar(String) |
getInitialToString과 기능은 같으나 char형 배열로 반환된다. |
라이브러리 불러오기는 http://hanggoo.tistory.com/14 참고