본 연구는 북한에서 출간된 외국인을 위한 조선어 교재를 대상으로 말뭉치를 구축하고자 하는 것이다. 본 연구에서는 최근 10년간에 출간된 교재 7종 18권을 대상으로 형태 주석 말뭉치를 구축하였으며 총 51,748어절로 구성되었다. 형태 주석을 활용하여 품사별 사용 빈도 등을 살펴보았는데 전체 유형 수는 5,599개, 총 빈도는 111,695회였다. 품사별 비율로 보면 유형 수는 체언과 용언이 높은 비율로 나타났으나 빈도로 보면 관계언과 의존형태가 용언보다 높은 비율을 보였다. 또한 품사별로 고빈도 형태 상위 20개를 추출한 결과, 체언에서는 한국어 교재와 다른 양상을 보였으며 관계언과 의존형태에서는 소수의 항목이 높은 점유율을 보였음을 확인하였다. 용언에서는 조선어 교재와 한국어 교재 사이에 겹치는 항목이 많았으나 일부 빈도 순위에 차이가 나타났다.
카카오톡
페이스북
블로그