이 연구는 한국어 정보화의 초석이 되는 통합된 한국어 말뭉치 구축 방안을 모색하기 위한 것이다. 우리나라는 남북으로 분단되어 서로 다른 언어 규범을 사용하고 있을 뿐만 아니라, 중국의 조선족 동포들이 사용하고 있는 중국 조선어도 별도의 규범을 가지고 있다. 따라서 완전한 한국어 말뭉치를 구축하기 위해서는 이 세 지역의 언어규범을 포괄할 수 있는 방안이 마련되어야 한다. 그러나 이러한 외적 환경 조성은 용이한 일이 아니다. 그래서 이 연구에서는 그동안에 구축되었던 말뭉치 현황을 파악하고, 남북에서 구축된 말뭉치의 실례를 통해 문제점과 통합 가능성을 파악하여, 보다 효과적인 남북한 한국어 자료의 말뭉치 구축 방안을 제시하려 한다.
카카오톡
페이스북
블로그