세계 각국은 ICT를 국가 발전의 중요한 요소로 삼고 있다. 남한은 2000년대부터 ICT를 국가 경제발전의 성장 동력으로 지정하고, ICT에 집중 투자를 진행하고 있다. 북한 또한 국제 사회의 대북 제재에도 불구하고 자력 번영의 신조를 내세우고, ICT를 통한 경제발전을 강력히 추진해 나가고 있다. 남북한은 국가 도약 및 경제발전을 위해 ICT 분야에 역량을 집중한다는 공통점으로 인해 다른 분야에 비해서 ICT 분야는 학술 및 기술 교류, 경제협력의 가능성이 매우 큰 분야라고 평가할 수 있다. 남북한 ICT 분야의 협력을 위해서는 남북한 ICT 연구주제와 북한 ICT 정책과제 등의 객관적이고 광범위한 이해가 요구되며, 상호 보완적인 협력전략이 필요하다.
본 연구는 노동신문 데이터를 분석하여 북한 ICT 정책과제를 확인하고, 남북한에서 발행하는 정기간행 학술지를 이용하여 ICT 학술연구 동향 및 네트워크를 비교 분석하였다. 이러한 분석을 통해 ICT 전문가가 실질적으로 활용할 수 있는 객관적인 북한 ICT 기초자료를 제공하여 핵심 협력 분야를 식별하고 공동 연구 가능성을 모색하고자 하였다.
북한 ICT 정책과제를 노동신문을 통해서 내용분석을 하였다. 노동신문에 나타난 북한 ICT 정책과제는 1. 과학기술보급체계, 2. 원격교육체계, 3. 정보보안/암호화, 4. 의료정보체계, 5. 통합생산체계 5가지로 북한 노동당이 정보화 정책과제로 적극적으로 추진했거나 추진 중인 분야이다.
ICT 연구 동향에 대한 텍스트마이닝 분석을 수행하기 위해 2015년부터 2023년까지 발행된 남한 ICT 학술지 7종과 북한 ICT 학술지 2종을 데이터로 이용하였다. 북한 논문 본문 전체 텍스트를 OCR 하여 키워드 데이터를 추출하였다. 사용자 사전을 직접 만들어 노이즈를 제거하여 모델 정확도를 향상시켰다. 비지도학습인 토픽모델링으로 남북한에서 연구 중인 ICT 토픽을 뽑아내고, 지도학습인 서포트 벡터 머신 기법으로 연구 논문을 구분하여 검증함으로써 신뢰성이 높은 결과를 추출하였다. 북한 ICT 연구 분야는 총 12개로 구분되었고, 남한 ICT 연구 분야는 총 11개로 나누어졌다. 남북한 ICT 공통 연구 분야는 “컴퓨터비전/이미지처리”, “음향신호처리”, “전파통신”, “산업기술”, “정보보안/암호화” 5개로 확인되었다. 북한 ICT 연구 특화 분야는 “자연어처리”, “교육공학/학습”, “의료정보체계”, “데이터분석/의사결정”, “정보검색/지식추출” 토픽이고, 남한 ICT 연구 특화 분야는 “융합 미디어”, “자율주행/위치기반서비스/지능형교통시스템”, “사물인터넷”로 확인되었다.
남북한 ICT 키워드 네트워크 구조에서 북한은 매개 중심성 평균이 남한보다 높았으며, 남한은 연결 중심성과 근접 중심성의 평균이 북한보다 높았다. 네트워크 밀도는 남한이 2배 이상 높음을 확인하였다. 남한의 키워드들은 북한 키워드들에 비해 평균적으로 상호작용을 더 많이 하며 정보의 접근성과 전달 효율성이 상대적으로 높아 정보 흐름이 북한에 비해 상대적으로 원활하게 이루어질 가능성이 크다는 것을 시사한다. 반면 북한은 네트워크 내 특정 키워드들이 고립되어 있거나 반대로 특정 키워드의 경우 네트워크의 통제력이 강하므로 해당 키워드의 변화나 제거는 네트워크 전체에 큰 영향을 미칠 수 있으며 정보 흐름이 제한적일 수 있음을 의미한다. 이것은 북한의 네트워크는 남한에 비해 영향력이 있는 소수 키워드가 중심적인 역할을 하며, 남한의 네트워크는 키워드의 중심성이 상대적으로 평등하게 분포되어 있어 다양한 키워드가 중요한 역할을 하고 있음을 의미한다.
본 연구는 대중에게 공개된 북한 ICT 관련 연구 자료가 매우 부족한 현실에서 텍스트 마이닝을 활용하여 남북한 ICT 연구 동향을 비교 분석한 최초의 연구이다. 전문용어 해석의 어려움과 데이터 전처리의 어려움으로 ICT 전문가가 실질적으로 활용할 수 있는 구체적인 정보를 추출하지 못한 선행 연구가 대부분이었는데, 이러한 데이터분석의 한계를 극복하고 북한 ICT 분야의 텍스트 마이닝 분석기법의 활용 가능성을 확인하고 가이드라인을 제시하였다. 또한 단순히 ICT 협력의 당위성 주장에 멈추지 않고, 남북한 ICT 연구 네트워크를 분석하여 공동 연구 기회와 학문적 네트워크를 확장할 수 있는 협력 가능성을 마련하였다.
언제든지 재개될 수 있는 북한과의 학술교류 및 기술협력 준비와 우리에게 갑자기 다가올지 모르는 통일을 대비하기 위해서는 북한 ICT 전반에 대한 객관적이고 꾸준한 이해가 요구되고 있다. 통일은 결과가 아니라 과정이기 때문이다.
카카오톡
페이스북
블로그