[학위논문] (A) comparative study of two Korean ICT research trends using text mining
...원격교육체계, 3. 정보보안/암호화, 4. 의료정보체계, 5. 통합생산체계 5가지로 북한 노동당이 정보화 정책과제로 적극적으로 추진했거나 추진 중인 분야이다. ICT 연구 동향에 대한 텍스트마이닝 분석을 수행하기 위해 2015년부터 2023년까지 발행된 남한 ICT 학술지 7종과 북한 ICT 학술지 2종을
데이터로 이용하였다. 북한 논문 본문 전체 텍스트를 OCR 하여 키워드
데이터를 추출하였다. 사용자 사전을 직접 만들어 노이즈를 제거하여 모델 정확도를 향상시켰다. 비지도학습인 토픽모델링으로 남북한에서 연구 중인 ICT 토픽을 뽑아내고, 지도학습인 서포트 벡터 머신 기법으로 연구 논문을 구분하여 검증함으로써 신뢰성이 높은 결과를 추출하였다. 북한 ICT 연구 분야는 총 12개로 구분되었고, 남한...