통일과나눔 아카이브 8000만

전체메뉴

학위

  • HOME
  • 논문
  • 학위

(A) comparative study of two Korean ICT research trends using text mining

(A) comparative study of two Korean ICT research trends using text mining

상세내역
저자 김지완
학위 박사
소속학교 연세대학교 대학원
전공 Department of Technology Policy
발행연도 2024년
쪽수 202
지도교수 Jeonghoon Mo
키워드 #남한   #북한   #연구동향   #텍스트마이닝   #토픽모델링   #키워드 네 트워크 분석   #ICT   #South Korea   #North Korea   #research trends   #text mining   #topic modeling   #keyword network analysis   #SVM   #김지완
원문보기
상세내역
초록
세계 각국은 ICT를 국가 발전의 중요한 요소로 삼고 있다. 남한은 2000년대부터 ICT를 국가 경제발전의 성장 동력으로 지정하고, ICT에 집중 투자를 진행하고 있다. 북한 또한 국제 사회의 대북 제재에도 불구하고 자력 번영의 신조를 내세우고, ICT를 통한 경제발전을 강력히 추진해 나가고 있다. 남북한은 국가 도약 및 경제발전을 위해 ICT 분야에 역량을 집중한다는 공통점으로 인해 다른 분야에 비해서 ICT 분야는 학술 및 기술 교류, 경제협력의 가능성이 매우 큰 분야라고 평가할 수 있다. 남북한 ICT 분야의 협력을 위해서는 남북한 ICT 연구주제와 북한 ICT 정책과제 등의 객관적이고 광범위한 이해가 요구되며, 상호 보완적인 협력전략이 필요하다.

본 연구는 노동신문 데이터를 분석하여 북한 ICT 정책과제를 확인하고, 남북한에서 발행하는 정기간행 학술지를 이용하여 ICT 학술연구 동향 및 네트워크를 비교 분석하였다. 이러한 분석을 통해 ICT 전문가가 실질적으로 활용할 수 있는 객관적인 북한 ICT 기초자료를 제공하여 핵심 협력 분야를 식별하고 공동 연구 가능성을 모색하고자 하였다.
북한 ICT 정책과제를 노동신문을 통해서 내용분석을 하였다. 노동신문에 나타난 북한 ICT 정책과제는 1. 과학기술보급체계, 2. 원격교육체계, 3. 정보보안/암호화, 4. 의료정보체계, 5. 통합생산체계 5가지로 북한 노동당이 정보화 정책과제로 적극적으로 추진했거나 추진 중인 분야이다.
ICT 연구 동향에 대한 텍스트마이닝 분석을 수행하기 위해 2015년부터 2023년까지 발행된 남한 ICT 학술지 7종과 북한 ICT 학술지 2종을 데이터로 이용하였다. 북한 논문 본문 전체 텍스트를 OCR 하여 키워드 데이터를 추출하였다. 사용자 사전을 직접 만들어 노이즈를 제거하여 모델 정확도를 향상시켰다. 비지도학습인 토픽모델링으로 남북한에서 연구 중인 ICT 토픽을 뽑아내고, 지도학습인 서포트 벡터 머신 기법으로 연구 논문을 구분하여 검증함으로써 신뢰성이 높은 결과를 추출하였다. 북한 ICT 연구 분야는 총 12개로 구분되었고, 남한 ICT 연구 분야는 총 11개로 나누어졌다. 남북한 ICT 공통 연구 분야는 “컴퓨터비전/이미지처리”, “음향신호처리”, “전파통신”, “산업기술”, “정보보안/암호화” 5개로 확인되었다. 북한 ICT 연구 특화 분야는 “자연어처리”, “교육공학/학습”, “의료정보체계”, “데이터분석/의사결정”, “정보검색/지식추출” 토픽이고, 남한 ICT 연구 특화 분야는 “융합 미디어”, “자율주행/위치기반서비스/지능형교통시스템”, “사물인터넷”로 확인되었다.
남북한 ICT 키워드 네트워크 구조에서 북한은 매개 중심성 평균이 남한보다 높았으며, 남한은 연결 중심성과 근접 중심성의 평균이 북한보다 높았다. 네트워크 밀도는 남한이 2배 이상 높음을 확인하였다. 남한의 키워드들은 북한 키워드들에 비해 평균적으로 상호작용을 더 많이 하며 정보의 접근성과 전달 효율성이 상대적으로 높아 정보 흐름이 북한에 비해 상대적으로 원활하게 이루어질 가능성이 크다는 것을 시사한다. 반면 북한은 네트워크 내 특정 키워드들이 고립되어 있거나 반대로 특정 키워드의 경우 네트워크의 통제력이 강하므로 해당 키워드의 변화나 제거는 네트워크 전체에 큰 영향을 미칠 수 있으며 정보 흐름이 제한적일 수 있음을 의미한다. 이것은 북한의 네트워크는 남한에 비해 영향력이 있는 소수 키워드가 중심적인 역할을 하며, 남한의 네트워크는 키워드의 중심성이 상대적으로 평등하게 분포되어 있어 다양한 키워드가 중요한 역할을 하고 있음을 의미한다.

본 연구는 대중에게 공개된 북한 ICT 관련 연구 자료가 매우 부족한 현실에서 텍스트 마이닝을 활용하여 남북한 ICT 연구 동향을 비교 분석한 최초의 연구이다. 전문용어 해석의 어려움과 데이터 전처리의 어려움으로 ICT 전문가가 실질적으로 활용할 수 있는 구체적인 정보를 추출하지 못한 선행 연구가 대부분이었는데, 이러한 데이터분석의 한계를 극복하고 북한 ICT 분야의 텍스트 마이닝 분석기법의 활용 가능성을 확인하고 가이드라인을 제시하였다. 또한 단순히 ICT 협력의 당위성 주장에 멈추지 않고, 남북한 ICT 연구 네트워크를 분석하여 공동 연구 기회와 학문적 네트워크를 확장할 수 있는 협력 가능성을 마련하였다.
언제든지 재개될 수 있는 북한과의 학술교류 및 기술협력 준비와 우리에게 갑자기 다가올지 모르는 통일을 대비하기 위해서는 북한 ICT 전반에 대한 객관적이고 꾸준한 이해가 요구되고 있다. 통일은 결과가 아니라 과정이기 때문이다.
목차
"Chapter 1. Introduction 1
1.1 Research Background 1
1.2 Research Objectives and Questions 3
1.3 Structure of This Study 4

Chapter 2. North Korea’s Science and Technology Policies and ICT Policy Tasks 6
2.1 North Korea’s Science and Technology Policies 6
2.1.1 Industrial Revolution of the New Century 6
2.1.2 Transforming the Entire Population into Scientific and Technical Talents 10
2.1.3 Science and Technology Plan and Economic Development Strategy 14
2.1.4 Laws Related to Informatization and Science and Technology 19
2.2 North Korea’s ICT Policy Tasks 22
2.2.1 Definition of ICT 23
2.2.2 Sci-tech Dissemination System 27
2.2.3 Distance Education System 28
2.2.4 Information Security/Encryption 31
2.2.5 Health Information System 32
2.2.6 Computer-Integrated Manufacturing System 36
2.3 Prior Research on North Korea’s ICT and Science and Technology Policies 38

Chapter 3. Text Mining 46
3.1 Topic Modeling 47
3.2 Support Vector Machine 50
3.3 Keyword Network Analysis 52
3.4 Research Subject 56
3.5 Data Collection and Preprocessing 60
3.6 Text Mining Analysis 63
3.7 Prior Research on Text Mining 67

Chapter 4. ICT Research Trends in North Korea 71
4.1 Topic Modeling and SVM of North Korea’s ICT 71
4.2 Keyword Network Analysis of North Korea’s ICT 74
4.2.1 Computer Vision/Image Processing 74
4.2.2 Industrial Technology 77
4.2.3 Wireless Communication/Networks 80
4.2.4 Information Retrieval/Knowledge Extraction 83
4.2.5 Data Analysis/Decision-making 86
4.2.6 Information Security/Encryption 89
4.2.7 Algorithm 92
4.2.8 Natural Language Processing 95
4.2.9 Educational Technology/Learning 98
4.2.10 Sound Signal Processing 101
4.2.11 Health Information System 104
4.2.12 Others 107
4.3 Research Papers Related to North Korea’s ICT Policy Tasks 110

Chapter 5. ICT Research Trends in South Korea 115
5.1 Topic Modeling and SVM of South Korea’s ICT 115
5.2 Keyword Network Analysis of South Korea’s ICT 118
5.2.1 Wireless Communication 118
5.2.2 Computer Vision/Image Processing 121
5.2.3 Sound Signal Processing 124
5.2.4 Convergence Media 127
5.2.5 Industrial Technology 130
5.2.6 Neural Network/Big Data 133
5.2.7 Internet of Things 136
5.2.8 Information Security/Encryption 139
5.2.9 Autonomous Driving/Location Based Service/Intelligent Transport Systems 142
5.2.10 Computer/Networks 145
5.2.11 Others 148
5.3 Comparison of ICT Research Topics in South and North Korea 151
5.4 Comparison of ICT Keyword Networks in South and North Korea 154

Chapter 6. Conclusions 165
6.1 Research Summary 165
6.2 Research Implications and Limitations 168
6.3 Suggestions 170

References 173

Appendix 184"