『경제연구』 텍스트 마이닝 분석을 통한 북한 경제정책 변화 연구

A Study on the Change of Economic Policy in North Korea through text-mining analysis of Economic Reseach

저자 이가영
학위 박사
소속학교 고려대학교 대학원
전공 북한학과 통일정책전공
발행연도 2020년
쪽수 208
지도교수 남성욱
키워드 #이가영   # 북한경제   # 경제정책   # 경제연구   # 텍스트 마이닝   # 토픽모델링
북한은 1990년대 이후 심각한 경제난에 직면했고, 2000년대 이후 북한경제에는 상대적인 회복과 구조 변화가 일어났다. 2000년대 이후는 김정일 말기에서 김정은으로 권력이 이양된 시기이다. 김정은 시기 북한은 그 이전 시기와 다른 행태를 보이고 있고, 경제에 있어서도 사경제가 확산되는 배경 하에 인민경제 중시, 우리식 경제관리방법 등 시장화를 용인하는 정책을 펴고 있다. 본 연구에서는 어떤 사회적 전환점에 의해 북한 통치자의 정책경로가 결정되는지를 역사적 신제도주의 이론을 통해 분석하고 2000년대 이후 북한의 경제정책 변화를 살펴보고자 하였다.
북한은 노동당 일당 독재와 수령 독재체제를 유지하기 위하여 선전선동을 중요하게 활용하고 있다. 북한의 문헌자료는 조선노동당과 대중을 연결시키는 수단으로 대중을 선동하는 역할을 하므로, 본 연구에서 북한 경제정책을 분석하기 위해 출판물을 연구대상으로 하였다. 계획경제체제의 통제된 환경 아래 북한의 경제정책 변화를 알아보기 위해서는 정해진 형식으로 일정한 주기를 두고 규칙적으로 발행하는 정기간행물이 적합하여, 경제 관련 대표적인 정기간행물인 『경제연구』를 연구대상으로 하였고 통치자 명의의 문건, 북한 공식 언론매체 및 『김일성종합대학학보』를 보완적으로 활용하였다. 연구방법으로 문헌연구와 함께 텍스트 마이닝(text mining) 분석기법인 빈도 분석, 상관관계 분석, 클러스터 분석 및 토픽 모델링을 실시하였다. 텍스트를 구조화된 데이터로 변환한 빅데이터를 인공지능 기법을 활용하여 분석할 경우 소규모의 데이터를 가지고도 유의미한 결과를 도출할 수 있어 기초자료가 부족한 북한 관련 연구에 적합하다.
경제 개혁적 성향의 ‘7․1 경제관리개선조치’가 행해진 2002년부터 2019년을 시간적 범위로 정하여 텍스트 마이닝 분석을 실시하였다. 클러스터 분석과 토픽 모델링을 통해 경제논문 주제 유사도에 따라 분류한 결과, 전체 기간은 2002년-2011년, 2012년-2019년의 두 시기로 구분되었다. 어느 통치자 하의 논문인지를 입력하지 않았음에도 분석 결과 김정일 시기와 김정은 시기로 정확하게 구분되어 통치자별 다른 성향을 내포하고 있는 것으로 나타났다. 선전선동 일반론 및 커뮤니케이션 이론이 적용되어, 북한 통치자의 정책 관심사가 『경제연구』 논문 토픽에 투영되어 경제 환경 변화와 정책노선 흐름을 반영하는 것으로 나타났다.
전체 시기 텍스트 마이닝 결과로 구분된 김정일 시기(2002년-2011년)와 김정은 시기(2012년-2019년)에 대한 세부적인 분석을 실시하였다. 사회주의 계획경제의 핵심적인 특징은 철저한 계획(planning)과 국가의 직접적인 관료적 통제(direct bureaucratic control)인데 이것을 북한에서 ‘경제관리’라고 한다. 첫 번째로 ‘경제관리’ 관련 논문 전체를 대상으로 텍스트 마이닝의 키워드 분석을 실시하였고, 두 번째로 세부적으로 각 시기에 대한 텍스트 마이닝 분석, 세 번째로 시기별 경제정책 관련 문헌연구를 실시하였다.
‘경제관리’ 키워드 분석 결과 김정일 시기에는 ‘계획’, ‘국가’의 빈도가 높고 김정은 시기에는 ‘발전’, ‘생산’, ‘과학’, ‘기술’의 빈도가 높게 나타났다. 김정일 시기에 ‘국가가 원칙에 따라 계획하고 개선’하는 경제관리가 김정은 시기에 ‘과학기술을 기반으로 발전하고 실현’하는 경제관리로 변화하고 있음을 키워드 분석을 통해 알 수 있다.
각 시기별 세부적인 텍스트 마이닝으로 빈도분석, 상관관계 분석, 클러스터 분석, 토픽 모델링을 실시하였다. 빈도분석과 상관관계 분석 결과 『경제연구』에 게재된 모든 논문에 양의 상관관계가 존재하며, 논문 특성에 맞는 소수 키워드가 문서에 따라 선택적으로 반복 사용되고 있었다. 이를 통해 북한의 경제정책은 선대 제도의 지속성과 경로의존성을 나타내며 이미 확립된 정책경로를 따르는 것으로 판단하였다. 클러스터 분석과 토픽 모델링 결과, 무역의존도가 절대적인 중국과의 대외교역규모 감소, 고강도 대북제재 및 가뭄 등 자연재해로 마이너스 성장을 한 이후에 기존정책의 변화를 모색하여 다른 클러스터로 분류되었다. 경제위기나 자연재해 등 충격적인 사회적․역사적 전환점에 의해 정책의 변화를 겪고 법 제․개정과 같이 제도가 재형성되어 가는 과정을 역사적 신제도주의 이론으로 설명할 수 있다.
이상의 분석을 통해 도출한 결론은 첫째, 북한은 경제정책을 펴기 전 정기간행물을 활용해 사전 연구를 하며 논문을 게재하고 있다. 화폐에 관한 논문이 2004년부터 꾸준히 게재되었고 2009년 11월 화폐개혁을 앞두고는 화폐 관련 논문과 자본주의 시장을 비판하는 내용이 자주 언급되었다. 경제연구 게재 논문을 통해 현 통치자의 관심사를 파악할 수 있고 향후 시행될 제도와 정책방향을 예측할 수 있다. 둘째, 『경제연구』는 선전선동의 도구로 활용된다. 이전까지 있어왔던 정책 방향성이더라도 김정은 시기에는 이것을 ‘우리식 경제관리방법’, ‘사회주의 기업책임관리제’, ‘경제개발구’, ‘새 세기 산업혁명’ 등 김정은 브랜드의 새로운 용어로 만든다. 용어를 주창한 이후 출판물을 통해 동시적, 사후적으로 계속해서 선전하는 방식을 취하고 있다. 셋째, 경제 논문을 통해 해외의 제도와 이론을 설명하며 채권, 통화, 파생금융상품 등 다양한 주제를 다루고 있다. 새로운 개념을 소개하는 것에 거부감이 크지 않은 것으로 보이며 논문 작성자인 북한의 학자 및 지식인들은 일반 인민들에 비해 비교적 자유롭게 외국의 정보를 접하고 있음을 추정할 수 있다. 또한 이처럼 다양하고 폭넓은 주제를 다루고 있는 것은 북한에서 개혁개방을 위한 이론적인 연구가 실험적으로 진행되고 있음을 시사한다.
본 연구에서 나아가 향후 무역, 금융, 화폐, 재정, 과학, 통계, 회계, 시장화, 개혁개방 등 세부주제를 선정하여 텍스트 마이닝 분석을 실시할 경우 세부 분야에 대한 북한의 정책 의도와 정책 방향성을 도출할 수 있을 것으로 기대한다.
North Korea has faced serious economic difficulties since the
1990s, and relative recovery and structural changes have occurred in the
North Korean economy since the 2000s. After the 2000s, power was
transferred from the end of Kim Jong Il to Kim Jong Un. During the
Kim Jong Un period, North Korea has a different behavior from the
previous period. In the context of the spread of the private economy,
North Korea is implementing policies that allow marketization. This
study analyzes which social turning point determines the policy path of
the North Korean ruler and examined changes in North Korea's
economic policy since the 2000s.
The subject of research is Economic Research, a representative
periodical related to the economy. Documents of the ruler's name,
North Korea's official media, and Kim Il-sung's University Journal were
used complementarily. As a research method, frequency analysis,
correlation analysis, cluster analysis, and topic modeling, which are text
mining analysis methods, were conducted along with literature research.
When analyzing big data that converts text into structured data using
artificial intelligence, it is suitable for research on North Korea that
lacks basic data because it can produce meaningful results even with
small data.
Text mining analysis was conducted from 2002 to 2019. As a
result of classifying according to the similarity of economic thesis
through cluster analysis and topic modeling, the total period was
divided into two periods: 2002-2011 and 2012-2019. Even though no
ruler was entered, the analysis revealed that it was accurately divided
into the Kim Jong Il period and the Kim Jong Un period, which
implied different propensities for each ruler. As the theory of
propaganda and communication was applied, the policy interests of the
North Korean rulers reflecting changes in the economic environment are
projected on the topic of the Economic Research paper.
A detailed analysis of the Kim Jong Il period (2002-2011) and the
Kim Jong Un period (2012-2019), divided by the results of the full-time
text mining, was conducted. First, a keyword analysis of text mining
was conducted for all the papers related to 'Economic Management',
second, text mining analysis for each period in detail, and third,
literature research on economic policy by period was conducted.
As a result of keyword analysis of 'economic management', the
frequency of 'plan' and 'country' was high during the Kim Jong Il
period, and the frequency of 'development', 'production', 'science' and
'technology' was high during the Kim Jong Un period. Through keyword
analysis, it can be seen that the concept of economic management is
changing from 'economic management to plan and improve according to
national principles' to 'economic management to develop and realize
based on science and technology'.
Frequency analysis, correlation analysis, cluster analysis, and topic
modeling were performed for each period. As a result of frequency
analysis and correlation analysis, a positive correlation exists in all the
papers published in Economic Research, and a few key words matching
the characteristics of the paper were selectively used repeatedly
according to the document. Through this, it can be seen that North
Korea's economic policy represents the continuity and route dependence
of its predecessor system and follows the established policy path. As a
result of cluster analysis and topic modeling, it was classified into
different clusters by exploring changes in existing policies after social
impact. The process of policy change and institutional reform due to
shocking social and historical turning points, such as the economic crisis
and natural disasters, can be explained by the theory of historical new
Through the above analysis, the following conclusions were drawn:
First, North Korea publishes papers by conducting preliminary research
using periodicals before developing economic policies. Papers on money
have been published steadily since 2004, and papers related to money
and criticisms of capitalism were frequently mentioned before the
November 2009 currency reform. Through the paper published in the
Economic Research, you can grasp the interests of the current ruler and
predict the system and policy direction to be implemented in the future.
Second, Economic Research is used as a propaganda tool. Even
with the policy direction that has existed before, Kim Jong Un makes
this a new term for the Kim Jong Un brand. After advocating the term,
he continues to propagate through the publication simultaneously.
Third, it discusses foreign institutions and theories through economic
papers and deals with various topics such as bonds, currencies, and
derivatives. There seems to be little refusal to introduce a new concept,
and it can be assumed that scholars and intellectuals in North Korea,
the authors of the thesis, are relatively free to access foreign
information compared to ordinary people. In addition, this diverse and
wide range of topics suggests that theoretical research for the economic
reform in North Korea is being conducted experimentally
제 1 장 서 론 1
제 1 절 연구배경 및 목적 1
1. 연구 배경 1
2. 연구 목적 4
제 2 절 연구방법 및 범위 6
1. 연구 방법 6
(1) 데이터 마이닝(data mining) 8
(2) 텍스트 마이닝(text mining) 11
2. 연구 범위 12
3. 연구 구성 15
제 2 장 이론적 고찰 및 선행연구의 검토 17
제 1 절 선전선동 일반론 및 커뮤니케이션 이론 17
1. 선전선동 일반론 17
2. 사회주의와 이데올로기 언론 18
3. 커뮤니케이션 이론 22
제 2 절 정책학 이론적 접근 27
1. 신제도주의 27
2. 역사적 신제도주의 29
제 3 절 선행연구의 검토 33
1. 북한 경제 관련 선행연구의 검토 33
2. 텍스트 분석 관련 선행연구의 검토 39
3. 소 결 42
제 4 절 연구 수행체계 및 분석 프로그램 43
1. 연구 수행체계 43
2. 분석 프로그램 44
제 3 장 텍스트마이닝을 통한 경제정책 분석 46
제 1 절 분석 대상 및 방법 46
1. 분석 대상 47
2. 분석 방법 49
제 2 절 빈도 분석 51
1. 사전처리 및 행렬 생성 54
2. 빈도표 계산 및 워드 클라우드 57
제 3 절 상관관계 분석 62
1. 상관계수 행렬 62
2. 동시발생 행렬(co-occurrence matrix) 65
제 4 절 클러스터 분석(cluster analysis) 68
1. 유사도 행렬 70
2. 위계적 군집분석 72
제 5 절 토픽 모델링(topic modeling) 75
1. 잠재적 디리클레 할당(LDA) 분석 80
2. 연도별 토픽 LDA 상관관계 83
제 6 절 소 결 86
제 4 장 김정일 시기(2002-2011)의 경제정책 87
제 1 절 경제관리 키워드 분석 87
제 2 절 김정일 시기 텍스트 마이닝 93
1. 빈도표 계산 및 워드 클라우드 93
2. 상관계수 행렬 및 동시발생 행렬 97
3. 클러스터 분석(cluster analysis) 100
4. 토픽 모델링(topic modeling) 102
제 3 절 경제정책 관련 문헌연구 105
1. 2002년 경제관리개선조치와 2003년 종합시장 개설 107
2. 시장화 억제정책 109
제 4 절 소 결 111
제 5 장 김정은 시기(2012-2019)의 경제정책 112
제 1 절 경제관리 키워드 분석 112
제 2 절 김정은 시기 텍스트 마이닝 116
1. 빈도표 계산 및 워드 클라우드 116
2. 상관계수 행렬 및 동시발생 행렬 120
3. 클러스터 분석(cluster analysis) 123
4. 토픽 모델링(topic modeling) 125
제 3 절 경제정책 관련 문헌연구 130
1. 형식 및 구성 130
(1) 경제연구 130
(2) 김일성종합대학학보 138
2. 내용 분석 144
(1) 우리식 경제관리방법 145
가. 농업 부문: 분조관리제 149
나. 공업 부문: 기업책임관리제 150
(2) 특수경제지대정책 159
제 4 절 소 결 164
제 6 장 분석의 함의 및 시사점 171
제 7 장 결 론 179
참고문헌 181
Abstract 190