[학술논문] 한미 정권교체에 따른 주한 미대사관 외교문서의 주제와 감정표현 변화: 위키리크스 공개 외교전문의 컴퓨터 언어처리 분석
...① 한국 내 정세, ② 북한관련, ③ 주한미군, ④ 남북경협, ⑤ 해외파병, ⑥ 동북아문제, ⑦ 한미통상의 주제들을, 그리고긍정적, 부정적 감정과 두 감정이 공존하는 양가감정(兩價感情)을 각각 잠재적디리쉴레분포 배치모형, 주성분 분석, 그리고 LIWC 분석을 통하여 추출하였다. 분석결과, 첫째, 주제와 감정을 추출하는 컴퓨터 텍스트 분석은 일정수준의 타당성을 확보할 수 있었고, 둘째, 문서내의 주제와 감정의 변화는 주로 본국의 정권변화에 민감하게 반응하며, 주재국의 변화에는 그 변화가 상대적으로 적다는 사실을 확인할 수 있었다. 이 논문에서는 위키리크스 외교전문과 같은 대용량의 텍스트를 분석할 때 컴퓨터 언어처리 방식의 방법론적 타당성과 주재국-대사관-본국간의 외교 커뮤니케이션의 이론적 함의도 논의하였다.
[학위논문] (A) comparative study of two Korean ICT research trends using text mining
... 2023년까지 발행된 남한 ICT 학술지 7종과 북한 ICT 학술지 2종을 데이터로 이용하였다. 북한 논문 본문 전체 텍스트를 OCR 하여 키워드 데이터를 추출하였다. 사용자 사전을 직접 만들어 노이즈를 제거하여 모델 정확도를 향상시켰다. 비지도학습인 토픽모델링으로 남북한에서 연구 중인 ICT 토픽을 뽑아내고, 지도학습인 서포트 벡터 머신 기법으로 연구 논문을 구분하여 검증함으로써 신뢰성이 높은 결과를 추출하였다. 북한 ICT 연구 분야는 총 12개로 구분되었고, 남한 ICT 연구 분야는 총 11개로 나누어졌다. 남북한 ICT 공통 연구 분야는 “컴퓨터비전/이미지처리”, “음향신호처리”, “전파통신”, “산업기술”,...
[학술논문] 북한의 ICT 발전전략의 미래경향성에 관한 연구: 텍스트마이닝 기법을 중심으로
... 높게 나타났다. 실제 북한은 2011년 제정한 콤퓨터망관리법에 보안 관련된 규정을 갖추고 있다. 외부로부터 컴퓨터 보안을 강화하는데 주력하고 있다. 김정은 위원장은 북한 경제에서 ICT, 나노 및 생물 바이오 등 첨단산업의 비중을 높일 것을 지시했다. 텍스트 마이닝의 분석결과 김 위원장의 지시가 학술지에서 적극적으로 반영하였고 경제정책의 핵심 화두가 되었다.
[학술논문] 대북제재에 관한 뉴욕타임즈 뉴스보도: 코퍼스에 기반한 텍스트 분석
...2020년부터 2021년까지 뉴욕타임즈가 대북제재에 대해 보도한 기사를 컴퓨터 지원 텍스트 분석 도구인 워드스미스(WordSmith) 툴(Tool)을 활용해 분석했다. 데이터에서 가장 핵심적인 의제를 알아보기 위해 키워드(KeyWord)기능을 사용해 분석해 본 결과 뉴욕타임즈의 대북제재 관련 뉴스보도에서는 북핵 문제 이외에도 러시아, 중국, 이란이 상위 키워드로 추출되었다. 또한, 핵심 키워드로 추출된 의제를 중심으로 용례색인(Concord) 기능을 분석한 결과, 트럼프 행정부 기간 동안 미 언론이 대북제재에 관한 이슈와 함께 러시아에 대한 경제제재에 초점을 맞추어 뉴스를 집중 보도하고 있음을 발견할 수 있었다. 본 연구는 또한, 텍스트 분석 결과를 바탕으로 대북제재가 중국 경제에 미치는 영향을 살펴보고, 미국의...
[학술논문] 북한 신년사(1946-2015)에 대한 자동화된 텍스트 분석
...북한 신년사를 자동화된 텍스트 분석(automated text analysis)을 이용하여 분석하는 것을 목적으로 한다. 분석초점은 정량화 가능한 텍스트의 특성(위치, 빈도, 문맥적 구조, 상관성, 군집구조, 그리고 토픽구성 등)을 분석하여 북한정부의 주요 정책기조와 대외 행위자에 대한 태도를 추정하는 것이다. 이를 위해 통계학과 기계학습 (machine learning) 분야에서 개발되어 사회과학 전분야로 확산되고 있는 컴퓨터를 이용한 자동화된 텍스트 분석 기법을 사용하여 1946년부터 2015년까지 발표된 북한 신년사를 전수분석하였다. 신년사에 대한 자동화된 텍스트 분석은 북한 신년사 텍스트가 가진 특성을 고려하여 신년사의 거시적 구조와 문서간 상관성을 중심으로 분석하는 거시적 분석과 특정 단어의 위치와...