[학술논문] 텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석
...키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised...
[학술논문] 자연어처리를 통한 광업기본계획 키워드 및 주제 변화 분석
...있다. 2014년 제2차, 2020년 제3차, 2024년 제4차로 발표된 광업기본계획에 대한키워드 및 주제 구조 변화를 정량적으로 분석하였다. 자연어처리 기반 단어 빈도 분석과 토픽모델링 분석으로 광업기본계획 간 공통점과 차이점을 탐색하였다. 제2차 광업기본계획은 계획·전략수립에 대한 기반 정책 측면의 결과가 나타났으며, 제3차 광업기본계획은 안전·교육·소재·북한으로 키워드 및 주제가 확대되었다. 제4차 광업기본계획은 글로벌 원자재 공급망 불안 확대를 나타내는 비축 키워드와 함께 외국인고용·스마트마이닝 주제가 부각되었다. 본 연구는 자연어처리 기반 토픽모델링을 통해 시간 변화에 따른 주제 및 키워드의 진화 양상을 체계적으로 도출한 의의가있다.
[학술논문] 텍스트 마이닝을 활용한 북한 ICT 학술연구 동향 및 정책과제 분석
...비지도학습법인 토픽모델링으로 주제를 분류하고, 지도학습법인 서포트벡터머신으로 분류를 검증하여 신뢰성을 높였다. 북한 ICT 연구주제는 총 12개로 구분되었고 가장 많이 연구된 주제부터 「컴퓨터 비전 및 이미지처리」,「산업경영 및 공정관리」, 「네트워크 및 전파통신」,「정보검색 및 지식추출」,「데이터분석 및 의사결정」,「정보보안 및 암호화」, 「알고리즘」, 「자연어 처리」, 「학습 및 교육평가」, 「음향신호처리」, 「의료정보시스템」, 「기타 정보통신」 순으로 나타났다. 해당 결과를 토대로 ICT 정책과제를 『로동신문』을 통해 확인하였다. 북한 ICT 정책과제는 「과학기술보급체계」, 「원격교육체계」, 「의료정보시스템」, 「통합생산체계」, 「정보보안 및 암호화」 5가지로 추출되었다. 본 연구는 북한 ICT 연구와 정책과제가...
[학술논문] 북한의 위협 활동 추세 파악을 위한 토픽모델링 기반 뉴스 데이터 분석
...데이터를 분석한 연구들은 비교적 단기간의 활동 분석과 정량적 접근과 LDA 같이 과거부터 많이 사용된 기법이 주로 활용되었다. 본 연구는 북한 김정은 집권 시기 핵·미사일 관련 뉴스 데이터 156,884건의 중요 키워드를 분석하고 토픽모델링을 실시하였다. 키워드 분석은 정량적 분석과 TF-IDF 기법을 활용하였다. 토픽 모델링은 LDA 모델을 활용하고 연도별 토픽의 트렌드 변화를 분석하였다. 또한 자연어처리 모델 기반 BERTopic을 통해 토픽모델링을 실시하고 LDA와 토픽 분석의 차이점을 비교했다. 이를 통해 뉴스 데이터에 담긴 주제를 파악하고 두 모델의 특성을 비교할 수 있었다. 또한 김정은 집권 이후 핵·미사일 관련 위협 활동의 추세가 지속적으로 증가하는 것을 확인하였다.
[학술논문] 국내외 안보 불안정성이 국방예산에 미치는 영향 분석 및 국방기획관리 제도와의 연계
본 연구는 자연어 처리 기법을 이용해 국내외 안보 불안정성을 수치화하고, 방위력개선 및 전력운영 예산에 미치는 영향을 분석하였다. 다변량 시계열 및 충격반응 분석을 수행한 결과, 북한 도발은 충격 발생 후 t+3 시점에 방위력개선 예산에 가장 유의미한 (+) 영향을 미쳤지만 전력운영 예산에는 유의미하지 않거나 약한 (-) 영향을 미치는 것으로 나타났다. 또한 국제안보 불안정성 심리 변화가 두 예산에 미치는 영향은 유의미하지 않게 나타났다. 국방기획관리 제도와의 연계 시, 충격반응 결과는 중기기획, 계획 및 예산단계 측면에서 정책적인 활용 가능성을 모색하는 것이 적절할 것으로 판단된다. 향후 분석 결과가 제공해 주는 정책적 함의들이 안보 정세 변화에 긴밀하게 대응하는 데 도움이 될 수 있기를 기대한다.