[학술논문] 디지털 인문학을 통한 1990년대 한반도 담론 연구* - 일본의 종합지 『세카이(世界)』를 중심으로 -
본 연구는 일본의 종합지 세카이(世界)에 게재된 1990~1999년 한반도 관련 기사를 대상으로, 디지털 인문학 방법론을 통한 정량・정성 분석을 수행하였다. 분석 방법으로는 BERTopic과 KMeans를 활용한 토픽 모델링과 SudachiPy 기반 키워드 분석을 적용했으며, 이를 통해 토픽별・연도별 주제 변화를 추적하고 대표 기사를 추출해 토픽별 내용을 심층 검토하였다. 정량분석 결과, 1990년대 세카이의 한반도 담론은 탈냉전기 동아시아의 국제정세와 맞물려 역사 중심에서 경제・외교・국제질서로 담론이 이동하는 경향을 보였다. 키워드 분석에서는 ‘경제’가 가장 높은 빈도를 차지했으며, ‘세계・사회・남북・정치’ 등이 뒤를 이었다. 또한 민주정권이 출범하며...
[학술논문] 북한의 위협 활동 추세 파악을 위한 토픽모델링 기반 뉴스 데이터 분석
...뉴스 데이터를 분석한 연구들은 비교적 단기간의 활동 분석과 정량적 접근과 LDA 같이 과거부터 많이 사용된 기법이 주로 활용되었다. 본 연구는 북한 김정은 집권 시기 핵·미사일 관련 뉴스 데이터 156,884건의 중요 키워드를 분석하고 토픽모델링을 실시하였다. 키워드 분석은 정량적 분석과 TF-IDF 기법을 활용하였다. 토픽 모델링은 LDA 모델을 활용하고 연도별 토픽의 트렌드 변화를 분석하였다. 또한 자연어처리 모델 기반 BERTopic을 통해 토픽모델링을 실시하고 LDA와 토픽 분석의 차이점을 비교했다. 이를 통해 뉴스 데이터에 담긴 주제를 파악하고 두 모델의 특성을 비교할 수 있었다. 또한 김정은 집권 이후 핵·미사일 관련 위협 활동의 추세가 지속적으로 증가하는 것을 확인하였다.