통일과나눔 아카이브 8000만

전체메뉴

학술

  • HOME
  • 논문
  • 학술

워드 임베딩(Word Embedding)을 활용한 최적의 키워드 추출 및 검색 방법 연구

A Study on the Optimal Search Keyword Extraction and Retrieval Technique Generation Using Word Embedding

상세내역
저자 이정인, 안진희, 고경택, 김영석
소속 및 직함 한국건설기술연구원
발행기관 한국지반신소재학회
학술지 한국지반신소재학회 논문집
권호사항 22(2)
수록페이지 범위 및 쪽수 47-54
발행 시기 2023년
키워드 #Keyword extraction   #Retrieval technique   #Word embedding   #Cosine similarity   #BigKinds   #이정인   #안진희   #고경택   #김영석
원문보기
상세내역
초록
본 논문에서는 자료 조사를 위한 최적의 키워드 추출 및 검색 방법을 제안하였으며, 북한 건설 관련 동향 파악을 예시로제안 방법을 검증하였다. 대표적인 국내 언론 플랫폼인 빅카인즈(BigKinds)를 활용하여 표본 기사를 선정하고 키워드를 추출하였다. 추출된 키워드는 워드 임베딩(Word Embedding)을 활용하여 벡터화하였으며, 이를 토대로 코사인 유사도(Cosine Similarity)를 통해 추출된 키워드 간의 유사도를 검사하였다. 또한 상위 빈도수 10개에 대한 키워드를 기준으로 유사도 0.5 이상인 키워드들을 군집화하였다. 각 군집들은 빅카인즈 검색 양식에 맞추어 군집 내부 키워드 간에는 ‘OR’, 군집 간에는‘AND’로 형성하였다. 심층 분석 결과, 본래 목적에 맞는 유의미한 기사들이 추출되었음을 확인할 수 있었다. 기존의 분류체계및 검색 양식을 변형시키지 않은 상태에서 사용자의 세부 목적을 충족시키는 자료 조사·분류가 가능하게 되었다는 점에서의의를 갖는다.
목차