데이터 분포의 균형화를 이용한 한국어 텍스트의 차원적 감성 분석

Other Titles
Dimensional Sentiment Analysis of Korean Text using Data Balancing
Authors
전태희김창환
Issue Date
2021-07
Publisher
한국정보과학회
Citation
정보과학회논문지, v.48, no.7, pp.790 - 801
Abstract
텍스트 혹은 발화의 감정을 연속적인 수치로 회귀하는 차원적 감성 분석 연구는 데이터의 부족으로 인해 감정을 범주로 분류하는 범주적 감성 분석 연구에 비해 많은 연구가 이루어지지 못하였다. 최근 한국정보화진흥원의 AI Hub를 통해 공개된 ‘멀티모달 영상 데이터’는 한국어의 차원적 감성 분석 연구에 활용할 수 있는 공공 데이터이다. 본 연구에서는 자연어 처리에서 전형적으로 쓰여 온 딥 러닝 모델인 중 하나인 CNN을 이용해 한국어의 차원적 감성 분석을 시도하였다. 또한 데이터의 분포를 균형적으로 조정함으로써 모델의 성능이 향상되는지 검증하였다. 실험 결과 모델들은 기존의 영어 연구와 비슷한 성능을 보여 한국어 텍스트의 차원적 감성 분석 연구에서 ‘멀티모달 영상 데이터’가 효용성을 지님을 알 수 있었다. 또한 데이터를 균형화함으로써 더 적은 학습 데이터를 이용해 학습한 모델이 더 좋은 성능을 보일 수 있음을 확인하였다.
Keywords
dimensional sentiment analysis; emotion regression; Korean text; data distribution; data balancing; 차원적 감성 분석; 감정 회귀; 한국어 텍스트; 데이터 분포; 데이터 균형화
ISSN
2383-630X
URI
https://pubs.kist.re.kr/handle/201004/116781
DOI
10.5626/JOK.2021.48.7.790
Appears in Collections:
KIST Article > 2021
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE