2021 Fiscal Year Research-status Report
Multi-label short text classification based on domain specific-senses and its relation
Project/Area Number |
21K12026
|
Research Institution | University of Yamanashi |
Principal Investigator |
福本 文代 山梨大学, 大学院総合研究部, 教授 (60262648)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 分野依存語義 / 文書分類 / 階層構造 / 語義の曖昧性解消 |
Outline of Annual Research Achievements |
本研究は、複数の分野が付与された短い単語列からなるテキスト、すなわちマルチラベルショートテキストを対象とし、これらを階層構造へ分類するために有効な語彙的意味処理技術と機械学習法を開発することを目的とする。具体的には、ショートテキストの情報量を補完するため、(1) 語義は分野に依存して決まるという仮説に基づき、分野依存語義を利用する手法を提案する。(2) テキストに付与されている複数の分野同士は意味的に類似していることに注目し、分野同士の関係をグラフベースのattention networkを用いることにより分類する手法を提案するマルチラベル分類に利用する。本研究は既存のラベル付き訓練データを最大限活用し新規のテスト事例を分類するため、教師付き学習の本質的な問題である正解ラベル付与に伴う労力の大幅な削減に貢献できる。同時に、情報検索における前処理や膨大な知識の管理基盤、及び各種分類問題のコア技術として産業界における様々な分野での利用が期待できる。今年度の研究実績として、語義解消に関する手法を2件、また2文の意味の同値性に関する手法を1件、投稿・発表した。さらに、グラフベースのAttention networkを用いることにより分野同士の関係を制約として表現した結果、文書分類タスクにおいて良好な結果が得られることが確認できている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度の計画は、語義解消と実験、及び成果の公開であり、複数の語義候補を同時に比較することが可能な手法を提案し、ベンチマークデータセットを用いた実験において、良好な結果が得られることが確認できている。
|
Strategy for Future Research Activity |
令和4年度は、令和3年度に提案した語義解消手法を分野依存語義へ応用すること、および分野間の意味表現学習、ショートテキスト中の語彙、分野名、及びそれらの関連性に関する意味表現学習を提案することである。
|
Causes of Carryover |
予定していた国際会議での成果発表と国内学会での成果発表がいずれもオンライン開催となったことから、当該予定助成金との差額が生じた。次年度は、現時点で投稿中の論文が2件あることから、これに充当する。さらにGPUが不足していることから計算機環境に充て、研究を遂行する。
|
Research Products
(4 results)