研究課題/領域番号 |
21K12026
|
研究機関 | 山梨大学 |
研究代表者 |
福本 文代 山梨大学, 大学院総合研究部, 教授 (60262648)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | 分野依存語義 / マルチラベルショートテキスト |
研究実績の概要 |
本研究は,複数の分野が付与された短い単語列からなるテキスト,すなわちマルチラベルショートテキストを対象とし,これらを階層構造へ分類するために有効な語彙的意味処理技術と機械学習法を開発することを目的とする.ショートテキストを対象としたこれまでの分類手法では、テキストに含まれる情報量が限定されているため、高精度な分類を実現することは困難であった。本研究では、このショートテキストの情報量をを補完するため,(1) 語義は分野に依存して決まるという仮説に基づき,分野依存語義,すなわち単語の意味表現を利用する手法を提案した,(2) テキストに付与されている複数の分野同士は意味的に類似していることに注目し,分野同士の関係をマルチラベル分類,すなわち複数の分野が付与されているテキスト分類に利用する方法を検討した,(3) テキスト中の特定の単語と分野とは関連性があることに着目し,この関連性を利用し特に分類が困難な階層構造の下位に位置する粒度の細かい分野への高精度な分類手法を提案した.(1) の分野依存語義について,当初,Transformer Personalized Propagation of Neural Predictions (PPNP) [Kliepera'19]を拡張し,語義を同定する手法を検討した.しかし,GCNにおける層の数を増やすことにより精度低下の軽減が望めなかったため,手法を再考し,あらたにWordNetの知識を語義解消の制約としてAttention Networkに取り入れる手法 Constrained Attention Network と呼ばれる手法を提案した.(2) ,及び(3) について,テキスト中の特定の単語と分野を示す単語間に関連性があることに着目し,Attentionメカニズムを用い,テキスト中の単語と分野の相関関係を学習するネットワークモデルを提案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(1) 分野依存語義について,WordNetシソーラスの知識を語義解消の制約として取り入れる手法であるConstrained Attention Network と呼ばれる手法を提案し論文として公開することができた.(2) 分野同士の関係,及び (3) テキスト中の特定の単語と分野との関連性抽出について,Attentionメカニズムを用い,テキスト中の単語と分野の相関関係を学習するネットワークモデルを提案し定量的な実験を実施することができたため,おおむね順調に進展していると考える.
|
今後の研究の推進方策 |
(1) 分野依存語義抽出手法については,すでに論文として成果を公開できている.一方で(2)分野同士の関係,及び (3) テキスト中の特定の単語と分野との関連性抽出については,研究成果を投稿したものの採択されなかったため,今後は,定量的な実験とその解析を実施した後に再投稿することを検討している.
|
次年度使用額が生じた理由 |
本研究は,複数の分野が付与された短い単語列からなるテキスト,すなわちマルチラベルショートテキストを対象とし,これらを階層構造へ分類するために有効な語彙的意味処理技術と機械学習法を開発することを目的とし,(1) 分野依存語義解消, (2) マルチラベル分類,及び(3) テキスト中の特定の単語と分野間との関連性を用いたショートテキスト分類の3つの課題を遂行した.これまでの成果として上記(1)と(2) については論文として成果を公開することができた.一方で(3)に関しては論文が不採択であったため,次年度に再投稿し成果の公開を目指す.繰り越した予算は,会議参加費用,及び発表のための旅費としての使用を検討している.
|