研究課題/領域番号 |
21K12026
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 山梨大学 |
研究代表者 |
福本 文代 山梨大学, 大学院総合研究部, 教授 (60262648)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 分野依存語義 / マルチラベルショートテキスト / 分野語義 / 階層構造 / 文書分類 / 語義の曖昧性解消 |
研究開始時の研究の概要 |
本研究は、複数の分野が付与された短い単語列からなるテキスト、すなわちマルチラベルショートテキストを対象とし、これらを階層構造へ分類するために有効な語彙的意味処理技術と機械学習法を開発することを目的とする。
|
研究実績の概要 |
本研究は,複数の分野が付与された短い単語列からなるテキスト,すなわちマルチラベルショートテキストを対象とし,これらを階層構造へ分類するために有効な語彙的意味処理技術と機械学習法を開発することを目的とする.ショートテキストを対象としたこれまでの分類手法では、テキストに含まれる情報量が限定されているため、高精度な分類を実現することは困難であった。本研究では、このショートテキストの情報量をを補完するため,(1) 語義は分野に依存して決まるという仮説に基づき,分野依存語義,すなわち単語の意味表現を利用する手法を提案した,(2) テキストに付与されている複数の分野同士は意味的に類似していることに注目し,分野同士の関係をマルチラベル分類,すなわち複数の分野が付与されているテキスト分類に利用する方法を検討した,(3) テキスト中の特定の単語と分野とは関連性があることに着目し,この関連性を利用し特に分類が困難な階層構造の下位に位置する粒度の細かい分野への高精度な分類手法を提案した.(1) の分野依存語義について,当初,Transformer Personalized Propagation of Neural Predictions (PPNP) [Kliepera'19]を拡張し,語義を同定する手法を検討した.しかし,GCNにおける層の数を増やすことにより精度低下の軽減が望めなかったため,手法を再考し,あらたにWordNetの知識を語義解消の制約としてAttention Networkに取り入れる手法 Constrained Attention Network と呼ばれる手法を提案した.(2) ,及び(3) について,テキスト中の特定の単語と分野を示す単語間に関連性があることに着目し,Attentionメカニズムを用い,テキスト中の単語と分野の相関関係を学習するネットワークモデルを提案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(1) 分野依存語義について,WordNetシソーラスの知識を語義解消の制約として取り入れる手法であるConstrained Attention Network と呼ばれる手法を提案し論文として公開することができた.(2) 分野同士の関係,及び (3) テキスト中の特定の単語と分野との関連性抽出について,Attentionメカニズムを用い,テキスト中の単語と分野の相関関係を学習するネットワークモデルを提案し定量的な実験を実施することができたため,おおむね順調に進展していると考える.
|
今後の研究の推進方策 |
(1) 分野依存語義抽出手法については,すでに論文として成果を公開できている.一方で(2)分野同士の関係,及び (3) テキスト中の特定の単語と分野との関連性抽出については,研究成果を投稿したものの採択されなかったため,今後は,定量的な実験とその解析を実施した後に再投稿することを検討している.
|