研究課題/領域番号 |
19K20351
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 奈良先端科学技術大学院大学 (2021-2022) 国立研究開発法人理化学研究所 (2019-2020) |
研究代表者 |
大内 啓樹 奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (70825463)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 事例ベース学習 / 表現学習 / 構造予測 / 文法獲得 / トランズダクティブ学習 / Transductive Learning / Transfer Learning / Domain Adaptation / Syntactic Parsing / Semantic Parsing / Language Models / 言語解析 / ニューラルネットワーク |
研究開始時の研究の概要 |
自然言語処理における「トランズダクティブ学習」は,もっとも実用的重要性の高い技術の一つであるにも関わらず,未だ実用化に至っていない.本応募課題では,深層学習を用いたトランズダクティブ言語解析の実用化をめざす.トランズダクティブ学習の枠組みでは,解析対象の目標テキストが学習時に所与であり,目標テキストに特化した高精度な解析モデルの構築が目的となる.そのようなモデル構築手法を確立するため,本応募課題では,(1) 目標テキストに特化した分散表現学習手法の開発,および,(2) 目標テキスト内の全事例を考慮した特徴量空間デザイン,という2 つの側面から研究を進める.
|
研究成果の概要 |
本研究では2つの研究目的を掲げた。 一つ目が「分散表現を目標テキストに特化させる手法の開発とその効果の検証」である。これは2019年度に順調に遂行することができた。 2020年度以降は、二つ目の研究目的である「同一ラベルを持つ事例が特徴ベクトル空間上で近くに位置するように学習する手法の開発とその効果の検証」に取り組んだ。各事例を特徴ベクトル空間に写像する深層ニューラルネットワークに距離学習を適用することによって、同一ラベルを持つ事例同士が特徴ベクトル空間上で近づくような学習を実現した。その結果として、学習事例との類似度に基づいてテスト事例を分類することが可能となった。
|
研究成果の学術的意義や社会的意義 |
一つ目の研究目的遂行によって、目標テキストが所与の場合はそのテキストに単語分散表現(言語モデル)を特化させることが効果的であることを示された。実応用の文脈で言い換えると、解析したい(目標)テキスト集合を手元に保有している一般企業やユーザーは、本提案手法のように目標テキストにモデルを特化させることによってより効果的に解析可能であることが示唆された。 二つ目の研究目的遂行によって、従来の深層ニューラルネットが抱える解釈性の問題への緩和策を提示した。例えば、「この学習事例と類似しているため、このテスト事例はこのように分類します」といったように、根拠を提示しながら予測を行えるようになった。
|