研究課題/領域番号 |
18K11452
|
研究機関 | 大阪工業大学 |
研究代表者 |
平 博順 大阪工業大学, 情報科学部, 准教授 (20396146)
|
研究分担者 |
小林 一郎 お茶の水女子大学, 基幹研究院, 教授 (60281440)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 規則適合判定技術 / アテンションモデル / ニューラルネットワーク |
研究実績の概要 |
本研究では、ニューラルネットワークを用いた機械翻訳技術において使用されているアテンションモデルを参考にし、従来のテキスト含意認識技術において中心的に使われている、文中の単語の重複率を基本としたテキスト含意認識を用いた技術では不可能であった規則適合判定技術の実現を目指している。令和元年度に、平成30年度までに作成していた市販の想定問題集の電子データについて、含まれている問題の種類、および問題種類 毎の解法について分析・検討を行った結果やテキスト上で書かれていない前提知識などについての分析結果について、人工知能学会において研究発表を行った。新しい双方向トランスフォーマーモデルであるBERTを使った免許試験データに適用する手法の検討・実装を進めた。これまでに作成していた小規模な評価データを使用して評価実験を行い、従来の文中の単語の重複率を基本としたテキスト含意認識を用いた場合より、わずかながら高い精度が得られることを確認した。しかしながら、使用したデータはBERTを使用するには小規模であるため、本来の性能の一部しか出ていないと考えられる。この結果については言語処理学会において研究発表を行った。また、自動車免許試験の問題集について真の正解に関して詳しい解説が一問ずつ付与されている新たな問題集をしようして、解説を「テキスト」、問題を「仮説」とするテキスト含意認識を行った場合の手法評価も行った。さらにBERTが本来の性能を発揮できるよう、作業委託で大規模な免許データの作成を行い、学習に使用するデータの拡充をはかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
大規模な学習を行うために令和元年度中に高性能なGPGPUサーバとして使用する高性能デスクトップPCを購入した。さらに大規模計算が必要なアテンションモデルの最新手法を利用した実験にも取り組み、当初予定の計画の一部が進捗した。また、検証用データについての電子化作業の一部を外部委託する件についても実施し、学習・評価のための大規模な追加データが得ることができた。
|
今後の研究の推進方策 |
令和二年度は、引き続き、学習用・評価用データの収集を継続する。必要に応じてデータ形式の修正を行う。また、研究代表者と研究分担者が協力して早期に規則適合判定を行うシステムの改良、実装し、大規模な評価データを用いて評価を行う。
|
次年度使用額が生じた理由 |
次年度使用額が生じた主な理由は、H31年度中に提案手法のために使用する学習および評価用データの作成について、H31年度末に外部機関に委託して作成を完了したが、当該費用の請求が令和2年年4月となったため令和2年度に繰り越して使用した。
|