研究課題/領域番号 |
21H04901
|
研究機関 | 早稲田大学 |
研究代表者 |
河原 大輔 早稲田大学, 理工学術院, 教授 (10450694)
|
研究分担者 |
鈴木 潤 東北大学, データ駆動科学・AI教育研究センター, 教授 (80396150)
笹野 遼平 名古屋大学, 情報学研究科, 准教授 (70603918)
|
研究期間 (年度) |
2021-04-05 – 2025-03-31
|
キーワード | 言語理解 / 転移学習 / 言語知識 / 説明性 / 深層学習 |
研究実績の概要 |
2021年度は「人知のデザイン、構築」(研究項目1)と「計算知のデザイン、構築」(研究項目2)の研究を進めた。
「人知のデザイン、構築」(研究項目1)においては、まず、計算知と人知を融合することを念頭に、計算知、すなわち言語モデルの基盤技術となっているTransformerの性能や機能向上に関して調査、検討した。計算知と人知を融合し有益な結果を得るための課題が多くあることを確認した。続いて、汎用言語理解基盤に必要な人知としての辞書の有用性を検証した。具体的には、大規模な自然言語推論(NLI)データが整備されていない言語についても、辞書を利用することで高性能な文ベクトルが構築できることを示すため、辞書の定義文を用いた文埋め込み手法を開発した。さらに、標準的なベンチマークを用いた評価実験を通し、既存のNLIデータに基づく文埋め込み手法と同等の性能を実現すること示した。
「計算知のデザイン、構築」(研究項目2)においては、基本となる計算知の設計、構築を行った。Transformerに基づく事前学習モデルの一つであるRoBERTaの性能が高いことから、日本語のRoBERTaモデルを構築した。事前学習のための日本語コーパスは、検討の結果、日本語Wikipediaおよび多言語ウェブコーパスであるCC-100の日本語部分を用いた。baseサイズの構築を完了し、公開した。largeサイズは構築中であり、2022年度に公開予定である。また、計算知を評価するための注釈付きデータセットについては、単語の意味の同一性判定タスクであるWiC (Word in Context)が日本語フレームネットを利用して構築可能であることを確認し、その構築を試行した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画のとおり、2つの研究項目について成果を出すことができているため、おおむね順調に進展していると評価した。計算知の構築の一部は、計算資源の都合により、2022年度初頭に行うことにしたが、研究計画への影響は小さいと考える。
|
今後の研究の推進方策 |
2021年度に引き続き「人知のデザイン、構築」(研究項目1)と「計算知のデザイン、構築」(研究項目2)の研究を進める。また、「人に近い文章理解の実現に向けた計算知・人知融合モデルの構築」(研究項目3)と「計算知・人知融合モデルの処理過程の説明方式の確立」(研究項目4)の研究を開始する。 「人知のデザイン、構築」(研究項目1)においては、これまでに調査、検討した人知の形式を研究項目3および4の開始に併せて提供する。また、プロトタイプが完成している日本語計算知モデルと融合するための汎用的な人知の形式を検討する。 「計算知のデザイン、構築」(研究項目2)においては、日本語計算知モデルの分析を行う。その分析結果に基づき日本語計算知モデルの改良を検討する。さらに、研究項目3および4の検討結果を基に、人知との融合を見据えた改良を行う。 「人に近い文章理解の実現に向けた計算知・人知融合モデルの構築」(研究項目3)は、計算知と人知の融合を目指し、国語辞典や文章構造など、異なる手掛りを教師信号として得られた言語理解モデルの性質を明らかにし、それらの特長を併せ持つモデルの構築を目指す。 「計算知・人知融合モデルの処理過程の説明方式の確立」(研究項目4)は、計算知により計算される結果を人間が理解可能な形式で提示する方法論の確立を目指す。
|