研究課題/領域番号 |
21H03495
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京工業大学 |
研究代表者 |
奥村 学 東京工業大学, 科学技術創成研究院, 教授 (60214079)
|
研究分担者 |
上垣外 英剛 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2021年度: 7,540千円 (直接経費: 5,800千円、間接経費: 1,740千円)
|
キーワード | 自然言語処理 / 複数テキスト要約 / ニューラルモデル / 生成型要約 / 文書横断文間関係 |
研究開始時の研究の概要 |
本研究課題では,ニューラル要約モデルを2段階の連結モデルとして構成し, 1) 文書横断共参照解析や文書横断構造解析の解析結果を考慮した上で,要約文集合をその順序とともに生成するニューラルモデル,2) 冗長性の度合いや文の順序の首尾一貫性の度合いを元に,順序付き要約文集合をリランキングし,最適な順序付き要約文集合を出力するニューラルモデルを研究開発する.1)の研究開発は,文書横断共参照解析および文書横断構造解析技術の研究開発と,それらの解析結果をencodeして要約文集合を生成するニューラルモデルの研究開発に細分化できるので,結果的に本研究課題は3つのコア技術に分解し研究開発を行なうことになる.
|
研究実績の概要 |
テキスト内の文間の関係を解析する文書構造解析器は,我々のグループが世界最高性能を達成していたが,引き続き研究開発を継続し,新しい手法を提案することで,現在も世界最高性能を維持している. デコーダのみからなる大規模言語モデル (LLM) の発展は目覚ましく,様々な自然言語処理タスクにおいて良好な結果を残している.一方,文書構造解析におけるそれらの有効性はこれまで議論されていない.そこで,今後の文書構造解析の研究において LLM を活用すべきかどうかを探ることを目的として,プロンプトを介してシフト還元動作を LLM で模倣する手法を提案し,その有効性を議論した.評価実験の結果,提案法は世界最高の解析性能を達成し,テキストドメインの汎化性においても優れていた.つまり,修辞構造解析においても LLM に注力すべきことが強調される結果を得た. テキスト要約の方では,事前学習済み言語モデル (PLM) を追学習することで実用的な生成型要約モデルを獲得できることが明らかになっているが,目標の要約長など要約タスクに固有の情報を PLM の事前学習時に十分考慮できているとは言えない.そこで追学習時に,エンコーダに要約長を予測させることで要約タスクに固有の情報を理解させた上で,デコーダには予測した要約長の要約を生成させるモデルを提案した. WikiHow, NYT, CNN/DMデータセットを用いた実験により,BARTよりもROUGEスコアを向上させること,WikiHowデータセットでは,GSumよりもROUGE-1, -2, -Lをそれぞれ約3.0, 1,5, 3.1ポイント向上させることを確認した.
|
現在までの達成度 (段落) |
令和5年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和5年度が最終年度であるため、記入しない。
|