研究課題/領域番号 |
19H04162
|
研究機関 | 東北大学 |
研究代表者 |
鈴木 潤 東北大学, データ駆動科学・AI教育研究センター, 教授 (80396150)
|
研究分担者 |
松林 優一郎 東北大学, 教育学研究科, 准教授 (20582901)
乾 健太郎 東北大学, 情報科学研究科, 教授 (60272689)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 自然言語処理 / 人工知能 / 機械学習 / 文章生成 / 解釈性 / 説明性 |
研究実績の概要 |
機械翻訳,文書要約,文章校正,対話システムといった,ある入力文章を事前の定義に基づいて別の文章に変換する「文章変換技術」として広く用いられている符号化復号化器に関して,その処理過程を人間が解釈でき,かつ,処理結果を人手により比較的容易に操作できる技術,及び,その基盤技術の構築に取り組んだ. 本年度の主要な成果は,学習データに現れない未知のデータを予測する際に,学習データ内のどの事例を根拠として予測を行なったのかを提示する事例ベースの方法論の考案である.予測時にどの事例を根拠として予測したかを提示することで,予測の信頼度を推し量ることができるようになる.これにより,従来の典型的な深層学習により得られたモデルよりも,人間が予測理由をはるかに把握しやすくなった. また,上記主要な成果以外にも,モデル学習時に非明示的に活用されるサブネットワークに着目することで,モデル内の挙動や学習データ内の各事例の影響度を計算する方法論や,単語間の意味的な類似性を加味しつつ文間の類似度を適切に計算する方法論の構築などにも取り組んだ.更に,当該年度の計画にはない追加の成果として,文章変換技術の中でも社会的に広く注目されている対話システムに焦点を当て,文章変換の良さを計測する方法論を別々の観点から二種類考案した.タスクの評価指標や評価方法は,数値を用いて人間の直感に適合するように設計する必要があり,その設計はそれほど容易ではなく,非常に意義の高い成果である.これらの追加の成果は,今後構築する方法論の性能を評価する際の基盤技術として活用していく. 今年度も引き続き文章変換における処理の解釈に資する研究を継続し,人間がどのように情報を提示されるとより解釈が容易と感じるかといった検証も含めて推進する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度の進捗は当初計画した二年目の成果は概ね実現し,さらに追加で当初計画外の新たな方法論の構築にも取り組んだ. 詳細では当初計画と異なる点がある.例えば当初は逐次変換処理方式を目論んでいたが,それに代わる方法論として隠れ変数モデル,および,事例ベースによる根拠提示方法を考案した.これは,技術革新が非常に早い昨今のAI関連研究では,世の中の技術の進歩や新たに得られた知見を素早く反映して更なる発展を目指す必要がある.この観点から,当初の計画通りに進まないのは仕方がないところもあると考えている.ただし,想定していた方法論とは異なっていても,当初計画にある「文章変換の処理過程を人間が理解できる形式で獲得する」という目的に変わりはなく,より自然かつ最新の情勢を加味した方式で研究目的を達成することを目指している. 研究成果としての論文投稿に関しては,自然言語処理分野における最難関国際会議に8本採録されている.これら事実から,研究成果は当該分野において国際的にも高く評価されており,また,年間で8本の採録は国際的にも十分多い成果として認知されている. 当初予定には含まれていなかった対話システムの評価指標および評価方法の研究に関しても,今後の考案する方法論を適切に評価して有意義な技術革新を促すことができると考えており,意義の高い研究成果と考えている.1年目,2年目の成果を活用し,更なる発展に期待が持てる結果が得られており,次年度も引き続き当初目的を達成するために必要な研究を進めていく.
|
今後の研究の推進方策 |
最終年度となるので,1年目,2年目に考案した方法論やそれらの開発段階で得た様々な知見を活用し,当初の計画通り文章変換の処理過程を解釈可能な方法論の構築を目指す.前年度と同様に,発展が早いAI関連分野を継続的にキャッチアップしながら,分野全体に蓄えられている知見を取り入れて,計画時よりもより適した方法論を逐次模索しながら研究を進める. 今年度は,人間が認知しやすい記号的な形態で示される知識を解釈性に活用する方法論を中心に更に解釈性を高めることを考える.当初計画通り,記号的に蓄えられている実世界知識や自然言語解析の処理結果を効果的に活用する方法論は,本課題の目的である人間が処理過程を理解するために用いる表現として非常に効果的と考えられる.それと同時に,昨今広く用いられるようになった,超大量のデータで学習された言語モデルも一つの外部知識とみなして活用する方法論の構築も考案する.また,これら全てを組み合わせて取り扱う包括的な仕組みも検討すべき重要な課題と考えている. 最後に,ここで取り扱う文章変換技術に関する解釈性を向上させる方法論を適切に評価する評価指標や評価方法も重要な検討課題であり,これらもあわせて検討していく.
|