2018 Fiscal Year Research-status Report
視覚・言語情報を統合処理するニューラルネットワークに関する研究
Project/Area Number |
16K00338
|
Research Institution | Keio University |
Principal Investigator |
萩原 将文 慶應義塾大学, 理工学部(矢上), 教授 (80198655)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 転移学習 / 対話システム |
Outline of Annual Research Achievements |
平成30年度の課題は、「視覚・言語情報を統合処理するニューラルネットワークの完成」である。より細かい目標設定としては、「自然言語を生成できるニューラルネットワークの開発」と「ネットワーク全体での調整」であった。本年度は、特に前者の自然言語処理研究に力を入れた。具体的には、転移学習を用いた階層型潜在変数付きエンコーダ・デコーダによる自動相談システムの構築を行い、文脈を考慮した会話文の自動生成を可能とした。これは、Latent Variable Hierarchical Recurrent Encoder-Decoder(VHRED)というモデルを利用し、これに転移学習を用いて会話の流れの考慮を可能とした自動相談システムとなっている。 機械学習ベースの対話システムの作成においては、Sequence to Sequence(Seq2Seq)モデルが注目を集めている.しかし、Seq2Seqには1ペアの対話を学習しているために会話の流れを考慮できない。したがって、同じ入力からは同じ出力しか得られないという欠点があった。この問題点を低減するために提案されたのがVHREDである。しかしこれを学習させるために必要な対話ターン数の長い日本語コーパスは、少量しか存在しないという問題があった。そこでVHREDに転移学習を適用した手法を提案した。具体的には、VHREDのEncoder層とDecoder 層をTwitterから得た大量の対話ペアを用いて学習する。そして、その他の層を会話の流れを反映するための対話ターン数の長いコーパスで学習する。この学習方法により、少量のコーパスでもVHREDを学習させることが可能となった。評価実験では、転移学習を行わないVHREDと比較して主観評価を行った。結果として、話の流れの自然さや応答文の多様性の項目において提案手法の有効性が示された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
視覚情報処理は、世界的にも深層学習の研究により比較的進んでいる分野である。一方、自然言語処理の分野においては、自然な会話文の生成は非常に困難であった。本年度は、Latent Variable Hierarchical Recurrent Encoder-Decoder(VHRED)という新しいモデルを利用し、これに転移学習を用いて会話の流れの考慮を可能とした会話(自動相談)システムの構築に成功した。転移学習により、深層学習において必要とされる膨大な学習データへの対応が可能となったこと、ならびに、これまで困難であった文脈を考慮した会話が可能になったことが大きな研究成果である。
|
Strategy for Future Research Activity |
平成31年度においては、これまで大きな進展のあった研究を発展させると同時に、それらの統合を目標とする。具体的には、ニューラルネットワーク研究における視覚情報と言語情報の有機的統合処理機構の開発である。平成29年度の研究成果である、画像を感性語を用いて説明するキャプション生成システムと平成30年度の研究成果である、流れを考慮できる自動会話システムとの統合をめざす。それぞれ基礎研究としての発展は大きいが、応用システムとしての統合には斬新なアイデアが必要とされると考えられる。
|
Causes of Carryover |
旅費に関しては、今年度も研究そのものに重点を置いた傾向があり、科研費による出張は少なかった。 物品費に関しては、平成30年度は計算パワーの大きな計算機の購入を行ったが、前年度の残高が多かった。 平成31年度の予算規模は大きくないが、旅費とシステム統合へ向けての人件費などへの支出が想定される。
|