2016 Fiscal Year Annual Research Report
論理推論・機械学習・物理計算の融合によって「行間を読む」談話解析モデル
Project/Area Number |
15H01702
|
Research Institution | Tohoku University |
Principal Investigator |
乾 健太郎 東北大学, 情報科学研究科, 教授 (60272689)
|
Co-Investigator(Kenkyū-buntansha) |
岡崎 直観 東北大学, 情報科学研究科, 准教授 (50601118)
井之上 直也 東北大学, 情報科学研究科, 助教 (80778605)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 自然言語処理 / 人工知能 / 推論 / 知識 / 談話解析 |
Outline of Annual Research Achievements |
下記の3つの課題についてそれぞれ研究を進めた。 課題(1) 仮説推論器の改良 前年度までとは異なる道具立てで仮説推論の高速化を実現する新しい枠組みとして、仮説推論をWeighted Max-SAT問題として解く手法についても検討し、実際に命題論理上の Etcetera Abduction の規模耐性を大幅に改善できることを示した(Inoue et al. 2017)。 課題(2) 談話解析モデルの構築と評価 談話解析のベースとなる文内述語項構造解析について、2015年度に行った詳細な誤り分析に基づき、現解析モデルの素性の見直しやニューラルネットによる非線形化を行った結果、NAISTテキストコーパスに対して最高精度を達成した(松林 NLP2017)。また、仮説推論のベースとなる因果関係知識・スクリプト的知識の獲得を、述語の選択選好の文脈依存性をモデル化する新しい問題として捉えなおし、これを分散表現上に実現するニューラルネットベースの手法を提案した(Inoue et al. 2016)。さらに、こうした知見を文章に対する質問応答タスクに適用し、談話の各断片から得られる情報のある種の接合を分散表現で扱える可能性があることがわかった(Kobayashi et al. 2016)。 課題(3) 物理計算との融合と運転シーン理解への応用 実際の運転シーンからオブジェクトの状態を人手で書き起こした論理式および物理シミュレーションのパラメタを入力として、仮説推論器と物理シミュレーションの相互作用によって次に起こるイベントを予測するシステムを試作し、実際のヒヤリハットシーンを大規模に収集した動画データを用いて大規模な評価実験を行った(Takahashi et al. 2016)。また、画像データ中の物体間の関係を言語表現に結びつける研究にも着手した(Muraoka et al. 2016)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
3つの課題についてそれぞれ概ね当初計画に沿った成果を出せており、対外発表も順調である。
|
Strategy for Future Research Activity |
課題(1) 仮説推論と分散表現の融合 これまでの研究で対象としてきた一階述語論理上の仮説推論は、知識表現および意味表現を離散的な記号で表現することを前提していた。しかし、知識や意味を記号で表現する枠組みでは、自然言語に存在する極めて多くの同義表現を推論時に考慮する手段が貧弱であり、柔軟な推論の実現が難しいという課題があった。そこで、論理を構成する離散的な記号の意味を連続量のベクトルで表現する枠組みを新たに構築し、その上に仮説推論を実現することを考える。 課題(2) 学習可能な仮説推論に基づく談話解析モデルの構築と評価 談話コーパスの注釈付けと分析、知識表現の洗練と知識の公理化、談話解析モデルの実装と評価の3つの部分課題に並行して取り組み、相互に成果を取り込みながら全体としてスパイラルに枠組みを洗練していく。開発・評価には、同種の問題だけをコントロールして集めたWinograd Schema Challenge (WSC) (Levesque, AAAI2011; Rahman et al., EMNLP2012)やChoice of Plausible Alternatives (COPA) (Roemmele et al., AAAI2011 Spring Symposium)、Cloze Tests(Mostafazadeh et al. 2016)などのデータセットを利用する。また、論述文の談話解析に特化した論述構造解析と呼ばれる新しい課題についても適用対象として新たに検討し、課題設計、コーパス作成等に着手する。 課題(3) 画像中の物体に対する言語的参照表現の解析 言語と実世界の対応付け(グラウンディング)問題の一つの例題として、与えられた画像中の特定の物体を他の物体と言語によって区別して指示する言語的表現を解析し、どの物体が指示されているかを特定する対画像参照表現解析課題に着手し、上述の推論機構との融合を視野に入れながら、解析手法の検討を行う。
|
Research Products
(16 results)