研究課題/領域番号 |
26280096
|
研究機関 | お茶の水女子大学 |
研究代表者 |
小林 一郎 お茶の水女子大学, 基幹研究院, 教授 (60281440)
|
研究分担者 |
麻生 英樹 国立研究開発法人産業技術総合研究所, その他部局等, 研究員 (10344194)
長井 隆行 電気通信大学, 情報理工学(系)研究科, 教授 (40303010)
持橋 大地 統計数理研究所, 大学共同利用機関等の部局等, 准教授 (80418508)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 潜在的意味解析 / 言語化 / テキスト生成 / 言語的思考 / 知能ロボティクス |
研究実績の概要 |
モンテカルロ木探索を用いることによって、ランダムに文生成のシミュレーションを行いながら有望な文法規則を適用することで統語的に正しい構造を伴ったテキスト生成を可能にした.シミュレーションの結果として最終的に施される文の評価については、統語構造の正しさ、および、語彙の選択のされ方を対象に実施した.統語構造の正しさを識別するために、文脈自由文法の部分木を素性とするロジスティック回帰による識別器を構築し、語彙選択については、アクセプタビリティと呼ばれる、英語母語者の英文に対する容認度を採用した.これらにより、英文として正しい統語構造と単語のつながりを伴った文を生成することに成功した. また、マルチモーダル情報からボトムアップに学習を行い、文生成を実現するために、multilayered multimodal latent Dirichlet allocation(mMLDA)とBayesian hidden Markov model(BHMM)を用い、マルチモーダル情報から ボトムアップに言語の学習を行い、観測したシーンから文を生成する手法を提案した.統語情報を考慮した確率的文法を表現したBHMMから文法を学習し、文法に対応した単語をmMLDAとBHMM により複数生成することで、文法に従った単語候補のラティスを得、Viterbiアルゴリズムを用いて生成確率が最大となる単語列を文として生成を行った. また、人の動作の認識およびロボットの動作生成については、動作を表す系列データを離散化することなく分節化し、単位系列ごとに分類する手法を提案した.隠れマルコフモデルにおける出力をガウス過程とすることで、1つの状態が1つの連続的な単位系列を表現するモデルとし、実験において良好な結果を得た.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成27年度における研究計画は、(i)統語構造をともなった文生成手法の開発、(ii) 文生成と階層型マルチモーダルLDAとの連携、(iii)ロボットのセンサ情報の統合による動作生成、の3つである.これら、3つの課題においてそれぞれに進捗があり、発展的な開発を進めることができた.その成果は、言語処理学会、情報処理学会、日本ロボット学会、人工知能学会、Empirical Method for Natural Language Processingの国際会議等で報告することができた.
|
今後の研究の推進方策 |
平成27年度に進めた研究課題を引き続き進めるとともに、より人間が生成するような文生成が行えるような、モンテカルロ木探索のシミュレーションに基づく文生成を開発する.また、文生成をマルチモーダル情報解釈のひとつの出力とするように階層型マルチモーダルLDA( mmLDA)との連携をより発展させ、複数のセンサ情報の統合情報を言葉で表現できるように進めていくと共に、言語的思考の手法の開発の一貫として、ロボットが概念を利用して行動のプランニングを可能にする手法の開発を行う.さらに、ロボットの動作の分節化を教師なしで行う手法の開発を促進し、ロボットが連続な世界の情報を分節化して扱えるようにする手法の開発を進める.
|
次年度使用額が生じた理由 |
投稿した国際会議に採択されなかったなど、予定していた国際会議の参加が少なかったため、その分の金額が繰り越しとなった。
|
次年度使用額の使用計画 |
平成28年度はこの科研費プロジェクトの最終年度となるため、最終的な報告を国内外で行う予定である。そのため、出張旅費、論文掲載費などに多くの研究費が必要となり、そのための支出を行うつもりである。
|