研究課題/領域番号 |
15J40163
|
研究機関 | 東京大学 |
研究代表者 |
山肩 洋子 東京大学, 情報理工学系研究科, 特別研究員(RPD)
|
研究期間 (年度) |
2015-10-09 – 2019-03-31
|
キーワード | 情報検索 / 音声対話 / 質問生成 / 自然言語処理 |
研究実績の概要 |
(1)音声対話システムの整備 音声インタラクション開発ツールキットMMD AgentのAndroid版を導入し、音声対話システムの開発プラットフォームの整備を行った。本研究は、名古屋工業大学の李晃伸准教授の協力を得た。さらに、Webブラウザを用いたアプリケーション開発環境として、HTML5の主要な規格の一つであるWeb Speech APIを使った実装を行った。 (2)レシピデータの整備 本研究では、ユーザから料理レシピを聞き取るための対話を生成するに当たり、構造化した大量のレシピデータを用いる。そこで、そのデータ整備を行った。対象としたのは、国立情報学研究所を介してクックパッド社から提供されたレシピ1715千件である。各レシピの手順説明文書に対し、申請者が京都大学 森 信介准教授らと協力して開発してきたレシピ言語処理ツールを適用してレシピ用語認識および構造化を行った。レシピ用語間の依存関係の有無に関する推定精度は7割程度であるが、現在コーパスを補強しており、最終的には8割程度に到達することが見込まれている。 (3)発話予測のための加工手順抽出手法の提案 ユーザがある食材に加えられる調理の流れに言及しているとき、その発話は、その食材が調理の完成までに受ける加工の流れに沿って行われると考えられる。そこで、食材が指定されたとき、その食材が今後どのような加工を加えられるかを予測するため、(2)のレシピデータから、食材ごとに受ける加工手順を抽出する手法を提案した。具体的には、調理手順文書から自動抽出したレシピ用語列をそのまま加工手順と考える手法をベースラインとし、先にレシピツリーを自動導出したのち、そのツリーの経路上に並ぶレシピ用語列を加工手順と考える手法を提案手法として精度比較を行った。その結果、ベースラインがF値74.5に対し提案手法は78.8と、より高い精度を得ることが分かった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
音声対話システムの準備を行うとともに、そのコンテンツとなるレシピ情報の解析基盤の構築、加工手順の抽出手法に関して、十分な成果が得られた。解析を行うためには、データセットの構築が必須であり、クックパッドで用いられた実際のレシピをもとに、加工手順のツリーを構築した。これにより、学習ベースでそのツリーを導く手法の開発に取り組んでいる。さらに、部分データから加工手順を予測する手法についても結果を出している。本研究は分野横断的な課題であるため、複数の大学、企業との協業を進めており、その積極的な研究活動の展開も高く評価できる。論文として、筆頭著者と共著での学会誌論文をそれぞれ1編ずつ、採択・出版に至っている。あらたに着手している課題についても、論文を執筆中である。以上のことから、受入れ研究者により、研究活動は着実であるとの評価を得た。
|
今後の研究の推進方策 |
(1)音声対話システムの改良 平成27年度のシステム開発で利用したWeb Speech APIはAndroid/iOSを含むクロスプラットフォームで動作し、実装が容易であることが利点であるが、1日当たりの利用回数に制限があることや、Google等の外部の音声認識エンジンに、いったん音声データを渡して認識結果を受け取る仕様のため、プライバシーが保てないことが欠点である。そこで、実装が容易なWeb Speech APIによりアルゴリズムの開発や予備的評価を行いつつ、MMD Agentの整備状況に従い、MMD Agentに移行するよう計画している。 (2)ユーザとの対話で得た情報の構造的記録 研究計画でも述べた通り、本研究では、ユーザと対話しながら調理手順を聞き取る際、その聞き取った内容を、ただ単に単語列として記録していくのではなく、レシピツリーのような構造を持つデータとして記録する。大量のWebレシピに対し「研究実績の概要」で述べた加工手順抽出手法を適用することにより、調理の流れに関するN-gramモデルを構築する。これは、発話を予測して音声認識精度を向上させるだけでなく、発話内容の構造化にも利用される。また、本課題のもう一つの適用先である自分史への拡張を行う。 (3)国際化に向けた英語対応 Webレシピの急増は日本だけでなく世界各国で起こっている現象である。米国最王手のAllrecipesの月間ページビューは推定2,000万件で、クックパッドの実に3倍以上である。Allrecipesのレシピは研究利用に限定して部分的に提供されはじめており、料理レシピが情報処理の研究対象として国際的に認知されつつある。食は文化によって多様であるため、あらゆる国や地域において本課題であるレシピの聞き取りは有用なはずである。提案手法を英語に適応させるなかで、言語に依存しない汎用的な枠組みの開発を行う。
|
備考 |
(1)のWebページは京都大学 准教授 森 信介氏との共同研究による。
|