研究課題/領域番号 |
15J40163
|
研究機関 | 東京大学 |
研究代表者 |
山肩 洋子 東京大学, 情報理工学系研究科, 特別研究員(RPD)
|
研究期間 (年度) |
2015-10-09 – 2019-03-31
|
キーワード | 音声対話システム / 料理レシピ / 自分史 / 口述 |
研究実績の概要 |
(1) 言語依存性排除のための英文手順データへの拡張:平成28年8月9日から9月13日の期間,特別研究奨励費によって英国サセックス大学に滞在した.滞在期間中は,同大学の受け入れ研究者であるProf. John Carroll氏と密に連絡を取りながら研究を遂行した.本課題では、システムがユーザと音声対話しながらユーザの知識を聞き出す際に,情報の欠落やあいまいさを自動的に検出してユーザに聞き返す機構を実現することが目的である.そのためには,ユーザから聞き出した情報を構造化することが必要であり,これまで,話題のテーマを料理と想定して,調理手順の構造化の研究に取り組んできた.今までは和文のレシピのみを対象としてきたが、言語依存性を排除するために英文レシピの解析が必要となり,Prof. Carroll氏の協力を仰ぐこととなった.滞在中、同氏が開発した英文係り受け解析器RASP (http://ilexir.co.uk/applications/rasp/)の導入とドメイン適用方法についてご指導いただいたことから、英文の係り受け解析が可能となった。 (2) 英国におけるレシピの活用と記述形式の調査:海外における提案アプリケーションのニーズを調査することを目的として、イギリス国内での食文化や料理レシピの活用に関して、近郊の都市ブライトンにてフィールドワークを行った. (3) 英国の日記研究の調査:英国では古くから知識人達が日記を残す文化があり、個人の日記であってもその時代の人々の生活環境や考え方を知る上で貴重な資料として、数多くの研究がある。中でも日記の記述と時代との関連づけは、当該課題の主要なテーマの一つであることから、文献を収集し分析を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
料理レシピの聞き取りタスクについては、和文だけでなく英文にまで拡張する基盤を得たという点で大きな進捗があった。現地の博士課程の学生1名の協力を得て、英文のレシピ100個からなる英文フローグラフコーパスを構築した。従来研究において、和文レシピを対象に、食材・道具・調理者の動作・食材の状態など、調理手順を説明する上で重要な用語を定義し、208個の和文レシピにタグ付けしてコーパスを構築していた。このタグ付けガイドラインを英文レシピに合うように改良する仮定で起きた種々の問題を整理した。また、和文と英文の各レシピコーパスにおいて、それぞれの種類の用語の出現がどのように異なるかを統計的に分析した。この成果は、2017年8月に豪州メルボルンで開催される食の情報処理に関する国際ワークショップCEA2017に投稿すべく、論文を執筆しているところである。 また、自分史の聞き取りタスクについては、日記の分析研究を知ることができたという点で大きな進捗があった。自分が自分のために執筆した日記だけでなく、秘書に口述させたものや、秘書が要人の記録を残したものなど、様々な形式がある。その時代背景や当時の人々の考え方を知るためには、著名人よりはむしろそうでない人の日記のほうが価値がある場合も多く、そのような研究は本課題の自分史聞き取りシステムを実現する上で非常に参考になった。
|
今後の研究の推進方策 |
平成27年度の半年で音声対話システムの基盤を構築し、また平成28年度では料理レシピの構造化手法と、日記の記述形式と分析方法について研究した。ここまでの成果を受けて、平成29年度では、これらを連結して強調動作させる仕組みについて研究する。 具体的には以下の2点について行う。 (1)ユーザの発話を予測したり不足している情報を確認することで円滑な対話を実現 ユーザの発話は部分的に見ればWeb上で多くの類似した情報が発見できる.そこで,ロボットはユーザから聞き取った内容をもとにWebを検索して類似のデータを収集し,そこに含まれている単語やフレーズの統計的な傾向を調べる.これによりユーザの発話を予測して音声認識結果を絞り込んだり,「何ですか?」という質問発話ではなく「〇〇ですか?」といった確認発話を生成する. (2) ユーザから得た情報が不完全なものとならないよう,それまでの対話で得た情報において不足している要素を発見してユーザに質問する機能を実現 ユーザから得た知識でWebを検索した時,検索結果が少ないことで,その知識が深いと判断できると考えれば,検索結果が少なくなるような質問をユーザに行って知識を得ることで.正しい方向に知識を深めることが出来るはずである.これには、候補が複数ある時に,ユーザの答えがYES/NOのどちらであっても候補を最も絞り込めるような質問を生成する手法を導入する。
|