研究課題/領域番号 |
26280039
|
研究機関 | 東京大学 |
研究代表者 |
山肩 洋子 東京大学, 大学院情報理工学系研究科, 特別研究員 (60423018)
|
研究分担者 |
今堀 慎治 中央大学, 理工学部, 教授 (90396789)
森 信介 京都大学, 学術情報メディアセンター, 教授 (90456773)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
キーワード | 情報検索 / メディア情報処理 / 自然言語処理 / グラフ理論 / 食メディア / レシピ |
研究実績の概要 |
本研究の目的は,Webにある膨大な数のレシピの集合が本質的にどの程度の多様性を持っているのか,足りないのか十分なのか,何が足りないのかを明らかにすることである.そこで本研究では,(i)自然言語処理技術によりレシピ記述から手順構造を抽出し,(ii)手順と記述の観点からレシピ間の関係を解析するとともに,(iii)全体の知識を使って補完可能な欠損を補完することで,レシピ集合が持つ本質的な多様性を解析する機構を構築する.今年度は以下の2点を行った. (1) 国際化に向けた英語対応:Webレシピの急増は日本だけでなく世界で起こっている現象である.米国最大手のAllrecipesの月間ページビューは推定2,000万件で,クックパッドの実に3倍以上である.さらに料理レシピが世界の情報処理の研究対象として国際的に認知されつつある.そこで,平成28年度,英文係り受け解析器RASPの開発で著名なJohn Carroll氏の協力を得て,英文レシピのフローグラフコーパスを開発した.今年度はこれを我々が開発した手法で実装することで,固有表現認識精度が84.8%,固有表現が正しく認識されているときの依存関係推定精度74.1%を達成した.また,和文と英文のレシピの構造的な相違を統計分析により明らかにした. (2) レシピテキストの記述粒度の自動変換:肉じゃがやハンバーグのような代表的な和食は数千からときに数万のレシピが見つかる.同じ料理名をもつレシピのうち,その主たる調理方法が似通っているとき,それらは似た調理手順を説明した異なる記述であると考える.ここで,片方のレシピがもち,もう片方のレシピが持っていない説明は,その手順の詳細説明であると考えられることから,この関係を用いて詳細記述を生成した.また,双方が持つノードはその手法の主幹であることから,それらを取り出したフローを簡略な表現と位置付けた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(1) 提案手法の言語依存性を排除し,国際化に向けた発展としては,「研究実績の概要(1)」で挙げたように,英文フローグラフコーパスの構築およびそれを用いた自動フローグラフ化において大きな進展があった.さらに,英文と和文では,同じ手順を説明したレシピでもその記述構造に大きな違いがあることを統計分析により明らかにし,その成果を2017年8月に豪州メルボルンで開催された食の情報処理に関する国際ワークショップCEA2017にて発表を行った.この論文はCEA2017 Best Paper Awardを獲得した. (2) 料理レシピはテキストだけでなく写真や映像を含むマルチメディアコンテンツであることから,今年度はその対象を料理画像にまで拡張し,ビュッフェスタイルのレストランを対象に,深層学習を用いた画像認識により料理名を特定するシステムを開発した.また,短期間の食事記録から,長期間の食事記録の予測を行うことで,個人の食習慣を把握する手法を提案した.これらの成果は,2018年2月に北海道で行われた国内研究会にて発表した. (3)「研究実績の概要(2)」で挙げた手法を実装・評価した.具体的には,前年度に発表した論文[1]で提案した手法を用いて,同じ料理名を持つレシピ間のノード単位のフローグラフマッピングを行い,その類似度が高かったものは似た手順を説明していると仮定して,対応付けられなかったノートはその手順の詳細説明であると考える手法である.この手法により,手順の相違と記述の相違を区別するだけでなく,その対応関係を見ることで,情報を補完することを可能とする. [1] 山肩 洋子,今堀 慎治,森 信介,田中 克己,“ワークフロー表現を用いたレシピの典型性評価と典型的なレシピの生成”,電子情報通信学会論文誌D,Vol.J99-D, No.4, pp. 378-391, 2016.
|
今後の研究の推進方策 |
本研究の計画当初は,料理レシピに関する研究は日本が中心だったことから和文レシピのみを対象としていたが,2015年ごろから世界中でレシピ研究が活発に行われるようになった.そこで,我々も2016年より英文レシピをカバーするよう計画を変更して研究を進めてきた.これにより,多言語レシピをカバーする新しい課題へと発展したことから,より精密に達成するため期間の延長を申請した.平成30年度は以下のような課題に取り組む. (1) 和文レシピを対象として,「研究実績の概要(2)」で挙げた手法について,レシピテキストの記述粒度や,手順の手抜き度を自動変換する手法を実装し,学術的な評価を行う.また,アプリケーション化して被験者実験を行う. (2) これまでの研究成果をアプリケーションの形で実現し,被験者実験によりその有効性を評価する.具体的には,材料・手順・記述のそれぞれの視点においてレシピをランキングするレシピ検索システムを構築する. (3) これまで得た様々な成果をまとめ,論文誌あるいは国際学会等に投稿し発表する.また,提案手法の研究課題後の発展に向けて,共同研究者や研究協力者と議論する.
|
次年度使用額が生じた理由 |
理由:料理レシピの言語処理研究が国際学会等において急速に増加したことを受けて、平成28年度から、和文レシピのみを対象としていたものから英文レシピへと拡張するための基盤作りへ研究方針をシフトした。これは、和文・英文両言語を対象として提案手法を評価することで、言語によらない本質的な評価を行うということだけでなく、本課題の成果が国際的に認められるためにも極めて重要であると判断した。そこで、平成28年度に国際化の研究に注力したことから、当初その時期に進める計画であった研究課題の一部が翌年度に持ち越されることとなった。二名の研究分担者と協議し、研究期間を延長して課題の達成を目指すこととし、平成29年度の基金を翌年度に繰り越した。 使用計画:平成29年度に開発したシステムの評価実験を行い、その成果を国内研究会や国際学会・論文誌等で発表するために使用する。
|