• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

消費者生産型レシピコンテンツの手順・記述から見た多様性の解析手法の提案

Research Project

Project/Area Number 26280039
Research InstitutionThe University of Tokyo

Principal Investigator

山肩 洋子  東京大学, 情報理工学(系)研究科, 研究員 (60423018)

Co-Investigator(Kenkyū-buntansha) 今堀 慎治  中央大学, 理工学部, 教授 (90396789)
森 信介  京都大学, 学術情報メディアセンター, 教授 (90456773)
Project Period (FY) 2014-04-01 – 2018-03-31
Keywords情報検索 / メディア情報処理 / 自然言語処理 / グラフ理論
Outline of Annual Research Achievements

本研究の目的は,Webにある膨大な数のレシピの集合が本質的にどの程度の多様性を持っているのか,足りないのか十分なのか,何が足りないのかを明らかにすることである.そこで本研究では,(i)自然言語処理技術によりレシピ記述から手順構造を抽出し,(ii)手順と記述の観点からレシピ間の関係を解析するとともに,(iii)全体の知識を使って補完可能な欠損を補完することで,レシピ集合が持つ本質的な多様性を解析する機構を構築する.今年度は以下の2点を行った.
(1) 国際化に向けた英語対応:Webレシピの急増は日本だけでなく世界で起こっている現象である.米国最大手のAllrecipesの月間ページビューは推定2,000万件で,クックパッドの実に3倍以上である.Allrecipesのレシピは研究利用に限定して部分的に提供されはじめており,料理レシピが世界の情報処理の研究対象として国際的に認知されつつある.そこで、英文係り受け解析器RASPの開発で著名なJohn Carroll氏の協力を得て、英文レシピのフローグラフコーパスを開発した。これにより、日英両言語による料理レシピのフローグラフコーパスが利用可能な状態となった。
(2) 全体の知識を効率的に集約するためには、データの次元圧縮が重要となる。広島市立大の難波教授らは、大量のレシピを係り受け解析して用語間の依存関係を抽出し、その分布が類似する用語間を同義語と判定することで、『料理オントロジー辞書』を開発している。この手法では同文内における係り受け関係のみを対象とするが、「ソース」や「生地」のような中間生成物名は構成要素が多様であるが故に、同文内の用語関係だけでは正しく同義語を導出できないことが多かった。そこでフローグラフを用いることで、料理が完成するまでの工程をすべて考慮することにより、より詳細な同義語関係を導出する手法を提案した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

(1) これまで和文のみを対象としてきた提案手法を英語レシピに拡張することを目的として、H28.8~H29.3の期間、英国サセックス大学に滞在し、レシピ固有表現(r-NE)とレシピフローグラフのタグ付けコーパスを構築した。まず、現地のレシピサイトAllrecipes.co.ukより収集したレシピに対し、現地の研究協力者(博士課程1年生のイギリス人学生)とともに、和文レシピ用に開発したタグ付けガイドラインに沿って英文レシピをタグ付けした。その中で、日本語にはない表現や、和文用のガイドラインでは解決できない問題を抽出し、Prof. Carrollと議論しながら、英文レシピにも適合するようガイドラインを更新した。さらに、日英料理レシピ間で生じている様々な相違について、同氏と協議しながら統計的な解析を行った。
(2) 英文料理レシピからフローグラフに変換したデータの可視化および活用について、同大学のProf. Peter Chenの協力を得た。滞在中、週1回程度の定期的な打ち合わせを通じて、テキストでは省略された説明を、可視化技術を通じて復元する手法について議論した。
(3) これまで我々が開発してきたフローグラフは、レシピテキストから概ね情報の欠損なく変換されたものであったが、レシピを比較・集約するためには、フローの主幹を見つけ出すことが重要である。そこで、フローグラフを取り出す前の完全グラフの状態から、食材・道具・動作のみからなる主幹フローを抽出する手法を提案し、国際ワークショップで発表した。調理では複数の食材が次々と混ぜ合わさり一つの料理になることが多く、途中で枝分かれしたり、複数の料理ができることも稀であるため、この主幹フローは木構造になることが多く、一般的な有向グラフに比べて検索等における扱いが容易であるという利点がある。

Strategy for Future Research Activity

平成29年度は最終年度であることを踏まえ、全体の総括を行うのと同時に、次のような方針で研究を推進する.
(1) 米国の主要なレシピポータルサイトAllrecipes.comとFood.comよりそれぞれ約50万件、イギリスのAllrecipes.co.ukより約3.6万件の英文レシピに対し、申請者らが構築したシステムによりフローグラフ化して、英文・和文レシピの相違について統計的な分析を行うのと同時に、提案手法を英文レシピに適用すべく改良した上で英文レシピを対象とした評価を行う。
(2) これまでの研究成果をアプリケーションの形で実現し、被験者実験によりその有効性を評価する。具体的には、材料・手順・記述のそれぞれの視点においてレシピをランキングするレシピ検索システムを構築する。平成28年度までに提案した手法は対象とするレシピの数に計算コストが強く依存することから、まずは料理名で絞り込んだレシピ集合を対象とする。同時に、より多く、多様なレシピを対象とすることができるよう、検索アルゴリズムの高速化を行う。
(3) 和文レシピを対象として、レシピテキストの記述粒度や、手順の手抜き度を自動変換する手法を実装し、学術的な評価を行う。また、アプリケーション化して被験者実験を行う。
(4) これまで得た様々な成果をまとめ、論文誌あるいは国際学会等に投稿し発表する。また、提案手法の研究期間後の発展に向けて、共同研究者や研究協力者と議論する。

Causes of Carryover

料理レシピの言語処理研究が国際学会等において急速に増加したことを受けて、昨年度は提案手法を和文レシピから英文レシピへと拡張するための基盤作りへ研究方針をシフトした。これは、和文・英文両言語を対象として提案手法を評価することで、言語によらない本質的な評価を行うということだけでなく、本課題の成果が国際的に認められるためにも極めて重要であると判断した。そこで、二名の研究分担者と協議し、研究分担者の研究内容については、平成28年度はそれまでの成果をより深め、また英文レシピへと拡張する準備をする事に注力することとし、平成29年度は英文レシピに提案手法を適用して、得られた成果を国際的に発表することにした。そのため、平成28年度予算を今年度に繰り越した。

Expenditure Plan for Carryover Budget

平成28年度に構築した英文レシピコーパスを新たに加え、和文レシピと英文レシピの相違分析と、英文レシピを対象とした提案手法の評価等の研究を国際学会・国際誌等で発表するために使用する。

  • Research Products

    (8 results)

All 2017 2016 Other

All Int'l Joint Research (1 results) Journal Article (4 results) (of which Peer Reviewed: 3 results,  Open Access: 2 results,  Acknowledgement Compliant: 2 results) Presentation (3 results) (of which Int'l Joint Research: 2 results)

  • [Int'l Joint Research] The university of Sussex(United Kingdom)

    • Country Name
      United Kingdom
    • Counterpart Institution
      The university of Sussex
  • [Journal Article] Cooking Recipe Search by Pairs of Ingredient and Action - Word Sequence v.s. Flow-graph Representation2017

    • Author(s)
      Yoko Yamakata, Hirokuni Maeta, Takuya Kadowaki, Tetsuro Sasada, Shinji Imahori, Shinsuke Mori
    • Journal Title

      Transactions of the Japanese Society for Artificial Intelligence

      Volume: 1 Pages: WII-F_1-9

    • DOI

      http://doi.org/10.1527/tjsai.WII-F

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] 手順文書からの意味構造抽出2017

    • Author(s)
      前田 浩邦, 山肩 洋子, 森 信介
    • Journal Title

      人工知能学会論文誌

      Volume: 32 Pages: E-G24_1-8

    • DOI

      http://doi.org/10.1527/tjsai.E-G24

    • Peer Reviewed / Open Access
  • [Journal Article] ワークフロー表現を用いたレシピの典型性評価と典型的なレシピの生成2016

    • Author(s)
      山肩 洋子,今堀 慎治,森 信介,田中 克己
    • Journal Title

      電子情報通信学会論文誌 D

      Volume: J99-D Pages: 378-391

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] A Comparative Study of Dictionaries and Corpora as Methods for Language Resource Addition2016

    • Author(s)
      Shinsuke Mori, Neubig Graham
    • Journal Title

      Journal of Language Resources and Evaluation

      Volume: 50 Pages: 245-261

    • DOI

      10.1007/s10579-016-9354-7

  • [Presentation] 料理レシピデータセットを用いた料理用語辞書の自動構築---フローグラフから得られる加工履歴に基づく食材名の分布類似度計算に関する検討---2016

    • Author(s)
      山肩洋子, 難波英嗣, 大須賀智子, 原島純, 但馬康宏, 森信介, 大山敬三
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      国立情報学研究所,東京
    • Year and Date
      2016-12-01 – 2016-12-02
  • [Presentation] Design in Everyday Cooking: Challenges for Assisting with Menu Planning and Food Preparation2016

    • Author(s)
      Atsushi Hashimoto, Jun Harashima, Yoko Yamakata, Shinsuke Mori
    • Organizer
      HCI International 2016
    • Place of Presentation
      Toronto, Canada
    • Year and Date
      2016-07-17 – 2016-07-22
    • Int'l Joint Research
  • [Presentation] A Method for Extracting Major Workflow composed of Ingredients, Tools, and Actions from Cooking Procedural Text2016

    • Author(s)
      Yoko Yamakata, Shinji Imahori, Hirokuni Maeta, Shinsuke Mori
    • Organizer
      8th Workshop on Multimedia for Cooking and Eating Activities
    • Place of Presentation
      Seattle, USA
    • Year and Date
      2016-07-15 – 2016-07-15
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi