• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

消費者生産型レシピコンテンツの手順・記述から見た多様性の解析手法の提案

Research Project

Project/Area Number 26280039
Research InstitutionThe University of Tokyo

Principal Investigator

山肩 洋子  東京大学, 大学院情報理工学系研究科, 特別研究員 (60423018)

Co-Investigator(Kenkyū-buntansha) 今堀 慎治  中央大学, 理工学部, 教授 (90396789)
森 信介  京都大学, 学術情報メディアセンター, 教授 (90456773)
Project Period (FY) 2014-04-01 – 2019-03-31
Keywords情報検索 / メディア情報処理 / 自然言語処理 / グラフ理論 / 食メディア / レシピ
Outline of Annual Research Achievements

本研究の目的は,Webにある膨大な数のレシピの集合が本質的にどの程度の多様性を持っているのか,足りないのか十分なのか,何が足りないのかを明らかにすることである.そこで本研究では,(i)自然言語処理技術によりレシピ記述から手順構造を抽出し,(ii)手順と記述の観点からレシピ間の関係を解析するとともに,(iii)全体の知識を使って補完可能な欠損を補完することで,レシピ集合が持つ本質的な多様性を解析する機構を構築する.今年度は以下の2点を行った.
(1) 国際化に向けた英語対応:Webレシピの急増は日本だけでなく世界で起こっている現象である.米国最大手のAllrecipesの月間ページビューは推定2,000万件で,クックパッドの実に3倍以上である.さらに料理レシピが世界の情報処理の研究対象として国際的に認知されつつある.そこで,平成28年度,英文係り受け解析器RASPの開発で著名なJohn Carroll氏の協力を得て,英文レシピのフローグラフコーパスを開発した.今年度はこれを我々が開発した手法で実装することで,固有表現認識精度が84.8%,固有表現が正しく認識されているときの依存関係推定精度74.1%を達成した.また,和文と英文のレシピの構造的な相違を統計分析により明らかにした.
(2) レシピテキストの記述粒度の自動変換:肉じゃがやハンバーグのような代表的な和食は数千からときに数万のレシピが見つかる.同じ料理名をもつレシピのうち,その主たる調理方法が似通っているとき,それらは似た調理手順を説明した異なる記述であると考える.ここで,片方のレシピがもち,もう片方のレシピが持っていない説明は,その手順の詳細説明であると考えられることから,この関係を用いて詳細記述を生成した.また,双方が持つノードはその手法の主幹であることから,それらを取り出したフローを簡略な表現と位置付けた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

(1) 提案手法の言語依存性を排除し,国際化に向けた発展としては,「研究実績の概要(1)」で挙げたように,英文フローグラフコーパスの構築およびそれを用いた自動フローグラフ化において大きな進展があった.さらに,英文と和文では,同じ手順を説明したレシピでもその記述構造に大きな違いがあることを統計分析により明らかにし,その成果を2017年8月に豪州メルボルンで開催された食の情報処理に関する国際ワークショップCEA2017にて発表を行った.この論文はCEA2017 Best Paper Awardを獲得した.
(2) 料理レシピはテキストだけでなく写真や映像を含むマルチメディアコンテンツであることから,今年度はその対象を料理画像にまで拡張し,ビュッフェスタイルのレストランを対象に,深層学習を用いた画像認識により料理名を特定するシステムを開発した.また,短期間の食事記録から,長期間の食事記録の予測を行うことで,個人の食習慣を把握する手法を提案した.これらの成果は,2018年2月に北海道で行われた国内研究会にて発表した.
(3)「研究実績の概要(2)」で挙げた手法を実装・評価した.具体的には,前年度に発表した論文[1]で提案した手法を用いて,同じ料理名を持つレシピ間のノード単位のフローグラフマッピングを行い,その類似度が高かったものは似た手順を説明していると仮定して,対応付けられなかったノートはその手順の詳細説明であると考える手法である.この手法により,手順の相違と記述の相違を区別するだけでなく,その対応関係を見ることで,情報を補完することを可能とする.
[1] 山肩 洋子,今堀 慎治,森 信介,田中 克己,“ワークフロー表現を用いたレシピの典型性評価と典型的なレシピの生成”,電子情報通信学会論文誌D,Vol.J99-D, No.4, pp. 378-391, 2016.

Strategy for Future Research Activity

本研究の計画当初は,料理レシピに関する研究は日本が中心だったことから和文レシピのみを対象としていたが,2015年ごろから世界中でレシピ研究が活発に行われるようになった.そこで,我々も2016年より英文レシピをカバーするよう計画を変更して研究を進めてきた.これにより,多言語レシピをカバーする新しい課題へと発展したことから,より精密に達成するため期間の延長を申請した.平成30年度は以下のような課題に取り組む.
(1) 和文レシピを対象として,「研究実績の概要(2)」で挙げた手法について,レシピテキストの記述粒度や,手順の手抜き度を自動変換する手法を実装し,学術的な評価を行う.また,アプリケーション化して被験者実験を行う.
(2) これまでの研究成果をアプリケーションの形で実現し,被験者実験によりその有効性を評価する.具体的には,材料・手順・記述のそれぞれの視点においてレシピをランキングするレシピ検索システムを構築する.
(3) これまで得た様々な成果をまとめ,論文誌あるいは国際学会等に投稿し発表する.また,提案手法の研究課題後の発展に向けて,共同研究者や研究協力者と議論する.

Causes of Carryover

理由:料理レシピの言語処理研究が国際学会等において急速に増加したことを受けて、平成28年度から、和文レシピのみを対象としていたものから英文レシピへと拡張するための基盤作りへ研究方針をシフトした。これは、和文・英文両言語を対象として提案手法を評価することで、言語によらない本質的な評価を行うということだけでなく、本課題の成果が国際的に認められるためにも極めて重要であると判断した。そこで、平成28年度に国際化の研究に注力したことから、当初その時期に進める計画であった研究課題の一部が翌年度に持ち越されることとなった。二名の研究分担者と協議し、研究期間を延長して課題の達成を目指すこととし、平成29年度の基金を翌年度に繰り越した。
使用計画:平成29年度に開発したシステムの評価実験を行い、その成果を国内研究会や国際学会・論文誌等で発表するために使用する。

  • Research Products

    (13 results)

All 2018 2017 Other

All Int'l Joint Research (1 results) Presentation (8 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results) Book (1 results) Remarks (3 results)

  • [Int'l Joint Research] University of Sussex(United Kingdom)

    • Country Name
      United Kingdom
    • Counterpart Institution
      University of Sussex
  • [Presentation] 短期間の食事記録からの長期間記録の予測と評価2018

    • Author(s)
      椿田晃大, 天野宗佑, 山肩洋子, 相澤清晴, 小川 誠
    • Organizer
      映像情報メディア学会
  • [Presentation] アスリート支援のための食事画像認識2018

    • Author(s)
      安沢昌志, 天野宗佑, 山肩洋子, 元永恵子, 亀井明子, 相澤清晴
    • Organizer
      映像情報メディア学会
  • [Presentation] 日本語の単語分割と品詞推定 あるいはKyTeaの話2018

    • Author(s)
      森 信介
    • Organizer
      言語処理学会年次大会ワークショップ
    • Invited
  • [Presentation] 英文レシピを対象とした手順文書からの意味構造抽出2017

    • Author(s)
      山肩洋子, 前田浩邦, 森 信介, John Carroll
    • Organizer
      電子情報通信学会 データ工学研究会
  • [Presentation] A Comparison of Cooking Recipe Named Entities between Japanese and English2017

    • Author(s)
      Yoko Yamakata, Shinsuke Mori, John Carroll
    • Organizer
      9th Workshop on Multimedia for Cooking and Eating Activities (CEA2017)
    • Int'l Joint Research
  • [Presentation] 分野特有の教師なし固有表現認識2017

    • Author(s)
      友利 涼, 森 信介
    • Organizer
      情報処理学会自然言語処理研究会, NL-234
  • [Presentation] Procedural Text Generation from an Execution Video2017

    • Author(s)
      Atsushi Ushiku, Hayato Hashimoto, Atsushi Hashimoto, Shinsuke Mori
    • Organizer
      The 8th International Joint Conference on Natural Language Processing (IJCNLP 2017)
    • Int'l Joint Research
  • [Presentation] 教師なし学習による分野特有の固有表現認識2017

    • Author(s)
      友利 涼, 森 信介
    • Organizer
      NLP若手の会 第12回シンポジウム
  • [Book] おいしさの科学とビジネス展開の最前線2017

    • Author(s)
      山肩 洋子, 他44名
    • Total Pages
      439
    • Publisher
      シーエムシー出版
    • ISBN
      978-4-7813-1249-1
  • [Remarks] フローグラフコーパス (FG corpus)

    • URL

      http://plata.ar.media.kyoto-u.ac.jp/data/recipe/

  • [Remarks] Flow graph corpus (FG corpus)

    • URL

      http://plata.ar.media.kyoto-u.ac.jp/data/recipe/home-e.html

  • [Remarks] レシピ言語処理マニュアル

    • URL

      http://www.ar.media.kyoto-u.ac.jp/how-to/recipe-NLP/

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi