• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

Assistance of multi-media contents generation for supporting learning and teaching of craftsmanship at home

Research Project

Project/Area Number 18K11425
Research InstitutionThe University of Tokyo

Principal Investigator

山肩 洋子  東京大学, 大学院情報理工学系研究科, 准教授 (60423018)

Co-Investigator(Kenkyū-buntansha) 山崎 俊彦  東京大学, 大学院情報理工学系研究科, 准教授 (70376599)
今堀 慎治  中央大学, 理工学部, 教授 (90396789)
Project Period (FY) 2018-04-01 – 2023-03-31
Keywords人間行動認識 / マルチメディア情報処理 / 教示コンテンツ自動生成 / e-learning
Outline of Annual Research Achievements

料理や裁縫、DIYなど,ハンドクラフトは「ものづくり」に対する人々の技術や教養,情熱を育てる下支えである.AIの技術により,専門知識を持たない人で あっても「ものづくり」を学び,他者に教えることを可能とすることが本研究の目標である.通常,人の「知識」は,音声や文書,イラストなどの客観的表現を 媒介して他者に伝えられる.しかし「技術」は身体的動きを伴った体験であり,見様見真似でその動きを模倣する中で,徐々にその感覚を主観として身につけ, 会得するという伝達経路を取る.料理番組のような第三者視点から撮影した映像では,視聴者は実体験としてその行動を理解することが難しい場合が多い.本研 究では制作者視点で撮影された画像や映像を対象とし,制作者がテキストと画像および映像からなる教材コンテンツを作成することを想定する。収集したデータ をもとに機械学習でモデルを獲得することにより,説明が不足している情報を補間する.このような仕組みを通じて,誰もがAIの支援により「技術」を主観的に 伝達・会得する仕組みを実現することが学術的な創造性である.
本課題では,料理やハンドクラフトの多種多様な分野を対象に,以下の3つの課題に取り組む.
(1) 自然言語処理:これまで料理レシピを対象として開発してきた作業フロー解析を,自己教師あり学習に基づく深層学習モデルに拡張することで,料理以外の 分野に対しても容易に拡張可能な仕組みを実現する
(2) 画像処理:従来は完成品の画像に対する認識が中心であったのに対し,創作工程の途中の画像に注目した画像認識手法を開発する
(3)一般のユーザがAIの支援により自分の創作活動を記録するシステムを開発する

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度はまず、ユーザのレシピ作成支援の研究を行った。料理レシピのような創作や操作手順の説明文書では,なぜそれをするのかといった,手順にとどまらない付加的な情報が文書の有用性を向上させる.しかし,そのような文書を書く経験に乏しい著者にとっては何を書くべきか考えることすら難しい.そこで自然言語処理技術により,調理手順そのものではない付加的説明文を自動生成する手法を提案した.具体的には、ユーザが入力した文に対し,クックパッドデータセットで学習したGPT-2モデルにより文を生成し,それらにBERTに基づく分類モデルを適用して付加的説明文を選出し,提案する仕組みを構築した.さらにユーザビリティ評価として,100名の実験参加者に実際のレシピにおける冒頭の2文を提示し,それらに続く実際の文と,それらから提案手法により生成された後続文のどちらを採用するか選ばせる実験を行った.その結果48.2%で生成文が選択され,提案手法の生成文が実際の文と同等程度に利用されることが示された.
また、モノの消費を理解する観点から、一人称視点で撮影された食事の様子を解析する研究を行った。一人の実験参加者がウェアラブルカメラを装着して食事をすることで撮影した計約7時間,74本の動画に対し,4本の10秒につき1フレーム,70本の1分1フレームの食事領域を注釈することで,一人称視点食事映像のデータセットを作成した.次に,アプリケーションの運用を想定した2つのシナリオのもと検出器を学習し,精度を評価したところ,一般的な食事領域抽出のモデルを初期値として10秒につき1フレームに注釈した3本の動画でファインチューニングすることでIoU閾値>0.7であるmAP=0.43の精度で食事領域抽出が可能であることが分かった.さらに,対象の動画から抜き出した2枚のフレームに対する注釈を用いることでmAP=0.64の精度を得た.

Strategy for Future Research Activity

今年度はレシピ作成支援アプリRecipeLogがおおむね完成し、App StoreおよびGoogle Playでリリースすることができたが、コロナ禍で研究活動がたびたび中断されたことから、それを活用したフィールド実験は十分行えていない。また、複数の国際学会で発表したものの、現地で参加できたものは一つもなく、海外の研究者らとの交流もほぼ皆無であった。食は日本だけでなく世界中で時に深刻な課題となっており、現時点ですでに英語に対応していることから、海外の研究者にも積極的に利用していただき、共同研究を広げていきたいと考えている。そこで、予算を2022年度まで繰り越し、国内外を問わず研究成果を積極的に発表することを計画している。2009年から毎年開催してきた食にまつわる情報処理研究の国際ワークショップCEAは、2022年は本課題の研究代表者である山肩をGeneral Chairとして、マルチメディア分野のトップカンファレンスであるACM Multimedia 2022の中で開催することが決定している。今年は、同じく食の情報処理研究を主題としてヨーロッパを中心に活動しているワークショップMADiMAと共同開催であることから、関連研究者が一堂に集まる場となることが期待される。
今年度に挑戦する技術課題としては、レシピの記述支援のための手法として、画像からレシピを生成することを計画している。日々のレシピを書き残すことは大きな手間であることから、食事の完成画像を撮影するだけで、そこで使われている食材やその分量、手順文まで生成して、記述者に提案する仕組みを実装する。2021年度に研究を開始した食事中の動画解析と組み合わせることで、写真の中で食材が別の食材に覆われるような隠れが生じる場合でも、高い精度で材料と分量を推定する手法を研究する。

Causes of Carryover

今年度はレシピ作成支援アプリRecipeLogがおおむね完成し、App StoreおよびGoogle Playでリリースすることができたが、コロナ禍で研究活動がたびたび中断されたことから、それを活用したフィールド実験は十分行えていない。また、複数の国際学会で発表したものの、現地で参加できたものは一つもなく、海外の研究者らとの交流もほぼ皆無であった。食は日本だけでなく世界中で時に深刻な課題となっており、現時点ですでに英語に対応していることから、海外の研究者にも積極的に利用していただき、共同研究を広げていきたいと考えている。そこで、予算を2022年度まで繰り越し、国内外を問わず研究成果を積極的に発表することを計画している。

Remarks

我々が開発したレシピ記録支援アプリRecipeLogはiOS/Androidともに2021年9月にリリースした。

  • Research Products

    (14 results)

All 2021 Other

All Int'l Joint Research (1 results) Journal Article (9 results) (of which Int'l Joint Research: 1 results,  Open Access: 3 results) Presentation (2 results) Remarks (2 results)

  • [Int'l Joint Research] University of California, Irvine(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      University of California, Irvine
  • [Journal Article] MIRecipe: A Recipe Dataset for Stage-Aware Recognition of Changes in Appearance of Ingredients2021

    • Author(s)
      Yixin Zhang, Yoko Yamakata, and Keishi Tajima
    • Journal Title

      ACM Multimedia Asia (MMAsia '21)

      Volume: 16 Pages: 1

    • DOI

      10.1145/3469877.3490596

    • Open Access
  • [Journal Article] Noisy Annotation Refinement for Object Detection2021

    • Author(s)
      Jiafeng Mao, Qing Yu, Yoko Yamakata and Kiyoharu Aizawa
    • Journal Title

      British Machine Vision Conference (BMVC)

      Volume: - Pages: 1

    • Open Access
  • [Journal Article] Boosting Personalized Food Image Classifier by Sharing Food Records2021

    • Author(s)
      Seum Kim, Yoko Yamakata, and Kiyoharu Aizawa
    • Journal Title

      ACM Multimedia Workshop on CEA (CEA '21)

      Volume: - Pages: 29

    • DOI

      10.1145/3463947.3469238,

  • [Journal Article] World Food Atlas Project2021

    • Author(s)
      Ali Rostami, Zhouhang Xie, Akihisa Ishino, Yoko Yamakata, Kiyoharu Aizawa, and Ramesh Jain
    • Journal Title

      ACM Multimedia Workshop on CEA (CEA '21)

      Volume: - Pages: 33

    • DOI

      10.1145/3463947.3469235,

    • Open Access / Int'l Joint Research
  • [Journal Article] RecipeLog: Recipe Authoring App for Accurate Food Recording2021

    • Author(s)
      Akihisa Ishino, Yoko Yamakata, Hiroaki Karasawa and Kiyoharu Aizawa
    • Journal Title

      ACM Multimedia 2021, Technical Demo

      Volume: - Pages: 2798

    • DOI

      10.1145/3474085.3478563

  • [Journal Article] Supplementing Omitted Named Entities in Cooking Procedural Text with Attached Images2021

    • Author(s)
      Yixin Zhang, Yoko Yamakata, Keishi Tajima
    • Journal Title

      IEEE 4th International Conference on Multimedia Information Processing and Retrieval (MIPR2021)

      Volume: - Pages: 199

    • DOI

      10.1109/MIPR51284.2021.00037

  • [Journal Article] 食行動の自動認識に向けた食事中の一人称視点映像データセットの構築2021

    • Author(s)
      佐藤賢志郎、天野宗佑、山肩洋子、相澤清晴
    • Journal Title

      映像情報メディア学会 メディア工学研究会

      Volume: vol. 46, no. 6 Pages: 19

  • [Journal Article] RecipeLog :食事管理のためのスケルトンレシピの作成と応用2021

    • Author(s)
      石野 耀久, 山肩 洋子, 唐澤 弘明, 相澤 清晴
    • Journal Title

      HCGシンポジウム

      Volume: - Pages: 1

  • [Journal Article] クックパッドデータセットで学習したBERT及びGPT-2の活用法に関する検討2021

    • Author(s)
      香川璃奈, 原悠輔, 姜志勲,山肩洋子
    • Journal Title

      HCGシンポジウム2021

      Volume: - Pages: 1

  • [Presentation] RecipeLog:レシピ作成の支援ツール2021

    • Author(s)
      佐藤賢志郎,石野耀久,唐澤弘明,山肩洋子,相澤清晴
    • Organizer
      日本栄養改善学会学術総会
  • [Presentation] 文書の内容と構造が書き手の負担と読み手の効用に与える影響の研究:文書記載支援技術の開発に向けて2021

    • Author(s)
      香川璃奈, 松原正樹, 宮田玲, 馬場雪乃, 山肩洋子
    • Organizer
      2021年度 人工知能学会全国大会論文集 (JSAI2021)
  • [Remarks] App StoreにおけるRecipeLogのインストールサイト

    • URL

      https://apps.apple.com/us/app/recipelog/id1587480365

  • [Remarks] Google PlayにおけるRecipe Logのインストールサイト

    • URL

      https://play.google.com/store/apps/details?id=recipe.log.app

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi