• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

Development of standard database for evaluating the fun of humor considering contextual information

Research Project

Project/Area Number 21K12007
Research InstitutionHokkaido University

Principal Investigator

荒木 健治  北海道大学, 情報科学研究院, 特任教授 (50202742)

Co-Investigator(Kenkyū-buntansha) 佐山 公一  小樽商科大学, 商学部, 教授 (90271733)
内田 ゆず  北海学園大学, 工学部, 教授 (80583575)
谷津 元樹  青山学院大学, 理工学部, 助教 (30805015)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywordsユーモア / 駄洒落 / 文脈情報 / 面白さ / Twitter / 画像 / 雑談対話システム
Outline of Annual Research Achievements

R4年度は,R3年度に引き続きTwitter上のデータを用いて駄洒落が出現する前後の文脈情報の収集を行なった.収集の対象とした駄洒落を1,000件から10,000件と10倍まで増加させた.さらに収集した駄洒落を含む対話12,000件に対してクラウドソーシングを用いて面白さの評価を行った.R5年度は最終年度となるのでこれまでに開発し公開している67,000件の駄洒落データベースに登録されている駄洒落を用いてより大規模に文脈を収集する予定である.Twitter上の駄洒落を収集し,面白さを評価した結果については,R5年3月に開催された言語処理学会第29回年次大会において発表を行なった.
また,研究分担者である谷津は画像内容に即した語を抽出し,画像の描画内容に即した駄洒落文を選択するためのランキング手法の提案を行った.また,ユーモア性, 理解容易性を考慮した直喩生成には「意外性」「具体性」 が必要という可能性があることを明らかにした.また,ユーモアへの理解を説明可能な動作で示すことのできる対話システムの実現のため,駄洒落の認識,駄洒落応答及びこれらを文脈制御に基づいて使用する駄洒落雑談対話システムの構築を行った.さらに,重畳型駄洒落検出の成功事例, 及び失敗事例における主な失敗要因について分析を行った.これらの結果については,画像ラボ,言語処理学会第29回年次大会,第252回自然言語処理研究会,2022年度人工知能学会全国大会(第36回),第71回ことば工学研究会において発表を行った.
また,研究分担者の内田は,引き続き文脈中に含まれるオノマトペが面白さにどのように影響しているのかの考察を行なった.この結果は,次年度発表する予定である.
さらに,研究分担者の佐山は,引き続き認知科学的視点から面白さの要因の分析を行なった.この結果についても次年度発表を行う予定である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

理由
本研究の最終目的は,文脈を考慮したユーモアの面白さを評価するための標準データベースの開発を行うことである.
この観点からR4年度はTwitterという非常に大規模なコーパスから代表的なユーモアである駄洒落について我々が開発済みの駄洒落データベースを用いて文脈情報の収集を行い,面白さの評価を行った.R3年度の10倍の量の10,000件の駄洒落に対する文脈情報を収集し,12,000件の駄洒落を含む対話について面白さの評価を行った.次年度はさらに大規模な駄洒落に対する文脈情報の収集を行う予定であるが,文脈情報が駄洒落の面白さに与える影響について種々の興味深い結果が得られてきており,今後の進展に大きな期待を抱かせるものであった.また,画像に即した駄洒落の選択,直喩表現におけるユーモアの利用,文脈に即した駄洒落を生成する雑談対話システムの構築なども行っている.
これらの結果から2年度目の進捗状況としてはおおむね順調に進展しているものと考えている.

Strategy for Future Research Activity

今後の研究の推進方策については,第一に現在10,000件の駄洒落まで進んでいる文脈情報をTwitter上のデータを用いて収集する作業をさらに大規模に進めることである.最終的には開発済みの駄洒落データベースに収録されている67,000件全ての駄洒落に対して文脈情報を収集する予定であるが,10,000件の文脈情報でも極めて膨大なデータとなるためその保存方法,公開方法についての検討を行う必要がある.
また,次年度は本研究課題の最終年度であるため文脈を含む駄洒落データベースが極めて大容量になることを踏まえ,その公開方法についての検討を進める予定である.さらに,今年度進めた画像に即した駄洒落の選択,直喩表現におけるユーモアの利用,文脈に即した駄洒落を生成する雑談対話システムの構築などについて,性能評価実験を行い,本研究課題で開発した文脈情報を含む駄洒落データベースの応用の可能性についても研究を進める予定である.

Causes of Carryover

当初の計画では,研究成果を発表する際に旅費を使用する予定であったが,コロナ禍のため一部オンラインによる発表となりました.また,研究分担者が一堂に介して対面で打ち合わせを行う予定であったが,これもコロナ禍のためオンラインでの実施としました.このため旅費の支出がなくなり次年度使用額が生じました.

  • Research Products

    (8 results)

All 2023 2022

All Journal Article (1 results) Presentation (7 results)

  • [Journal Article] キャプション及び物体認識ラベルを用いた描画内容に即した駄洒落文の選択手法2023

    • Author(s)
      1.浅野歴,谷津元樹,森田武史
    • Journal Title

      画像ラボ

      Volume: 34 Pages: 59~65

    • DOI

      10.11501/3348745

  • [Presentation] 画像キャプション生成及び物体認識を用いた駄洒落文ランキング手法の評価2023

    • Author(s)
      浅野歴,谷津元樹,森田武史,江上周作,鵜飼孝典,福田賢一郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 常識的知識グラフ及び単語埋め込みを用いた重畳型駄洒落ユーモア認識2023

    • Author(s)
      志方脩,谷津元樹,森田武史
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 汎用的言語理解フレームワークに基づく統合型駄洒落雑談対話システムの構築と評価2023

    • Author(s)
      谷津元樹,稲垣ルイ,田羅間大晴,森田武史
    • Organizer
      人工知能学会第2種研究会 第71回ことば工学研究会
  • [Presentation] 常識的知識グラフに基づく理解容易性及びユーモア性を考慮した直喩表現生成2023

    • Author(s)
      貞誉志樹,谷津元樹,森田武史
    • Organizer
      人工知能学会第2種研究会 第71回ことば工学研究会
  • [Presentation] 駄洒落を含む対話における可読性と面白さの相関分析2023

    • Author(s)
      花房竜馬, 荒木健治
    • Organizer
      言語処理学会 第29回年次大会 発表論文集
  • [Presentation] 画像キャプション生成に基づく描画内容に即した駄洒落文の選択手法2022

    • Author(s)
      浅野歴,谷津元樹,森田武史
    • Organizer
      2022年度人工知能学会全国大会(第36回)
  • [Presentation] キャプション及び物体認識ラベルを用いた画像に関連する駄洒落文の選択手法2022

    • Author(s)
      浅野歴,谷津元樹,森田武史
    • Organizer
      情報処理学会 第252回自然言語処理研究会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi