Development of standard database for evaluating the fun of humor considering contextual information
Project/Area Number |
21K12007
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Hokkaido University |
Principal Investigator |
荒木 健治 北海道大学, 情報科学研究院, 特任教授 (50202742)
|
Co-Investigator(Kenkyū-buntansha) |
佐山 公一 小樽商科大学, 商学部, 教授 (90271733)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
谷津 元樹 青山学院大学, 理工学部, 助教 (30805015)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2021: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
|
Keywords | ユーモア / 駄洒落 / 文脈情報 / 面白さ / Twitter / 画像 / 雑談対話システム / 自然言語処理 / データベース |
Outline of Research at the Start |
これまでの研究では文脈情報は1文内の文内文脈に限定され,面白さを誘発する本質的な要因である背景知識,常識,文外文脈などについてはあまり研究されていない.そこで,本研究課題の目的は,文脈情報を考慮したユーモア全般の面白さの評価のための標準的なデータベースを構築し,ユーモア工学確立のための基盤を整備することである.本研究の学術的独自性と創造性は,人間の高度な知的活動であり,芸術的な活動でもある文脈情報を含むユーモアの面白さの自動評価が可能な標準データベースを開発する点にある.
|
Outline of Annual Research Achievements |
R4年度は,R3年度に引き続きTwitter上のデータを用いて駄洒落が出現する前後の文脈情報の収集を行なった.収集の対象とした駄洒落を1,000件から10,000件と10倍まで増加させた.さらに収集した駄洒落を含む対話12,000件に対してクラウドソーシングを用いて面白さの評価を行った.R5年度は最終年度となるのでこれまでに開発し公開している67,000件の駄洒落データベースに登録されている駄洒落を用いてより大規模に文脈を収集する予定である.Twitter上の駄洒落を収集し,面白さを評価した結果については,R5年3月に開催された言語処理学会第29回年次大会において発表を行なった. また,研究分担者である谷津は画像内容に即した語を抽出し,画像の描画内容に即した駄洒落文を選択するためのランキング手法の提案を行った.また,ユーモア性, 理解容易性を考慮した直喩生成には「意外性」「具体性」 が必要という可能性があることを明らかにした.また,ユーモアへの理解を説明可能な動作で示すことのできる対話システムの実現のため,駄洒落の認識,駄洒落応答及びこれらを文脈制御に基づいて使用する駄洒落雑談対話システムの構築を行った.さらに,重畳型駄洒落検出の成功事例, 及び失敗事例における主な失敗要因について分析を行った.これらの結果については,画像ラボ,言語処理学会第29回年次大会,第252回自然言語処理研究会,2022年度人工知能学会全国大会(第36回),第71回ことば工学研究会において発表を行った. また,研究分担者の内田は,引き続き文脈中に含まれるオノマトペが面白さにどのように影響しているのかの考察を行なった.この結果は,次年度発表する予定である. さらに,研究分担者の佐山は,引き続き認知科学的視点から面白さの要因の分析を行なった.この結果についても次年度発表を行う予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
理由 本研究の最終目的は,文脈を考慮したユーモアの面白さを評価するための標準データベースの開発を行うことである. この観点からR4年度はTwitterという非常に大規模なコーパスから代表的なユーモアである駄洒落について我々が開発済みの駄洒落データベースを用いて文脈情報の収集を行い,面白さの評価を行った.R3年度の10倍の量の10,000件の駄洒落に対する文脈情報を収集し,12,000件の駄洒落を含む対話について面白さの評価を行った.次年度はさらに大規模な駄洒落に対する文脈情報の収集を行う予定であるが,文脈情報が駄洒落の面白さに与える影響について種々の興味深い結果が得られてきており,今後の進展に大きな期待を抱かせるものであった.また,画像に即した駄洒落の選択,直喩表現におけるユーモアの利用,文脈に即した駄洒落を生成する雑談対話システムの構築なども行っている. これらの結果から2年度目の進捗状況としてはおおむね順調に進展しているものと考えている.
|
Strategy for Future Research Activity |
今後の研究の推進方策については,第一に現在10,000件の駄洒落まで進んでいる文脈情報をTwitter上のデータを用いて収集する作業をさらに大規模に進めることである.最終的には開発済みの駄洒落データベースに収録されている67,000件全ての駄洒落に対して文脈情報を収集する予定であるが,10,000件の文脈情報でも極めて膨大なデータとなるためその保存方法,公開方法についての検討を行う必要がある. また,次年度は本研究課題の最終年度であるため文脈を含む駄洒落データベースが極めて大容量になることを踏まえ,その公開方法についての検討を進める予定である.さらに,今年度進めた画像に即した駄洒落の選択,直喩表現におけるユーモアの利用,文脈に即した駄洒落を生成する雑談対話システムの構築などについて,性能評価実験を行い,本研究課題で開発した文脈情報を含む駄洒落データベースの応用の可能性についても研究を進める予定である.
|
Report
(2 results)
Research Products
(11 results)