2021 Fiscal Year Research-status Report
Development of standard database for evaluating the fun of humor considering contextual information
Project/Area Number |
21K12007
|
Research Institution | Hokkaido University |
Principal Investigator |
荒木 健治 北海道大学, 情報科学研究院, 特任教授 (50202742)
|
Co-Investigator(Kenkyū-buntansha) |
佐山 公一 小樽商科大学, 商学部, 教授 (90271733)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
谷津 元樹 青山学院大学, 理工学部, 助教 (30805015)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ユーモア / 駄洒落 / 文脈情報 / 面白さ |
Outline of Annual Research Achievements |
R3年度は,主にTwitter上のデータを用いて駄洒落が出現する前後の文脈情報の収集を行なった.収集の対象とした駄洒落はまだ1000件程度と少ないため次年度以降にこれまでに開発し公開している67000件の駄洒落データベースに登録されている駄洒落を用いてより大規模に文脈を収集する予定である. Twitter上の駄洒落を収集し,分析した結果については,R4年1月に開催された国際会議Twenty-Seventh International Symposium on Artificial Life and Robotics(AROB 27th 2022)において発表を行なった.また,駄洒落の文脈情報による面白さの増大を実証するために駄洒落を対話型に変化させ文脈情報を付加した場合の面白さの変化を評価する実験を行なった.この結果についてR4年1月に開催された第12回言語獲得と理解研究会において発表を行なった. また,研究分担者である谷津は重畳型駄洒落ユーモアにおける常識的知識グラフを用いた潜在表現の抽出について研究を進め,背景知識,常識などの大きな意味での文脈情報を抽出する手法の開発を行い,その評価実験を行なった.この結果は,R4年3月に開催された言語処理学会第28回年次大会において研究発表を行なった. また,研究分担者の内田は,文脈中に含まれるオノマトペが面白さにどのように影響しているのかの考察を行なった.この結果は,次年度発表する予定である. さらに,研究分担者の佐山は,認知科学的視点から面白さの要因の分析を行なった.この結果についても次年度以降において研究発表を行う予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の最終目的は,文脈を考慮したユーモアの面白さを評価するための標準データベースの開発を行うことである. この観点からR3年度はTwitterという非常に大規模なコーパスから代表的なユーモアである駄洒落について我々が開発済みの駄洒落データベースを用いて文脈情報の収集を行い,その結果の分析を行なった.まだ,1000件程度の駄洒落に対しての文脈情報なので次年度以降にさらに大規模な駄洒落に対する文脈情報を収集を行わないと文脈を考慮したユーモアを評価するために十分な規模の標準データベースを開発したことにならないが,現時点で得られた結果だけでも文脈情報がユーモアに与える影響について種々の興味深い結果が得られてきており,今後の進展に大きな期待を抱かせるものであった.また,広い意味での文脈情報である背景知識,常識が与える影響についてもその抽出,分析が進んでいる. これらの結果から初年度の進捗状況としてはおおむね順調に進展しているものと考えている.
|
Strategy for Future Research Activity |
今後の研究の推進方策については,第一に現在1000件程度までしか進んでいない駄洒落の文脈情報をTwitter上のデータを用いて収集する作業をさらに大規模に進めることである.最終的には開発済みの駄洒落データベースに収録されている67000件全ての駄洒落に対して文脈情報を収集する予定であるが,1000件程度の文脈情報でも極めて膨大なデータとなるためその保存方法,公開方法についての検討を行う必要がある. また,次年度以降は現在文脈情報を収集する対象としているTwitterだけではなく,多くの別の対話コーパスを用いて文脈情報を収集する予定である.Twitterは会話しているような形態で書かれているがテキスト入力であるため書き言葉である.口頭で話された際のユーモアの文脈情報も収集する必要があるため名大コーパス,日常対話コーパスなどの口頭での会話を書き起こしたコーパスより文脈情報を収集することも予定している
|
Causes of Carryover |
当初の計画では,研究成果を発表する際に旅費を使用する予定であったが,コロナ禍のため全てオンラインによる発表となりました.また,研究分担者が一堂に介して対面で打ち合わせを行う予定であったが,これもコロナ禍のためオンラインでの実施としました.このため旅費の支出がなくなり次年度使用額が生じました.
|
Research Products
(3 results)