研究課題
我々は、第一に、冗談を生成するシステムの研究を継続し、以前開発した日本語の「謎々システム」と「親父ギャグシステム」と同様に「諺システム」も作成した。従来システムより深い意味処理を行った。次に英語のアメリカンジョークの生成アプリケーションを構築した。15種類のジョークのアルゴリズムを実現し、評価を行った。面白さの項目では比較的低く評価されたが、75個のジョークの約半数が、人間が作成したジョークの一番つまらないレベルを面白さの点で超えることができた。第二にジョークの認識や生成をする時に、汚く下品な言葉が強い影響を及ぼすことを確認した。そのような言葉は一般的な辞書中には少ないため、我々は大規模な「俗悪語の多言語辞書」を作成した。その中には英語・日本語・スウェーデン語・ポーランド語・ブルガリア語が含まれ、全体の単語数は約3200語である。人手による入力によりニュアンス・意味・多義性など、様々な情報も含めた。第三に、バイリンガルなユーモア処理のために、スウェーデン語・日本語の辞書の研究を以前から行っている。インターネットの「Wikipedia」という膨大な百科事典を利用し、スウェーデン語・日本語の辞書の単語を自動的に増加する手法を開発した。実験の結果、3万語の辞書に更に5万語を追加可能であることを示した。第四に、ユーモアの評価に様々な要素が影響を及ぼすことがわかったため、その要素に関連した実験も行った。
すべて 2008 2007
すべて 雑誌論文 (5件) (うち査読あり 5件) 学会発表 (3件)
Large-Scale Khowledge Resources, lecture Notes in Artificial Intelligence Series 4938
ページ: 59-66
To appear in Proceedings of LREC 2008
Applications of Fuzzy Sets Theory(Proceedings of WILF 2007)Lecture Notes in Artificial Intellignece Series 4578
ページ: 469-476
Proceedings of Nodalida 2007
ページ: 389-393