Project/Area Number |
06F06775
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 外国 |
Research Field |
Intelligent informatics
|
Research Institution | Hokkaido University |
Principal Investigator |
荒木 健治 Hokkaido University, 大学院・情報科学研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
SJOBERGH Jonas Fredrik 北海道大学, 大学院・情報科学研究科, 外国人特別研究員
|
Project Period (FY) |
2006 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥2,400,000 (Direct Cost: ¥2,400,000)
Fiscal Year 2008: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2007: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2006: ¥300,000 (Direct Cost: ¥300,000)
|
Keywords | ユーモア / 自然言語処理 / ユーモア認識 / ユーモア自動生成 |
Research Abstract |
我々は、第一に、冗談を生成するシステムの研究を継続し、以前開発した日本語の「謎々システム」と「親父ギャグシステム」と同様に「諺システム」も作成した。従来システムより深い意味処理を行った。次に英語のアメリカンジョークの生成アプリケーションを構築した。15種類のジョークのアルゴリズムを実現し、評価を行った。面白さの項目では比較的低く評価されたが、75個のジョークの約半数が、人間が作成したジョークの一番つまらないレベルを面白さの点で超えることができた。 第二にジョークの認識や生成をする時に、汚く下品な言葉が強い影響を及ぼすことを確認した。そのような言葉は一般的な辞書中には少ないため、我々は大規模な「俗悪語の多言語辞書」を作成した。その中には英語・日本語・スウェーデン語・ポーランド語・ブルガリア語が含まれ、全体の単語数は約3200語である。人手による入力によりニュアンス・意味・多義性など、様々な情報も含めた。 第三に、バイリンガルなユーモア処理のために、スウェーデン語・日本語の辞書の研究を以前から行っている。インターネットの「Wikipedia」という膨大な百科事典を利用し、スウェーデン語・日本語の辞書の単語を自動的に増加する手法を開発した。実験の結果、3万語の辞書に更に5万語を追加可能であることを示した。 第四に、ユーモアの評価に様々な要素が影響を及ぼすことがわかったため、その要素に関連した実験も行った。
|