研究概要 |
本年度は,本研究課題の最終目標である言語・時代・文化横断型の情報アクセスの実現に向けて,以下の3つの研究を中心に行った. 1. 古文並列コーパスを利用した時代横断対訳辞書の構築 古文の現代語による検索および古文テキストマイニングの実現に必要となる現代語-古語間の対訳辞書を,重文とその現代語訳の並列コーパスから自動的に構築する研究を行った.『源氏物語』の原文とその現代語訳を用いた実験において,古文テキスト中に現れる固有名詞を除去することにより,除去しない場合と比較して精度が向上することが確かめられた. 2. 古典史料に対するテキストマイニングおよび可視化 主に日記形式の古記録から人名・地名などの固有表現を抽出し,可視化する手法について研究を行った.平安時代の古記録『兵範記』の原文テキストから,人名とその人名が出現した日付の情報を抽出して時系列で可視化する手法および,人名と地名・建造物名の関係を時系列で可視化する手法を提案した.また,古典史料テキストに現れる二人の人物間の関係を,別の第三者を介した共起により推定する「推移的共起」を用いたテキストマイニング手法の提案および,抽出した人物関係の散布図による可視化を行った. 3. 多言語検索における言語横断キーワード抽出システムの構築 Web上の多言語検索サービスにおいて,検索結果のリストから利用者が必要なページを見つけることを支援するため,スニペット(ページの抜粋)の翻訳に加えてページ中の重要なキーワードを自動抽出し,利用者に提示する手法について研究を行った.利用者による評価実験の結果,提案手法により検索結果の内容の把握が容易になることが確かめられた.
|