研究課題
本研究は、新約聖書のテキストのXML化、ならびにグラフクラスタリングの結果によるネットワーク描画により、新約聖書の体系化を実現することを目的としている。グラフクラスタリング手法に関しては、Van Dongen(2000)が提唱したMCL(Markov Clustering)やJungら(2006)による、MCLの言語データへ適用で起こる問題を解消するために提案したRMCL(Recurrent Markov Clustering)を使用した。さらに、クラスタリングの結果表示に関しては、インタラクティブなネットワーク表示ができるグラフ描画ツールを導入し、大規模なネットワーク図を表示可能にするようなツールの検討を行った。言語資源として、新約聖書の他に、Joyce氏による日本語連想語データベースをグラフクラスタリングの応用研究の対象とした。ネットワーク基本特徴量から得られた意味ネットワークの構造の特徴をもとに、クラスタリング係数を閾値としてスパースな性質を持つネットワークの高密度の部分を抽出する方法を提案した。また、福音書の登場人物や地名の共起情報に限定して、福音書個別に4種類のソーシャルネットワークを作成し、グラフクラスタリングによるコミュニティの抽出を試みた。これまで適用したハードクラスタリング手法の問題を解決する方法論として、Markov Clusteringとクラスタリング係数を組み合わせたソフトクラスタリング法を適用し、ハードクラスタリング法の単独使用では不可能であった、重要単語が複数コミュニティに含まれるようなクラスターの抽出を実現した。
すべて 2008
すべて 雑誌論文 (5件) (うち査読あり 4件) 学会発表 (2件)
人文科学とコンピュータシンポジウム論文集
ページ: 319-324
In Proceedings of the 3rd Textgraphs workshop on Graph-based Algorithms for NLP
ページ: 57-60
言語文化研究プロジェクト, 電子化言語資料分析研究2007-2008
ページ: 13-22
18th International Congress of Linguists (CIL 18) 1
ページ: 206-207
New Trends in Psychometrics
ページ: 273-280