研究概要 |
【研究項目1】共起関係の抽出法と格納構造の提案 共起関係の抽出については,形態素解析の出力結果に対し,用言区の格構造に注目して抽出ルールを設定した.そして抽出した共起関係については,雑誌論文「A fast and compact technique of implementing transition tables for finite state automata」と研究代表者の論文「格構造における概念判定の効率的判定アルゴリズム」の手法を組み合わせて構築する.現状では,プログラムのプロトタイプを作成し,約1万4千件の新聞データから共起関係を抽出,格納の予備実験を行った.その結果役6万3千件の共起関係を抽出した. 【研究項目2】共起関係から語彙のグループ化手法の提案 共起関係から語彙のグループ化については,項目1で抽出した共起関係に対するクラスタリングアルゴリズムを提案,試行した.その結果,約1万件のグループに分割できた. 作成されたグループと既存の辞書との対応付けについては,現状では共起関係を直感的に掴みにくい構造であることが問題である.従って,現在これを解決するために共起関係を可視化するツールを作成中である. 【研究項目3】階層的概念体系の構築法の提案 概念体系の構築については,共起関係の階層化アルゴリズムを提案,試行した.その結果約1700件,平均階層数4の木構造に階層化できた. 今後より実用的な面での評価を行うために,現在WWW検索エンジンでの利用を模索,交渉中である.
|