Budget Amount *help |
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2001: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2000: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Research Abstract |
研究成果は以下の通りである. 【研究項目1】共起関係の抽出法と格納構造の提案 本研究では共起関係(語句間の意味的関係に着目し,同一文内に出現する語句)を利用する.共起関係の抽出には形態素解析エンジンyukidaruma(徳島大学青江研究室)を用い,名詞句の関係を解析した. 【研究項目2】共起関係の格納構造の提案 共起関係と概念階層を自動構築し,検索情報に利用するためには,高速でコンパクトなデータ構造が必要不可欠であるので,研究成果1のグラフ構造を階層知識表現に利用し,共起関係のデータ構造は,階層知識を自動推論するので,ダブル配列を利用した高速なトライ構造を用いて実装した. 【研究項目3】共起関係から語彙のグループ化手法の提案 研究項目1で定義された共起関係から,名詞句を基準として,クラスタリングを行うことにより,語彙のグループ化手法を提案した. 【研究項目4】階層的概念体系の構築法の提案 研究項目3でボトムアップ式に作成されたグループ情報から,概念検索(抽象的な検索)を行うために,動詞(用言全体)を基準にして名詞句の概念を階層化する手法を提案する.本手法の階層構造は,複数の階層視点が存在する構造として,研究成果1のグラフ構造(トライ法により実現)として構築する. 【研究項目5】共起関係と階層概念を利用した検索手法の提案 こちらはKES2001の発表論文にあるように,本手法をLAN内での文書ファイル共有システムに用いた.文書ファイルから共起関係の抽出,階層化を行い,検索DBを作成した. 【研究項目6】大規模な文書データに対する評価 こちらはKES2001の発表論文に示す通り,検索エンジンHIHO Searchの協力を得て,共起関係の抽出及び階層化を行っている段階である.論文に用いた結果には毎日新聞の'94,'95年データ(約15,000記事)を用いている.
|