2007 Fiscal Year Annual Research Report
共起情報格納型のトライ構造を利用した単語概念知識獲得と意味理解への応用
Project/Area Number |
18700152
|
Research Institution | The University of Tokushima |
Principal Investigator |
森田 和宏 The University of Tokushima, 大学院・ソシオテクノサイエンス研究部, 講師 (20325252)
|
Keywords | 共起情報 / トライ構造 / 概念知識 |
Research Abstract |
19年度は,18年度に開発した共起情報を効率よく格納する辞書構造を用いて,概念知識構築アルゴリズムの提案と,エンジンの開発,システム評価を次の順序で行った. 1.概念知識構築アルゴリズムの考案 18年度に提案した,共起情報から係り語を意味的に分類するアルゴリズムを元に,分類したグループ間の上位下位関係を決定する手法の考案を行った.具体的には,係り語の持つ受け語群の頻度などから生成される特徴ベクトルを,分類したグループごとにも生成し,グループ間の距離尺度を元に上位下位関係を決定する.この処理は,係り語を意味的に分類する処理と同時に行うつまり,類似度判定によって係り語を分類する際に,どのグループにも属さなかった係り語は独自のグループを形成し,グループ間の距離尺度による上位下位の決定が行われる.このため,一単語単位での更新に対応し,分類結果を同一辞書内に格納できる構造を踏襲している. 2.システムの開発と評価 概念知識構築アルゴリズムを実現するプロトタイプシステムの開発を行った.このシステムは,共起情報とその頻度の集合を入力として与えると,分類結果を辞書に格納する.入力に与える共起情報に制限はなく,例えば係り語と受け語の関係を与えれば単語の概念分類に,文書とキーワードの関係を与えれば文書分類に利用できると考えられ,応用性の高いシステムとなっている.また,Webから収集した文書から共起情報を抽出してシステムに与え,分類精度などの評価を行った.
|
Research Products
(3 results)