研究課題/領域番号 |
09680393
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 岐阜大学 |
研究代表者 |
池田 尚志 岐阜大学, 工学部, 教授 (10232183)
|
研究分担者 |
兵藤 安昭 岐阜大学, 工学部, 助手 (50293543)
|
研究期間 (年度) |
1997 – 1999
|
研究課題ステータス |
完了 (1999年度)
|
配分額 *注記 |
1,100千円 (直接経費: 1,100千円)
1999年度: 600千円 (直接経費: 600千円)
1998年度: 500千円 (直接経費: 500千円)
|
キーワード | 全文検索 / 係り受け関係 / 構文解析 / 文節解析 / 近接条件 / 日本語 / フレーズ検査 / 分節解析 / 適合率 / フレーズ検索 |
研究概要 |
情報検索では、従来は文字列あるいは単語をキーとして、AND/OR条件や近接演算による検索条件を用いた検索が行われてきた。本研究では、さらに係り受け共起関係をも検索条件として扱える全文検索システムの構築を目的とし、そのための基礎となる日本語文の文節解析、係り受け解析方式についての研究と、それを用いた検索システムについての研究を行った。解析システムについては、PC上の日本語文解析システムIBUKIを開発した。解析精度は現在、文節解析が99%以上、係り受け解析が90%程度である。現在さらなる精度向上を目指して、複合語の解析法についてはオートマトンを用いる方法での検討を進めており、また文節解析法に関しては、単語間の接続規則ないし接続確率に基づく従来の方法に換えて、基本的に(ほとんど)全ての機能語列を辞書に登録してしまう長単位機能語辞書による全く新しい考え方による方法の可能性について研究を進めている。検索システムについては、新聞記事、特許公報、和英辞典等を対象に、係り受け条件をも指定できるシステムを試作した。近接演算を用いた場合と係り受け関係を用いた場合の比較では、係り受け関係を用いる場合の適合率が、おおむね84%から96%に向上するという実験結果を得ている。
|