1998 Fiscal Year Annual Research Report
Project/Area Number |
09680393
|
Research Institution | Gifu University |
Principal Investigator |
池田 尚志 岐阜大学, 工学部, 教授 (10232183)
|
Co-Investigator(Kenkyū-buntansha) |
兵藤 安昭 岐阜大学, 工学部, 助手 (50293543)
|
Keywords | 全文検索 / フレーズ検査 / 係り受け関係 / 構文解析 / 分節解析 / 適合率 |
Research Abstract |
情報検索では、従来は単語をキーとする検索が行われてきたが、単語に限らず句(複数の単語からなるまとまった表現)をキーとした検索もできれば、ユーザは検索の意図をより的確に表現することができる。句は係り受け関係をもつ単語の集まりとして捉えることができる。本年度の研究では、そのための自然言語処理システムを確立するために、昨年度試作した日本語文の形態素解析・構文解析システムに改良を加え、PC上の日本語文解折システムとして統合した。現在のところ、解析精度は文節解析が98%程度、構文解析が90%程度である。また、固有名詞などの未登録語の問題とも絡んで複合語の解析は大きな問題であるが、本年度は漢字複合語の単語分割、構造解析の処理手法について研究した。これらの解析システムを用いて、新聞記事を対象とした情報検索システムを試作した。複合語の解析を含めた解析精度の更なる向上と、検索文作成の際のシソーラスなど関連語に関する扱いが今後の課題である。
|
-
[Publications] 兵藤安昭, 池田尚志: "文節単位のコスト最小法による日本語形態素解析" 電子情報通信学会言語理解とコミュニケーション研究会. NLC98-2. 9-14 (1998)
-
[Publications] 兵藤安昭, 共田光敏, 池田尚志: "分節ブロック間規則による浅い係り受け解析と精度評価" 電子情報通信学会言語理解とコミュニケーション研究会. NLC98-30. 33-39 (1998)
-
[Publications] Y.Hyodo, K.Niimi, T.Ikeda: "Conparison between proximity operation and dependency operation in Japanese full text cetrienal" Prov.of the 21st Annical International ACM SIGIR Condence. sigzR'98. 341-342 (1998)