1997 Fiscal Year Annual Research Report
Project/Area Number |
09480076
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
中村 恭之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (50291969)
|
Co-Investigator(Kenkyū-buntansha) |
藤川 和利 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (30252729)
|
Keywords | 電子図書館 / 概念検索 / 文献検索 / 情報検索 |
Research Abstract |
研究目的を達成するため,本年度は日本語科学技術文献からの概念の抽出と日本語キーワードからの概念抽出を行った.また,抽出された概念を用いた検索方法の基礎的な検討も合わせて行った.日本語科学技術文献からの概念の抽出については,本学で開発された日本語形態素解析システム「茶筅」を用いて単語の区切りの発見を行い,名詞のみを抽出した.なお,日本語文献としては本学附属電子図書館が保有するデータを利用した.このデータは光学的文字認識装置を用いて画像から認識されたものであり,認識誤りを含む不完全なものである.抽出した名詞について,電子化辞書の中の概念辞書を用いて単語の概念を抽出し,さらに抽出した概念の上位概念も同時に調べた.これより概念空間を構成する.概念空間は単語ごとに生成するのではなく,各単語が持つ概念空間を統合して概念空間の絞り込みを行う.また,単語の出現頻度を調べ,概念空間の絞り込みに用いる. 以上に述べたような手法を実際に実装し,実験を行った.データとして電子情報通信学会論文誌D-IIの78巻7号を用いた.情報科学分野の素養がある被験者に対して,システムが抽出した論文の概念が妥当かどうかのアンケートを実施したところ,平均で10.6点の評価が得られた.(満点は15点)論文ごとに評価が大きく異なったが,電子化辞書に適切な概念が収録されていない単語を含む論文の評価が特に低かった.また,形態素解析システムの不的確な連接規則により,適切な単語抽出が行われなかった論文の評価が低かった.キーワードからの概念抽出も行い,概念どうしで論文検索を行う実験も行った.この実験については,データの収集が終了したところであり,次年度にはその評価を行う予定である.また,英語文献についても同様の手法を適用し,その有効性を確認することも今後の予定である.
|
-
[Publications] Rei Suzuki, Kideki Sunahara, Masakazu Imai, Kunihiro Chihara: "Building Digital Library System-NAIST Challenge-" Proceedings of International Symposium on Research,Development & Practice in Digital Libraries.(1997)
-
[Publications] Chinatsu Horii, Masakzu Imai, Kunihiro Chihara: "An Information Retrieral using Corceptual Index Term for Technical Paper on Digital Library" Proceedings of International Sysposium on Research,Development & Practice in Digital Libraries. (1997)