• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1997 年度 実績報告書

概念を用いた情報科学分野の論文検索

研究課題

研究課題/領域番号 09480076
研究機関奈良先端科学技術大学院大学

研究代表者

中村 恭之  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (50291969)

研究分担者 藤川 和利  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (30252729)
キーワード電子図書館 / 概念検索 / 文献検索 / 情報検索
研究概要

研究目的を達成するため,本年度は日本語科学技術文献からの概念の抽出と日本語キーワードからの概念抽出を行った.また,抽出された概念を用いた検索方法の基礎的な検討も合わせて行った.日本語科学技術文献からの概念の抽出については,本学で開発された日本語形態素解析システム「茶筅」を用いて単語の区切りの発見を行い,名詞のみを抽出した.なお,日本語文献としては本学附属電子図書館が保有するデータを利用した.このデータは光学的文字認識装置を用いて画像から認識されたものであり,認識誤りを含む不完全なものである.抽出した名詞について,電子化辞書の中の概念辞書を用いて単語の概念を抽出し,さらに抽出した概念の上位概念も同時に調べた.これより概念空間を構成する.概念空間は単語ごとに生成するのではなく,各単語が持つ概念空間を統合して概念空間の絞り込みを行う.また,単語の出現頻度を調べ,概念空間の絞り込みに用いる.
以上に述べたような手法を実際に実装し,実験を行った.データとして電子情報通信学会論文誌D-IIの78巻7号を用いた.情報科学分野の素養がある被験者に対して,システムが抽出した論文の概念が妥当かどうかのアンケートを実施したところ,平均で10.6点の評価が得られた.(満点は15点)論文ごとに評価が大きく異なったが,電子化辞書に適切な概念が収録されていない単語を含む論文の評価が特に低かった.また,形態素解析システムの不的確な連接規則により,適切な単語抽出が行われなかった論文の評価が低かった.キーワードからの概念抽出も行い,概念どうしで論文検索を行う実験も行った.この実験については,データの収集が終了したところであり,次年度にはその評価を行う予定である.また,英語文献についても同様の手法を適用し,その有効性を確認することも今後の予定である.

  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] Rei Suzuki, Kideki Sunahara, Masakazu Imai, Kunihiro Chihara: "Building Digital Library System-NAIST Challenge-" Proceedings of International Symposium on Research,Development & Practice in Digital Libraries.(1997)

  • [文献書誌] Chinatsu Horii, Masakzu Imai, Kunihiro Chihara: "An Information Retrieral using Corceptual Index Term for Technical Paper on Digital Library" Proceedings of International Sysposium on Research,Development & Practice in Digital Libraries. (1997)

URL: 

公開日: 1999-03-15   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi