• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

医療情報テキストを対象にしたノントピカルカテゴリに対する自動分類手法の基礎的研究

研究課題

研究課題/領域番号 22500220
研究機関駿河台大学

研究代表者

石田 栄美  駿河台大学, メディア情報学部, 准教授 (50364815)

キーワードノントピカルカテゴリ / 医療情報 / テキスト自動分類 / 学術論文
研究概要

本研究では、ウェブ上の医療情報を対象にノントピカルカテゴリのラベルを付与することが目的である。研究計画の時点ではノントピカルカテゴリを想定していたが、実際の医療情報やユーザが求める情報に適したカテゴリを設定することが必要だと考えた。そのため、本年度は、まず、ウェブ上の医療情報を対象に内容の評価や内容分析を行っている文献の調査を行い、どのような項目を用いてウェブ上の医療情報を評価しているかを調査した。今後は、ユーザがどのような情報を求めているかを調査した文献も検討し、適切なノントピカルカテゴリの検討を行う。
また、ノントピカルカテゴリとして「学術論文」を設定し、ウェブ上のPDFファイルを対象に学術論文が否かを判定する実験を行った。この実験では、まず、学習用データを作成するために、WordNet日本語版とIPAdicの両方にエントリされている名詞を検索語とし、ウェブ上の検索エンジンのAPI(Yahoo! Search BOSS)を用いて約660万件のURLを取得した。これらのURL集合からランダムに選択しダウンロード可能だった2万件に対して、学術論文か否かの判定を人手で行った。これらのデータを学習用データとして複数の分類器による学術論文の自動判定を行った。分類器に入力した特徴素は、ファイルの大きさ、ページ数、URLのドメインなどファイルの形態的属性と、論文の特徴を表すと考えられるファイル中に出現する特定の語である。来年度は、この実験と同様のアプローチで、ウェブ上の医療情報を収集し学習用データを作成する予定である。また、収集した医療情報は、専門家向けと一般人向けとに分ける予定であるが、この学術論文の自動判定の成果を適用する予定である。

  • 研究成果

    (7件)

すべて 2011 2010

すべて 雑誌論文 (1件) 学会発表 (5件) 図書 (1件)

  • [雑誌論文] テキスト自動分類をめぐる現況2011

    • 著者名/発表者名
      石田栄美
    • 雑誌名

      現代の図書館

      巻: 48(4) ページ: 211-216

  • [学会発表] Investigating Multi-Label Classification for Human Values2010

    • 著者名/発表者名
      Emi Ishita, Douglas W.Oard, Kenneth R.Fleischmann, An-Shou Cheng, Thomas Clay Tempteton
    • 学会等名
      Annual Conference of the Association for Information Science and Technology(ASIST2010)
    • 発表場所
      Pittsburgh, USA
    • 年月日
      20101000
  • [学会発表] 学術情報に特化した検索エンジンの開発:機械学習による英語論文の自動判定2010

    • 著者名/発表者名
      安形輝, 池内淳, 石田栄美, 宮田洋輔, 上田修一
    • 学会等名
      第58回日本図書館情報学会研究大会発表要綱,p.81-84
    • 発表場所
      北海道、藤大学
    • 年月日
      20101000
  • [学会発表] A search engine for Japanese academic papers2010

    • 著者名/発表者名
      Emi Ishita, Teru Agata, Atsushi Ikeuchi, Nozue Michiko, Yosuke Miyata, Shuichi Ueda
    • 学会等名
      Proceedings of Joint JCDL/ICADL International Digital Libraries Conference(JCDL10)
    • 発表場所
      Gold Coast, Australia
    • 年月日
      20100600
  • [学会発表] Analyzing viewing patterns while reading picture books2010

    • 著者名/発表者名
      Emi Ishita, Shinji Mine, Chihiro Kunimoto, Junko Shiozaki, Keiko Kurata, Shuichi Ueda
    • 学会等名
      Proceedings of Joint JCDL/ICADL International Digital Libraries Conference(JCDL10)
    • 発表場所
      Gold Coast, Australia
    • 年月日
      20100600
  • [学会発表] 学術論文PDFの自動判定:学習用集合が判定性能に与える影響2010

    • 著者名/発表者名
      宮田洋輔, 安形輝, 池内淳, 石田栄美, 上田修一
    • 学会等名
      2010年日本図書館情報学会春季研究集会発表要綱,p.71-74
    • 発表場所
      京都府、同志社大学
    • 年月日
      20100500
  • [図書] 情報検索演習(JLA図書館情報学テキストシリーズII 6)2011

    • 著者名/発表者名
      大谷康晴、安形輝、石出栄美、中島玲子
    • 総ページ数
      142
    • 出版者
      日本図書館協会

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi