研究課題
本研究では、ウェブ上の医療情報を対象にノントピカルカテゴリのラベルを付与することが目的である。研究計画の時点では医療情報を対象にしていたが、昨年度までの調査などから、ウェブ上での医療情報が様々な形で提供されていることやユーザの情報ニーズが多様化しているため、まずは、ウェブ上の医療情報の提供の実態を把握することと、他のドメインを対象にしたノントピカルカテゴリに対する分類とに分けて行った。他のドメインを対象にした自動分類では、昨年度に引き続き、ノントピカルカテゴリとして「学術論文」を設定し、ウェブ上に存在するPDFファイルの中から学術論文を自動判定する検索エンジンのプロトタイプを構築し評価した。さらに、学術論文の構造という点に着目し、文献調査、ウェブ上に存在している学術論文の構造調査を行った。その結果、序論、手法、結果、考察(IMRAD)などの構造を持つ学術論文が多いことや分野に依存しない学術論文に特有に使われる表現などがあることが明らかになった。これらをもとに、学術論文の自動判定ルールを精緻化し、実際のPDFファイルを用いて評価した。これらの結果から、テキスト中の語の出現回数の情報を利用しなくても、テキストの構造の情報やある特定の語を用いることにより、テキストの特性を判定することができる可能性が明らかになった。医療情報に対しては、病状などを検索語として用い、検索エンジンを用いて、ウェブ上の医療情報を収集した。これらの集合に、ノントピカルカテゴリの対象である「対象とする読者」「信憑性」「読者レベル」「書かれた観点」、およびキーワードなどを付与した小さなサンプル集合を作成した。これらの集合からウェブ上で提供されている医療情報の特徴の分析を行なった。また、学術論文の自動判定から得られた知見から、ノントピカルカテゴリを表現する特有の構造や表現が存在するかを検討した。
24年度が最終年度であるため、記入しない。
すべて 2013 2012
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (7件) 図書 (1件)
Library and Information Science
巻: No.68 ページ: p.1-22
日本図書館情報学会誌
巻: Vol. 58, No. 2 ページ: p.97-109