2012 Fiscal Year Annual Research Report
医療情報テキストを対象にしたノントピカルカテゴリに対する自動分類手法の基礎的研究
Project/Area Number |
22500220
|
Research Institution | Kyushu University |
Principal Investigator |
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | ノントピカルカテゴリ / 医療情報 / テキスト自動分類 |
Research Abstract |
本研究では、ウェブ上の医療情報を対象にノントピカルカテゴリのラベルを付与することが目的である。研究計画の時点では医療情報を対象にしていたが、昨年度までの調査などから、ウェブ上での医療情報が様々な形で提供されていることやユーザの情報ニーズが多様化しているため、まずは、ウェブ上の医療情報の提供の実態を把握することと、他のドメインを対象にしたノントピカルカテゴリに対する分類とに分けて行った。 他のドメインを対象にした自動分類では、昨年度に引き続き、ノントピカルカテゴリとして「学術論文」を設定し、ウェブ上に存在するPDFファイルの中から学術論文を自動判定する検索エンジンのプロトタイプを構築し評価した。さらに、学術論文の構造という点に着目し、文献調査、ウェブ上に存在している学術論文の構造調査を行った。その結果、序論、手法、結果、考察(IMRAD)などの構造を持つ学術論文が多いことや分野に依存しない学術論文に特有に使われる表現などがあることが明らかになった。これらをもとに、学術論文の自動判定ルールを精緻化し、実際のPDFファイルを用いて評価した。これらの結果から、テキスト中の語の出現回数の情報を利用しなくても、テキストの構造の情報やある特定の語を用いることにより、テキストの特性を判定することができる可能性が明らかになった。 医療情報に対しては、病状などを検索語として用い、検索エンジンを用いて、ウェブ上の医療情報を収集した。これらの集合に、ノントピカルカテゴリの対象である「対象とする読者」「信憑性」「読者レベル」「書かれた観点」、およびキーワードなどを付与した小さなサンプル集合を作成した。これらの集合からウェブ上で提供されている医療情報の特徴の分析を行なった。また、学術論文の自動判定から得られた知見から、ノントピカルカテゴリを表現する特有の構造や表現が存在するかを検討した。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
-
-
-
-
-
-
-
-
-
[Presentation] Content Analysis for Values Elicitation2012
Author(s)
Kenneth R. Fleischmann, Doug Oard,An-Shou Cheng, Jordan Boyd-Graber,Thomas Clay Templeton, Emi Ishita,Jes A. Koepfler, and William A. Wallace.
Organizer
CHI 2012 Workshop on Methods for Accounting for Values in Human-Centered Computing
Place of Presentation
Austin, USA
Year and Date
20120500
-
[Book] 図書館情報学2013
Author(s)
上田修一,倉田敬子編著, 安形輝ほか著
Total Pages
166-171, 180-182(担当執筆部分)
Publisher
勁草書房