研究課題
若手研究(B)
本研究では、主題カテゴリに加えて、文書タイプ、対象者などウェブページが持つ様々な属性や非主題カテゴリなど多様な観点からの分類の可能性を検討することが目的である。この目的に従い、本研究期間に2種の自動分類について検討した。ひとつは、ウェブ上である学術論文を自動的に判別するサーチエンジンの開発である。これは、文書タイプによる分類といえる。ウエブ上からPDFファイルを自動的に収集し、ファイルに出現する語彙などの属性を用いて自動分類を行った。もうひとつは、非主題カテゴリとして人の価値観を表すカテゴリセットを設定し、米国の公聴会での証言の自動分類を試み、非主題カテゴリに対する分類の可能性を検討した。まず、自動分類のためのテストコレクションを作成し、自動分類実験を行った。自動分類に用いた手法は基本的な手法のみであるが、結果は将来的な可能性を示唆するものであった。
すべて 2010 2009 2008 2007
すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (10件)
文化情報学:駿河台大学文化情報学部紀要 Vol.16、No2
ページ: 53-68
Bulletin of IEEE Technical Committee on Digital Libraries Vol.5,No.3
Journal of Information Science Vol.35,No.4
ページ: 481-495
Library and Information Science No.58
ページ: 69-90