研究課題/領域番号 |
19700232
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
情報図書館学・人文社会情報学
|
研究機関 | 駿河台大学 |
研究代表者 |
石田 栄美 駿河台大学, 文化情報学部, 准教授 (50364815)
|
研究期間 (年度) |
2007 – 2009
|
研究課題ステータス |
完了 (2009年度)
|
配分額 *注記 |
3,580千円 (直接経費: 3,100千円、間接経費: 480千円)
2009年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2008年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2007年度: 1,500千円 (直接経費: 1,500千円)
|
キーワード | テキスト自動分類 / 非主題カラゴリ / ウェブページ / 自動分類 / Schwartz Values Inventory / Non-topical classification / Schwartz Values Inventorv / 生存分析 / PDFファイル |
研究概要 |
本研究では、主題カテゴリに加えて、文書タイプ、対象者などウェブページが持つ様々な属性や非主題カテゴリなど多様な観点からの分類の可能性を検討することが目的である。この目的に従い、本研究期間に2種の自動分類について検討した。ひとつは、ウェブ上である学術論文を自動的に判別するサーチエンジンの開発である。これは、文書タイプによる分類といえる。ウエブ上からPDFファイルを自動的に収集し、ファイルに出現する語彙などの属性を用いて自動分類を行った。もうひとつは、非主題カテゴリとして人の価値観を表すカテゴリセットを設定し、米国の公聴会での証言の自動分類を試み、非主題カテゴリに対する分類の可能性を検討した。まず、自動分類のためのテストコレクションを作成し、自動分類実験を行った。自動分類に用いた手法は基本的な手法のみであるが、結果は将来的な可能性を示唆するものであった。
|