2010 Fiscal Year Annual Research Report
階層型確率モデルに基づく画像表現とその応用に関する研究
Project/Area Number |
20500129
|
Research Institution | Shinshu University |
Principal Investigator |
丸山 稔 信州大学, 工学部, 准教授 (80283232)
|
Keywords | 確率モデル / トピックモデル / 文書分類 / 機械学習 / 画像識別 / pLSAモデル |
Research Abstract |
本年度の研究においては、階層型確率モデル(確率的トピックモデル)を用いた推論方式、階層型識別器を用いた識別方式に関する検討を行い、従来研究対象としていた文書画像分類に加えて、画像をその一部に含む文書を対象として、通常の文書及び画像に関する確率モデル構築および統合に関する研究とその有効性の検証を実施した。対象としては画像と文書(テキスト)から成るドキュメントとして、CG関連の学会であるSIGGRAPHの10年分の論文集合を用いた。これまでの研究で実施してきた画像特徴抽出とpLSAモデル学習に加え、文書(テキスト)部分に関してもpLSAモデルを学習して追加した統合モデルを用いてトピック比に基づく文書分類性能を、テキストのみのpLSAモデル等と比較した。分類結果は学習・モデル獲得には用いていない情報である論文のセッション分類との照合を通して行った。手法の優劣の明確な結論を出すのは困難であったが、少なくとも画像・文書の統合モデルは単純なテキストに基づくpLSAモデルと同等以上の分類性能を有し、いくつかの事例についてはテキストだけからは検出できなかった類似論文の検索が可能であったことを確認した。本研究ではこれまで定常的な確率的トピックモデル(pLSA)を想定してきたが、対象によっては、このトピックが動的に変化することが考えられる。トピック変化には量的変化と質的変化が考えられるが、質的変化について、年次が隣接するコーパス間での各トピックに付随した単語出現確率の類似度計算に基づいてトピックが大きく変動している箇所を検出するとともに、どのような変化をもたらしているかを示す単語を提示するための手法を考案し、上述の論文集合を用いて検証実験を行った。
|
Research Products
(1 results)