2011 Fiscal Year Annual Research Report

確率的生成モデルの合成による情報アライメントの研究

Research Project

Project/Area Number	23300040
Research Category	Grant-in-Aid for Scientific Research (B)
Research Institution	National Institute of Informatics
Principal Investigator	高須淳宏国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
Co-Investigator(Kenkyū-buntansha)	正田備也長崎大学, 工学(系)研究科(研究院), 准教授 (60413928)
Keywords	機械学習 / 確率モデル / 情報推薦 / トピックモデル
Research Abstract	本研究はテキストの構造情報および時間情報を考慮した情報アライメント法を構築するとともに利用者の利便性を高めるpush型の情報システムへの適用を通してその有効性を評価することを目的としている。本年度は、テキストの時間情報を活用するアライメントモデルの研究を行った。ここでは、テキストの特徴を比較的少数の潜在トピックを用いて表現することによって、効果的にテキスト情報を活用することを目指している。テキストの背景にあるトピックは時間とともに大きく変化することが予想される。そこでトピックの集合はすべての時間に共通であるが、その流行は時間とともに変化すると考えてモデルを構築した。このモデルはトピックの比率を表す多項分布と、トピックと実際のテキスト中に現れる語との関係を表す多項分布を用いて構成される。ここで、トピックの比率を表す多項分布を時間の関数と考えモデルのパラメタを推定するベイズ推定法を開発した。学術論文や新聞記事などのテキストを用いて評価実験を行い、確率モデルの評価指標の一つであるperplexityを用いて他のモデルと比較をしたところ、高いperplexityを持つモデルが得られることが実験的に示された。潜在トピックモデルの情報推薦システムへの適用を図った。推薦システムでは、利用者の嗜好性を表すratingデータより、各利用者のモデルを得る必要がある。しかし、利用者から得られるratingのデータは非常に限られており、結果としてモデルの推定に利用できるデータには多くの欠損値が含まれることになる。そこで、比較的少数の潜在トピックを用いることによって、限られたデータから各利用者の嗜好性の特徴を得ることを試みた。映画のデータを用いた評価実験によって、潜在トピックは特にrating数が少ない場合に他の方法と比較して効果的な利用者の特徴が得られることを示した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本年度計画していたアライメントモデルの構築の課題、特に、時間の情報を活用したモデルについては、当初計画どおりにモデルの構築を行うことができた。また、push型の情報システムへの応用として、推薦システムをとりあげ、その課題の一つである欠損値を補うのに提案の枠組みが有効であることを示すことができ、この点についても計画通りに研究を進めることができた。評価に当たっては、当初計画以上に大規模データを収集することが必要であることが判明したため、平成２４年度もデータの収集を継続した。
Strategy for Future Research Activity	平成２３年度と同様に、基本的なモデルの構築・展開とプッシュ型情報システムへの応用を通した評価を研究分担者とともにすすめる。データの収集、評価実験については、大学院学生等による研究補助を強化する。

Research Products
(3 results)

All 2011

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (1 results)

[Journal Article] Steering Time-Dependent Estimation of Posteriors with Hyperparameter Indexing in Bayesian Topic Models2011
- Author(s)
  Tomonari Masada, Atsuhiro Takasu, Yuichiro Shibata, Kiyoshi Oguri
- Journal Title
  
  Advances in Knowledge Discovery and Data Mining, Lecture Note in Artificial Intelligence
  
  Volume: 6634 Pages: 435 - 447
- DOI
  10.1007/978-3-642-20841-6_36
- Peer Reviewed
[Journal Article] Semi-supervised Bibliographic Element Segmentation with Latent Permutations2011
- Author(s)
  Tomonari Masada, Atsuhiro Takasu, Yuichiro Shibata, Kiyoshi Oguri
- Journal Title
  
  Digital Libraries: For Cultural Heritage, Knowledge Dissemination, and Future Creation, Lecture Note in Computer Science
  
  Volume: 7008 Pages: 60 - 69
- DOI
  10.1007/978-3-642-24826-9_11
- Peer Reviewed
[Presentation] A Multicriteria Recommendation Method for Data with Missing Rating Scores2011
- Author(s)
  Atsuhiro Takasu
- Organizer
  International Conference on Data and Knowledge Engineering (ICDKE 2011)
- Place of Presentation
  Milan, Italy
- Year and Date
  20110906-20110908

2011 Fiscal Year Annual Research Report

確率的生成モデルの合成による情報アライメントの研究

Principal Investigator

高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Steering Time-Dependent Estimation of Posteriors with Hyperparameter Indexing in Bayesian Topic Models2011

Author(s)

Journal Title

DOI

[Journal Article] Semi-supervised Bibliographic Element Segmentation with Latent Permutations2011

Author(s)

Journal Title

DOI

[Presentation] A Multicriteria Recommendation Method for Data with Missing Rating Scores2011

Author(s)

Organizer

Place of Presentation

Year and Date

高須淳宏国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)