研究課題/領域番号 |
21240011
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
中川 裕志 東京大学, 情報基盤センター, 教授 (20134893)
|
研究分担者 |
吉田 稔 東京大学, 情報基盤センター, 助教 (40361688)
清田 陽司 東京大学, 情報基盤センター, 助教 (10401316)
佐藤 一誠 東京大学, 情報基盤センター, 助教 (90610155)
|
連携研究者 |
二宮 崇 東京大学, 情報基盤センター, 講師 (20444094)
|
研究期間 (年度) |
2009 – 2012
|
キーワード | 知識発見 / データマイニング / 機械学習 / テキストマイニング / Web |
研究概要 |
2009年度は当初の予定通り、Webにおける人名検索結果を同姓同名であるが異なる人物ごとにまとめるクラスタリングシステムを開発し、実験的に評価した。2010年度は大規模データ処理のために非負の確率行列分解アルゴリズムを提案し、既存のLDAと同様な性能を得ることを実証し、並列化アルゴリズムにおいては変分ベイズ法をロングテールに対応するPitMan-Yoモデルに適用し高い性能を得た。2011年度は最近注目されているプライバシー保護データマイニングをネットワークデータに応用した。2012年度は、プライバシー保護データマイニングの応用手法と大規模データに適したオンライン学習で、新規な正則化手法を提案した。
|