互いに関連を持つ複数の大規模リレーショナルデータの統合モデリング法
Project/Area Number |
11J07843
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Media informatics/Database
|
Research Institution | The University of Tokyo (2012) Nara Institute of Science and Technology (2011) |
Principal Investigator |
林 浩平 東京大学, 大学院・情報理工学系研究科, 特別研究員(PD)
|
Project Period (FY) |
2011 – 2012
|
Project Status |
Completed (Fiscal Year 2012)
|
Budget Amount *help |
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2012: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2011: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | 機械学習 / データマイニング / 並列計算 / 隠れ変数モデル / 確率モデリング / テンソル / 学習アルゴリズム |
Research Abstract |
今年度に行った研究成果としては主に1.疎なデータに対する効率的な並列計算,2.隠れ特徴モデルを用いた疎な特徴抽出,の二点である.以下それぞれについて記述する. 1.疎なデータに対する効率的な並列計算 大規模データを効率よく計算する一つの方法として並列計算がある.並列計算を用いることで用いた計算ユニット数に比例した速度向上が望める.しかしながら,与えられたデータが疎な場合,計算ユニットごとに計算負荷が異なるため,一般的に総計算時間が線形に減少しない.本研究ではこの負荷平衡問題に着目し,効率的なデータ分割法を考案した.成果は国内研究会(IBISワークショップ2012)にて発表しており,また国際論文誌に投稿中である.この技術を応用することで大規模かつ疎なデータテンソルが効率よく学習できることが期待される. 本研究はその大部分がNEC Laboratory America滞在中に行われた. 2.隠れ特徴モデルを用いた疎な特徴抽出 1.で述べたように,データが疎な表現をとるとき,効率的な計算アルゴリズムを一般的に考えることができる.またデータの解釈・可視化の観点からも特徴の疎性は重要である.本研究は与えられたデータを特徴抽出し,疎な表現を獲得するための新たな枠組みを考案した.特許出願中のため研究内容については省略するが,成果の一部は国際会議(Fujimaki&Hayashi, ICML2012)にて発表ずみであり,またそれを発展した内容を国際会議に投稿中である.
|
Report
(2 results)
Research Products
(9 results)
-
-
[Journal Article] Exponential family tensor factorization : an online extension and applications2012
Author(s)
Hayashi, K., Takenouchi, T., Shibata, T., Kamiya, Y., Kato, D., Kunieda, K., Yamada, K., Ikeda, K.
-
Journal Title
Knowledge and Information Systems
Volume: Vol. 33(1)
Issue: 1
Pages: 57-88
DOI
Related Report
Peer Reviewed
-
-
-
-
-
-
-