2017 Fiscal Year Annual Research Report
内在的構造を持つ大規模高次元データ解析の理論と方法
Project/Area Number |
26280009
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
福水 健次 統計数理研究所, 数理・推論研究系, 教授 (60311362)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 大慈 東京大学, 大学院情報理工学系研究科, 准教授 (60551372)
小林 景 慶應義塾大学, 理工学部(矢上), 准教授 (90465922)
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Keywords | 統計数学 / データ解析 / 高次元 / アルゴリズム |
Outline of Annual Research Achievements |
H29年度はカーネル法の効率的計算アルゴリズムの課題を中心に研究を遂行した.まず,カーネル法を用いた分布間の距離尺度としてよく用いられる Maximum Mean Discrepancy (MMD)の効率的計算に関して研究を行った.MMDの計算は,そのまま実行するとサンプル数 n に対して O(n^2) の計算量がかかるため大規模なデータに使うことが難しい.これに対し,MMDをU統計量として表現して,データからのランダムサンプリングを行う不完全U統計量の計算を行うと,計算量が削減されるだけでなく,分布の均一性検定の帰無分布が漸近正規性を満たすという非常に良いよい性質を持つことが分かった.この結果に基づいて,MMDの効率計算を従来から研究を行っていた事後選択推論(Post Selection Inference)に応用した論文をまとめて投稿準備を行っている. また,カーネル法を用いた自然言語処理における共起尺度に関して共同研究を行い,低ランク近似の方法を用いることによって比較的少ない計算量で尺度を構築することが可能で,巨大なコーパスからでも学習が可能であることを示した. さらに,カーネル法による分布埋め込みに関するサーベイ論文を出版した.このトピックは本課題においても大きな役割を果たす技術であるが,まとまって書かれた教科書などは存在していなかった.本サーベイ論文は技術を普及するうえで重量な役割を持つと考える.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
カーネル法の効率的な計算法に関して,ランダムサンプリングによる不完全U統計量の利用が良好な性質を持つことが確認でき,新たな方向性が見いだされた点で,十分な進展があったと考える. また,review論文の採択や,難関国際会議における論文採択などもあることから,研究の進捗は順調であると判断できる.
|
Strategy for Future Research Activity |
H30年度は本課題の最終年度に当たる.提案時に課題として掲げた3つのうち,ハブ現象に関わる研究に関してまとめて論文投稿に結び付けたいと考えている. また,ランダム特徴選択などの方法の研究を通して,,カーネル法と深層学習の関連に関して新しい方向性を見出していきたいと考えている.
|
Causes of Carryover |
所属機関の特任教員の転出によって運営費交付金による人件費に剰余が生じたため,出張旅費および技術補佐員の人件費を所属機関の運営費交付金から支出した.その結果,本科研費で計画していた旅費・人件費費に未使用分が発生した. 研究が順調に進んだことによって国際会議における発表件数が予定より増加する見込みのため,未使用分は,その海外出張旅費に充当する計画である.
|
Research Products
(10 results)