データの学習容易性解析に基づく実ケース学習理論の確立
Project/Area Number |
19H04067
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 60010:Theory of informatics-related
|
Research Institution | Kyushu University |
Principal Investigator |
瀧本 英二 九州大学, システム情報科学研究院, 教授 (50236395)
|
Co-Investigator(Kenkyū-buntansha) |
畑埜 晃平 九州大学, 基幹教育院, 准教授 (60404026)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥16,380,000 (Direct Cost: ¥12,600,000、Indirect Cost: ¥3,780,000)
Fiscal Year 2022: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2021: ¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2020: ¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
Fiscal Year 2019: ¥5,720,000 (Direct Cost: ¥4,400,000、Indirect Cost: ¥1,320,000)
|
Keywords | 計算学習理論 / 決定グラフ / 情報圧縮 / ゲーム理論 / オンライン予測 / 行列補完問題 / 学習容易性解析 / センサーネットワーク / バンディット問題 / 計算量理論 / 負荷分散 / シェイプレット / ZDD / ブースティング / 組合せ最適化 / 大規模機械学習 / くずし字認識 / モデリング |
Outline of Research at the Start |
機械学習の分野では,優れた理論保証を持つ手法よりも,理論保証の無い/悪い発見的手法の方が,実データに対しては良い性能を示すことが良くある.本研究では,このような理論と実践の乖離現象を,データそのものの学習容易性/複雑性解析を通して解明し,実データに対する学習アルゴリズムの高精度な性能解析技法の開発を目指す.また,学習容易性の解析を通して,データ生成源に関する新しい自然科学的・人文科学的な解釈・知見を与える.
|
Outline of Annual Research Achievements |
主に以下の成果を得た. 1.オンライン行列補完問題は,推薦システムの基盤となる問題である.この問題では,各試行において,アルゴリズムが0-1行列を予測すると,環境から行列のある成分 (i,j) における真の値が与えられる.アルゴリズムの目標は,予測の誤り回数を最小化することである.従来手法は,初めに真値行列に関する補助情報が与えられると一般化した上で,オンライン半正定値計画(OSDP)問題に帰着するものであるが,タイトな誤り回数の上界を達成できていなかった.本研究では,この帰着において,OSDP問題を解くアルゴリズムで用いる正則化項を,補助情報を用いて補正することで,誤り回数のタイトな上界を導出することに成功した. 2.エキスパート統合問題では,学習容易性解析に基づき,現実的な仮定のもとで非自明なリグレット上界を導出した.既存研究では,環境が開示する損失ベクトルを並べることにより得られる損失行列のランクを学習容易性指標とするものがあるが,損失行列が低ランクであるという強い仮定をおく必要があった.また,この仮定を緩和し,損失行列が低ランク行列で近似可能とした場合の研究もあるが,その低ランク行列に関する情報をアルゴリズムに与えておく必要があり,実用的ではなかった.本研究では,そのような事前情報を与えることなく,損失行列が低ランク行列で近似できる場合に,非自明なリグレット上界を導出することに成功した. 3.センサーネットワークにおいて,スループットとエネルギー消費効率の両方を最適化するように近隣のセンサーを選んでネットワークを動的に構築する問題に対し,バンディットの手法を応用した手法を提案し,実験によってその有効性を示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度の研究で,圧縮データ上の機械学習法の成否は,前処理のデータ圧縮部分で高い圧縮率を達成することにかかっていることが明らかとなった.本年度は,様々なアプローチで圧縮アルゴリズムの改善に取り組み,いくつかのデータでは,従来手法に比べて数分の一~数十分の一の圧縮率を達成することが判明した.現在,これらの成果をとりまとめたものを投稿準備中である. 学習容易性解析の観点からは,オンライン行列補完問題とエキスパート統合問題について,成果を得た.前者の成果は,商品推薦システムの構築に応用できる.具体的には,ユーザのプロファイル情報等から導出されるユーザ間の類似関係,商品のプロファイル情報等から導出される商品間の類似関係に関する補助情報が与えられたとき,その類似関係と実際の購買傾向に相関がある場合に,高い確度で,ユーザーが欲する商品を提示することができることを意味している.後者の結果は,非常に多くのエキスパートの予測を統合する問題を考えたとき,エキスパート集合が小さいクラスタに分類できると仮定した場合に,高い予測精度を達成できることを意味している.いずれも,実用的な応用可能性が高い成果と言える.
|
Strategy for Future Research Activity |
1.圧縮データ上の学習の問題に対し,大規模なデータに対する提案手法の性能を検証し,より実用性の高い学習システムを構築することを目指す. 2.上記の手法は,機械学習に限らず,一般に圧縮データ上の情報処理の問題に広く応用できる可能性がある.本年度は,データベース検索問題や,組合せ最適化問題等への応用も試みる. 3.昨年度に引き続き,Blackwellゲームからのアプローチの有望性について検討する.
|
Report
(3 results)
Research Products
(27 results)