研究課題/領域番号 |
19H04071
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 東京工業大学 |
研究代表者 |
金森 敬文 東京工業大学, 情報理工学院, 教授 (60334546)
|
研究分担者 |
熊谷 亘 東京大学, 大学院工学系研究科(工学部), 特任助教 (20747167)
竹之内 高志 政策研究大学院大学, 政策研究科, 教授 (50403340)
松井 孝太 名古屋大学, 医学系研究科, 講師 (50737111)
川島 孝行 東京工業大学, 情報理工学院, 助教 (60846210)
武田 朗子 東京大学, 大学院情報理工学系研究科, 教授 (80361799)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2023年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2021年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2020年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2019年度: 6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
|
キーワード | AI / データサイエンス / 機械学習 / 数理統計学 / 数理統計 / 機械学修 / 最適化 / 最適輸送 / 多ドメインデータ / 転移学習 / 情報転送 |
研究開始時の研究の概要 |
本研究では,さまざまな形式で表現された高次元・大規模な多ドメインデータを用いて統計的学習を行うためのフレームワークを構築することを目的とします.今日のようなビッグデータ時代では,さまざまなデータドメインにおいて,サイズ,次元,表現形式の異なる複雑なデータを収集することが出来ます.これは一見すると data-rich な状態と言えます.しかし,それぞれのドメイン間の相互関係が不明なことが多く,その意味ではデータ量が増えるほどknowledge-poor な状態になってしまいかねません.このようなビッグデータ時代のパラドックスを打破するための研究を推進します.
|
研究成果の概要 |
本研究では、高次元・大規模な多ドメインデータを使った統計的学習のフレームワークの構築を目指す.ビッグデータ時代では,様々なドメインで異なるサイズや次元,表現形式の複雑なデータを収集できるが,ドメイン間の相互関係が不明瞭であり,データが増えれば増えるほど知識不足の状態になるパラドックスがある.これを打破するため,各ドメインの関連性を考慮しつつ,データの特徴を抽出し統合することが重要である.本研究ではこの課題を多ドメイン間の相互関係に焦点を当てて定式化する.ヘテロな構造を持つ多ドメインデータのモデリング技術と機械学習アルゴリズムを開発し,理論の深化を目指す.
|
研究成果の学術的意義や社会的意義 |
本研究では,異なるデータサイズ,次元,タイプなどの多様なデータを活用し,予測,推論,構造推定など複数のタスクを行う学習アルゴリズムを,数学的な知見に基づいて提案,開発する.理論的解析により予測精度向上のためのパラメーター調整などが容易になり,飛躍的な性能向上が期待できる.理論的知見に基づくアルゴリズムの実装により,画像,音声,タグその他の情報を含むヘテロなデータからの関連性分析などの精度が大きく向上し,機械学習システムの安全性や信頼性を高める基盤を提供する。
|