研究課題/領域番号 |
17K06250
|
研究機関 | 東京大学 |
研究代表者 |
湧田 雄基 東京大学, 大学院情報学環・学際情報学府, 特任助教(移行) (00377847)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 機械学習 / オントロジ / 概念構造 / データマイニング / Data Science / AI / XAI (Explainable AI) |
研究実績の概要 |
本研究では,データ分析により得た結果を抽象化した概念構造に対応付け,意味関係を極力自動的に解釈することで,文章表現による分析結果提示まで実施する事を目指す. 研究に用いるデータは,主にテキストデータを対象としており,数値や文字列等,混在したデータも対象としている.それらのデータを対象に,変数間の意味的な関係性を識別し,これを外部知見データとして分析に導入し,分析結果の向上を試行する点が特徴的である. 平成29年度では,主に,分析対象データの準備および,統計量算出の前処理を実施した.変数に含まれる値の出現頻度を分析することで,頻出値および値の共起の解析を行った.その際,対象データの値の分布を用いて,変数認識を行う為のロジック・辞書・処理スクリプトの構築を行った.これらにより,分析対象データテーブルを読み込めば,変数が有する値や値の分布を解析する事で,対象変数の意味/概念を推定し,変数と意味との対応付けが可能となった.変数認識では,値の形式(数量,文字列,日付,緯度経度)などの判別について,値の形式により行い,値の頻出値の辞書参照や,値の占有率調査により,変数の認識を試行した.認識した変数に対して,目的変数/説明変数の区別を行い,線形判別分析および決定木分析を用いたデータモデリングを行った.変数認識等のために構築した辞書および,辞書の構築手法については,本研究における抽象的概念の中核となる成果であり,今後,オントロジ等の構築に向けた研究を進める.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究提案書に記載の実施計画に基づき,研究計画を次の3つの研究課題に分割し,推進している. 「研究課題1 抽象的概念を用いたデータモデリング」,「研究課題2 抽象的概念を用いた分析結果の表現技術」,「研究課題3 研究成果の評価」. 以上について,平成29年度までに,研究課題1について,概ね順調に進捗しており,今後,平成30年度においては,研究課題2の推進と,研究課題1の改善などを計画的に実施する予定である. 研究内容について,おおむね順調に推進できていると認識しており,研究達成度の区分については,「おおむね順調に進展している」とした.
|
今後の研究の推進方策 |
研究提案書に記載の内容に沿って,研究計画を3つの研究課題に分割し,推進しているが,平成30年度においては,「研究課題2 抽象的概念を用いた分析結果の表現技術」を推進するとともに,「研究課題1 抽象的概念を用いたデータモデリング」の性能評価を実施し,適宜,手法の見直しを行い,技術の改善等を進める予定である. また,最新の技術動向および,研究結果に応じて,プロジェクト計画および実施計画線表を見直し,年間の4半期毎に進捗状況を確認するなど,自身で定期的かつ計画的なプロジェクト管理を行う.
|
次年度使用額が生じた理由 |
(理由) 研究提案時に予定した平成29年度の予算として,クラウドサーバ利用料や出張費用があったが,これらの金額について,平成29年度の実績使用額が想定より少なく,次年度使用額に割り当てられている. (使用計画) 論文出版や海外出張などの費用支出については,研究発表のタイミングにより支出状況が変動するが,平成30年度~平成31年度にて使用予定である.
|