研究課題/領域番号 |
15K00423
|
研究機関 | 京都大学 |
研究代表者 |
浅野 泰仁 京都大学, 情報学研究科, 准教授 (20361157)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | ウェブ / 知識発見 / 知識体系化 |
研究実績の概要 |
ウェブに限らず様々なデータにおける潜在的関係を発見する研究を行った.具体的には,(1)生体信号(心拍,脳波,皮膚コンダクタンス)データを用いて,生体信号とストレスや感情の関係を考察した.特に,画像・動画鑑賞時および歩行時のデータを対象として収集し,機械学習の技法を活用してストレスや感情を推定する手法を構築した.本技術は,感情に基づくコンテンツの推薦,あるいは歩行経路の推薦に役立つと考えられる.(2) 文化にかかわるデータ(食文化としてレシピ,音楽文化としてクラシック楽曲の解説)から,その順序関係の発見を行った.本技術は,食文化の発展やクラシック音楽の理解支援に役立つことが期待される.(3) 商品レビューデータから,商品とその使用目的を結び付ける潜在的関係の発見を行った.本年度は特に,多機能商品の各機能と,使用目的を結びつける手法を構築した.この技術は,商品の機能について詳しくない購買者にも,その使用目的に応じて最適な商品を推薦するシステムの基礎技術となり得る.(4) 匿名(IPアドレスを秘匿して行う)通信ツールであるTorの通信経路における独立経路同士のAS(自律システム)による潜在的関係を明らかにし,その危険性を検証した.(5) 位置情報を活用した匿名コミュニケーションツールにおけるユーザー同士の位置の潜在的関係を明らかにし,その危険性を検証した.(6) MOOCsにおける各科目の潜在的関係(内容の依存関係等)を発見するために,コンピュータサイエンス分野を対象として,各科目と模範カリキュラムの対応付けを行う手法を提案した.(7) 各種手法の基礎技術として,合流集合経路最適化問題を提唱し,その厳密解を求める高速アルゴリズムを構築した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初計画していたようにWikipediaのデータで得られた潜在的関係を基にする手法ではなく,主に各種のデータに対して直接的にセマンティクスや統計情報に基づく潜在的関係発見の手法を考案していくことになった一方で,当初計画していた以上に多くの種類のデータに対して潜在的関係発見の成果を挙げることができた.具体的なデータの種類については,研究実績概要に記載したとおりである.(1)(3)(6)に関しては,基礎的手法を提案し,予備実験を行った段階である.(2)(4)(5)に関しては,モデルと手法を確立し,実際の大規模データに対して実験を行い,有効性を確かめた結果が査読付き国際会議に採択されている.(7)に関しても同様に2種類の問題に対して手法を確立し,実験もすでに行っている.その結果を論文誌に投稿中である.
|
今後の研究の推進方策 |
本年度提案した手法は,特に(1)(3)(6)に関しては基礎的な技法を用いたものにとどまっているので,これらをより高度な技法および独自のモデルを導入することで実用的な精度を実現してゆく.具体的には,以下の計画を考えている.(1)について,特にビデオ鑑賞時のさらに大規模な生体信号データを収集し,生体信号から鑑賞中の感情の変化をモデル化することを予定している.既存の手法は一時的な刺激における生体信号と感情の直接的関係を扱っているが,本計画ではより潜在的な,生体信号と感情の時間的変化の関係を扱ってゆく.(3)については,適合率はある程度高いが再現率が低いという結果が予備実験で得られているため,この問題の特徴を組み込んだブートストラッピング的手法を構築して適合率を落とさずにより多くの正例を発見できる手法を構築してゆく.また,現状では商品の使用目的を単一の単語でしか表現できないため,表現力が低いという問題がある.これに関しても,複数の単語による複雑な使用目的の表現を要約することで表現力を高めつつ集約された使用目的情報を得られるようにしてゆく.(6)については,大域区分に関しては高い精度で科目とカリキュラムを対応づけることができたが,細分に関しては低い精度にとどまっている.予備実験によって科目のデータ(現在はシラバスのみを使用している)とカリキュラム双方の情報が不足している,あるいは体系づけられていないという問題が判明した.今後は以前の研究計画に述べたWikipediaで得られた概念間の潜在的関係等を利用して,カリキュラムで使用されている区分の概念の関係を体系化し,それによって問題解決を図るとともに,科目間の潜在的関係発見手法を構築してゆく.
|
次年度使用額が生じた理由 |
まず,実験協力者の募集等の問題で今年度中に実施できなかった大規模データ収集実験等を次年度の計画としたことが挙げられる.次に,今年度予想より多くの査読付き国際会議論文が採択されたため,次年度これらの結果を論文誌に投稿する予定であり,そのため掲載費や英文校閲費の増加が見込まれるため.
|
次年度使用額の使用計画 |
時系列データに関する潜在的関係発見のため様々なセンサーを購入し,さらに数多くの実験協力者を募ることで,大規模な時系列データ取得実験を行う.また,今年度査読付き国際会議に採択された多くの結果を論文誌に投稿する予定のため,掲載費や英文校閲費を計上する.
|