研究課題/領域番号 |
17K20000
|
研究機関 | 大阪大学 |
研究代表者 |
高野 渉 大阪大学, 数理・データ科学教育研究センター, 特任教授(常勤) (30512090)
|
研究期間 (年度) |
2017-06-30 – 2020-03-31
|
キーワード | 運動 / 自然言語 / 機械学習 / ロボット |
研究実績の概要 |
実世界に溢れている連続情報から離散表現である記号を取り出す情報処理に人間の高度な知能の根源がある.人間の身体運動を計測する技術の向上,ロボティクスの運動学・動力学計算の発展,機械学習アルゴリズムの進展を背景に,身体運動と自然言語を統合する統計数理モデルが開発されてきている.しかし,運動と言語の間の双方向変換は,学習に利用できる小規模の運動データおよび言語表現に強く制限を受け,生成される運動や言語表現は画一的で無味乾燥なものにならざるを得なかった.膨大な運動データと多様な言語表現を扱える枠組みへと拡張することが求められる.本研究課題では,平成29年度は以下の研究開発に着手した. (1)人間の全身運動を光学式モーションキャプチャにて計測する場合,被験者に貼り付けたマーカの位置計測とラベリング処理が必要である.マーカ間の幾何関係を利用した自動ラベリングが広く普及しているが,俊敏・複雑・隠れが発生する動きに対して誤ったラベルを付けることが多々ある.そのため運動計測およびその後処理に膨大な時間が掛かり,多くの運動を計測・蓄積することが困難であった.そこで,予め人手によって正しくラベリングされた運動データを学習データとして,オートエンコーダ方式の深層ニューラルネットワークを構築することで誤ったラベルを検出する方法を開発した.(2)IMUセンサを活用することで,日常生活にて全身運動を計測できる環境とそれら運動データに多様な言語表現を付与するためのクラウドソーシングの活用基盤を整備した.(3)全身運動を統計モデルによって記号化する計算,その記号から関係がある単語を生成する機能と文書中の単語の並びを計算する機能を有する2つの深層ニューラルネットワークを構築し,それらを繋げることによって運動から文章を生成する計算方法を構築した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では,膨大な運動データとその言語表現を結びつける人工知能の枠組みを構築する.平成29年度では,以下の研究開発を実施した. (1)光学式モーションキャプチャの自動ラベリング法:光学式モーションキャプチャでは,被験者に貼り付けたマーカの位置を計測し,そのマーカのラベルを同定することが求められる.従来のラベリングは,マーカ間の距離に基づいてラベルが同定されており,身体部位が接近してマーカが空間的に密集する状況で誤ったラベルが付けられることがあった.局所的なマーカの位置関係だけでなく,大域的な情報を活用することでラベリングの精度を向上させることを狙い,正しくラベリングされた運動データを入力と出力の学習データとして,深層ニューラルネットを利用したオートエンコーダを構築した.誤ってラベリングされた運動データからは入力と異なった出力が生成されることになる.入力と出力の差を計算することで誤ラベリングを検出する方法を開発した.(2)大規模運動と言語の記録:光学式モーションキャプチャでは,計測できる環境が制限される.日常生活空間で利用できるIMUセンサを利用した運動計測システムを導入した.膨大に蓄積した運動データに多様な言語表現を付与するためにクラウドソーシングにて様々なユーザーが動きを閲覧して,動作に文章を付与する環境も整備した.膨大な運動データと言語表現を収集することを可能とした.(3)深層学習による運動と言語の統合:運動データを統計モデルパラメータとして低次元化する.そのパラメータから各単語がその動作へ関連する度合いを出力するモデルと文章中において単語の系列から各単語が次に出現する確率を計算するモデルを深層ニューラルネットワークによって構築した.これら2つを組み合わせて,動きから関連する確率が高い文章を探索することによって,動きを文章に変換することを実現した.
|
今後の研究の推進方策 |
膨大な人間の全身運動とその言語表現を効率的に収集する環境を整備してきた.さらに,全身運動の低次元表現と自然言語表現を橋渡しする数理モデルを構築できた.このように収集したデータや数理モデルを処理するうえで,学習データに存在しない多様な運動や言語表現を創造する機能とデータ処理に要する計算時間に新たな問題があることが明らかになってきた. (1)多様な運動と言語表現の創造:本年度開発した枠組みから生成される言語表現は,学習データとして利用された文章例に強く拘束される.多くの言語表現を学習データとして加えることによって生成される文章例の多様性を膨らませる方法と,ニューラルネットワークに埋め込まれた情報を利用することによって学習データに存在しない文章を創造する2つの方法を並列して開発する.前者では画像に付けられた文章や書籍の電子アーカイブなどのオープンデータセットを活用する.後者は,ニューラルネットワークの中間層に保持された特徴ベクトルから特徴を記述する位相空間を設計する.空間上での特徴の測地線を計算し,その測地線上を遷移しながら特徴ベクトルを人工的に修正することによって,特徴の内挿・外挿処理を行うことができる.得られた特徴ベクトルから文章を生成することによって学習データに存在しない文章を創造する計算法を開発することや言語推論の計算論へ発展させる.(2)運動から文章を生成する計算は,膨大な単語の並びの組合せから関連度合いの高い単語の並びを探索する計算である.探索空間が膨大であるための,処理する運動や語彙が増加するにつれて,文章を生成する計算時間も膨れ上がる.文章を探索する計算の並列分散処理化を実装することによって,運動と言語のスケーラビリティの問題を解決することを図る.
|
次年度使用額が生じた理由 |
本年度,大規模な運動と言語のデータを収集する環境を整備した.当初予定した言語データの収集で,学生アルバイトではなく,クラウドソーシングを予定より早くから利用できるように研究を進めることができ,学生アルバイト謝金などの人件費を低く抑えることが可能となった.膨大な収集したデータを計算するコンピュータを導入する必要があり,翌年度に繰り越した研究費と計画当初に請求していた助成金を合わせて,高スペック並列分散処理に適した計算機を導入する.
|