2014 Fiscal Year Annual Research Report
アクティビティ解析に基づくKnowledge Logの構築とその応用
Project/Area Number |
25240028
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
黄瀬 浩一 大阪府立大学, 工学(系)研究科(研究院), 教授 (80224939)
|
Co-Investigator(Kenkyū-buntansha) |
岩村 雅一 大阪府立大学, 工学(系)研究科(研究院), 准教授 (80361129)
岩田 基 大阪府立大学, 工学(系)研究科(研究院), 助教 (70316008)
内海 ゆづ子 大阪府立大学, 工学(系)研究科(研究院), 助教 (80613489)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | アクティビティ解析 / 行動認識 / アイトラッキング / 画像特徴 / 顔認識 / 漫画画像解析 |
Outline of Annual Research Achievements |
以下の5点について成果を得た. (1)顔画像認識技術の大規模化:局所特徴量の照合と投票という考えを用いて,顔画像認識の大規模化を達成した. (2)文字認識技術の高度化,ならびに新しい文字認識技術の開発:文字の認識は本研究で重要な技術の一つである.ここでは,局所特徴に基づく文字認識技術の高精度化,ならびにcomputational photographyの技術を用いて得たdefocused patternに基づく文字認識の2つについて成果を得た. (3)行動認識技術の高精度化:様々な手法やセンサーを用いて行動認識を高度化した.具体的には,画像処理を用いた文書タイプの識別,視線特徴と画像特徴をあわせた行動認識,cognitive activity認識のための視線特徴の利用ならびにEOG特徴の利用,Google Glassを用いた文書アノーテーション技術,行動認識技術ならびに行動記録技術,漫画を対象とした画像解析検索技術,視線特徴を用いた英語習熟度推定技術,fNIRSを用いた文書理解度推定技術などである. (4)基礎技術の開発:近似逆最近傍探索技術の提案,ならびに,画像の種類によらない高速照合技術の開発を行った.後者については,早期認識,早期識別という概念を導入することにより達成した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の計画は,予想以上に進展した箇所と予定を下回っている箇所が存在する.両者を考え合わせると概ね順調と考える.以下で詳細を述べる. (1) 予定を下回っている箇所:本年度の計画には,基礎的な知識記述に関する項目が存在している.要素となる技術は既に開発済みであるものの,具体的な知識記述というレベルには到達していない.また,それに基づくスマートフォンアプリケーションも未開発である.この点がやや遅れている箇所となっている. (2) 予想以上に進展している箇所:認識検索技術については,JINS MEMEやGoogle Glassなどの新しいデバイスの導入,ならびに精度,高速性,大規模性を高めるための基礎技術の開発とその導入による各種認識技術の高度化を達成することができた.特に顔認識の大規模化,様々なセンサーや手法を用いた行動認識の高度化については,当初の予定を大幅に上回る成果である.
|
Strategy for Future Research Activity |
今後の予定は以下の通りである.まず,本年度に達成できなかった知識記述を完成させる.さらに,認識技術を統合するとともに,スマートフォンなどの簡易デバイスを用いて動作可能なようにデモシステムを構築する.具体的にはスマートフォンを使った簡易インタフェースのもの,アイトラッカを含めた各種センサーを用いたフルスペックのものの2通りを作成する.スマートフォンのインタフェースとしては,スマートフォン内蔵のカメラを用いたアイトラッカの実現も試みる.フルスペックシステムについては,高価なデバイスだけではなく,JINS社から発売予定のEOGデバイス JINS MEME, Tobii社から発売されている廉価版アイトラッカ Tobii EyeXによる実現も試みる.スマートフォンによるシステムでは,必要に応じて,積極的にユーザに問い合わせるという方策をとる.一方,フルスペックシステムでは,可能な限り問い合わせない方針で臨む.いずれにせよ,システムはユーザからの"Guess what?",すなわち「なぜ見てる?」,「なぜボタンを押した?」などの問いに利用可能な情報を総動員して精度高く答えるこになる.
|
Research Products
(17 results)