研究課題/領域番号 |
18K19772
|
研究機関 | 東北大学 |
研究代表者 |
大町 真一郎 東北大学, 工学研究科, 教授 (30250856)
|
研究分担者 |
菅谷 至寛 東北大学, 工学研究科, 准教授 (80323062)
宮崎 智 東北大学, 工学研究科, 助教 (10755101)
|
研究期間 (年度) |
2018-06-29 – 2022-03-31
|
キーワード | パターン認識 / コンピュータビジョン / センサ融合・統合 |
研究実績の概要 |
コンピュータビジョン技術の実用化を阻む要因の1つに、カメラによる映像取得におけるプライバシーの問題がある。本研究では、その問題を解決するため、ユーザがカメラを持ち歩く代わりに監視カメラ等の既設の固定カメラを利用し、その映像とユーザの行動を結びつけることでビジョン技術を活用するための基盤技術を開発している。具体的には、固定カメラ映像からユーザの視線の先にあるオブジェクトを検出することでユーザの行動を把握し、適切なサポートを行うツールを提供することを目的としている。本年度は、全体システムの構築に必要な要素技術のうち、ネットワークを介して必要な情報を実時間で効率良く伝送する技術、および、低解像度映像中のオブジェクトを検出して認識する技術について主に検討を行った。 必要な情報を効率良く伝送するために、ユーザの視線の先にあるオブジェクトを検出し、その領域の情報を高精細に伝送し、残りの領域は必要最小限の情報を伝送する手法を検討した。ユーザの視線の先にあるオブジェクトを検出する手法として、画像を表すキャプションを生成し、キャプションを用いて画像中からオブジェクトを検出する手法を提案した。 また、オブジェクト検出と認識に関しては、テキスト領域を対象とし、画像中からテキスト領域を高精度に検出し、認識する手法を検討した。テキストの形状を考慮し、ニューラルネットワーク中の複数の階層からテキストらしい領域を検出し、統合することで最終的にテキスト領域を特定する。カメラで撮影した画像中のテキストは一般的には射影変換を受けているため、斜めに配置されたテキストも検出できる手法を開発した。さらに、多様なテキスト画像を機械学習により高精度に認識するための学習データ生成手法についても検討し、一定の見通しを得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
要素技術については成果が得られたが、全体システムの評価や成果発表には至っていない。
|
今後の研究の推進方策 |
各要素技術についてさらなる高精度化について検討するとともに、全体システムとしての評価を行う。
|
次年度使用額が生じた理由 |
本年度は要素技術の開発に注力し、システムとしての性能評価や成果発表までは至らなかったため、学会参加費や旅費を使用せず、次年度使用額が生じた。次年度使用額はシステム評価を行うための実験環境構築および成果発表のための論文掲載料等にあてる予定である。
|