研究課題/領域番号 |
11558017
|
研究機関 | 公立はこだて未来大学 |
研究代表者 |
川嶋 稔夫 公立はこだて未来大学, システム情報科学部, 教授 (20152952)
|
研究分担者 |
吉野 和芳 神奈川工科大学, 工学部, 講師 (10298284)
長崎 健 公立はこだて未来大学, システム情報科学部, 講師 (70325893)
|
キーワード | 映像解析 / プレゼンテーション支援 / 電子テキスト |
研究概要 |
本年度は、テーブルの上で操られる文書をカメラで撮影し、プレゼンテーション等に利用するための手法を検討すると共に、実証システムを作成した。 具体的な研究成果は以下のとおりである。 1 ライブ映像による指示動作理解と高速な文書の同定 テーブル上の文書を低解像度の映像として撮影し、これから文書の移動や交換を検出する手法を明らかにした。文書をカメラでモニターする場合、通常のNTSCカメラでは解像度が低く文字の認識は不可能である。そこで、文書の同定を文字ベースで行うのではなく、段落や行末の情報を利用して認識する方法を開発した。この方法は文書の見開きに登場する複数の段落を、票アルゴリズムで認識しているためにオクルージョンなどに強い性質を持つ。 この同定のあと、文書への動作理解を行うことで、どの文書がどのような操作をされたかが同定できるようになった。 2曲面にマッピングされた文書の解析 1 の手法は平面に対しては有効に働くが、一般の書籍を見開いた場合のように曲面になった文書はそのままでは適用ができない。そこで、映像中のエッジの分布密度を利用して文書の曲がり方を推定し、平面に復元する手法をとった。これにより、厚手の文書であっても平面に補正を掛けてから扱うことができるようになった。また、厚手の文書の同定も可能になった。 上記手法および、昨年度の成果は実証システムとしてまとめあげられた。
|