2009 Fiscal Year Annual Research Report
高速ビジョンを用いた快適な入力インターフェースの研究
Project/Area Number |
19680010
|
Research Institution | The University of Tokyo |
Principal Investigator |
小室 孝 The University of Tokyo, 大学院・情報理工学系研究科, 講師 (10345118)
|
Keywords | コンピュータビジョン / HCI / ビジョンチップ / 携帯端末 |
Research Abstract |
前年度に開発した携帯端末向け入力インターフェースシステムに対し、点滅赤外照明による安定した指先領域の抽出、画像歪み補正による高視野化、キーストローク動作判定の修正などを行い、さらなる操作性の向上を実現した。アプリケーションとして、空中タイピングキーボード、ズーミングピクチャニュワー、3Dペインターを実装し、国際会議でデモンストレーションを行った。また、ディスプレイの背面に振動素子を取り付けることで、ビジョンベースの入力インターフェースの欠点であった触覚フィードバックの問題を解決した。 ほかには、高速カメラを用いて人間の発話動作を撮影し、口唇の動きから音素の認識を行う実験を行った。従来の自動読唇では、主に口唇の形状を利用して認識を行っていたが、この場合、英語などの口唇の形状変化の大きい言語ではある程度の認識が可能であるが、日本語の場合、母音は形状から認識可能であるが、子音に関してはほとんど形状の差がなく、認識が困難であるという問題があった。そこで、発話時の口唇の開閉状態の時間変化に着目し、その波形をパラメータ表現し、クラスタリングを行うことで、子音の認識が可能となることを確認した。これにより、従来は難しかった日本語の自動読唇が可能となり、携帯電話の入力インターフェースへの応用につなげられる。 ハンディ三次元スキャナについては、システムの完成には至らなかったが、モーションステレオによる三次元復元の基本アルゴリズムを実装し、動作を確認することができた。
|
Research Products
(1 results)