2006 Fiscal Year Annual Research Report
Project/Area Number |
18650036
|
Research Institution | Tohoku University |
Principal Investigator |
後藤 英昭 東北大学, 情報シナジー機構, 助教授 (40271879)
|
Keywords | 文書認識 / 文字認識 / 画像認識 / 分散処理 / 知能ロボティックス / ネットワーク / Gridコンピューティング / Webアプリケーション |
Research Abstract |
サーバ・クライアント構成に基づく文字認識の利用形態とその可能性について調査を行い、文書認識システムをウェブアプリケーション化する際の問題点について検討した。この結果を基に、分散・協調型の文書認識システムを実現する、HTTPを用いたインタフェースを設計した。これを用いて、様々な文字・文書認識エンジンを容易にウェブアプリケーション化できるようなツールキットを開発した。上記ツールキットをオープンソースのソフトウェアとして世界に公開すると共に、既存のオープンソースのOCRソフトウェア四種類を用いて文書認識サーバのプロトタイプを実装し、研究室内に設置したサーバ機の上で動かし、世界のユーザへサービス提供を行った。 分散・協調型文書認識システムの構成法、解決すべき問題点、および開発したツールキットの詳細を論文にまとめて、国際会議ICPR2006で発表した。また、デベロッパーや他の研究者に各自のサーバの提供を呼びかけた。 クライアント・サーバ構成に基づく文書認識サーバの応用例としては、視覚障害者向けの視覚補助装置を開発している海外の他研究グループが我々のサーバの試験的利用を開始し、具体的なニーズが明らかになった。我々はまた、自律ロボットから文書認識サーバを利用するためのインタフェースの検討も行った。 多数の文字認識サーバを用いた文字認識高精度化に関する調査を行い、既存の日本語文字認識特徴量を用いた文字認識処理を実装し、多数決原理による文字認識精度向上の実証実験を行った。この成果をICPR2006の論文で述べた。 ユーザがネットワーク上に散らばる文書認識サーバから適切なものを選び出せるように、サーバ仕様書の自動収集とディレクトリ方式を組み合わせた、リソース検索処理を開発・実装した。
|
Research Products
(2 results)