研究課題/領域番号 |
25540040
|
研究種目 |
挑戦的萌芽研究
|
研究機関 | 早稲田大学 |
研究代表者 |
浅井 洋樹 早稲田大学, 付置研究所, 助手 (30631105)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
キーワード | 手書き / アノテーション |
研究概要 |
本研究は、タブレット端末に代表されるようなコンピュータ上でペンを使った手書き入力可能な環境である「デジタル手書き環境」において、電子ドキュメント上への手書きによる注釈書き込み(手書きアノテーション)を検出・認識する手法を考案し、手書きアノテーション支援システムの設計およびアノテーション情報活用の基盤となる認識技術の構築を目指すものである。 初年度となる本年度は、ユーザによる電子ドキュメント上への手書きアノテーションデータを取得するアプリケーションを開発し、アノテーションデータを収集する被験者実験を実施した。本アプリケーションではHTMLドキュメント上に直接ペンで書き込むことができ、筆跡情報や電子ドキュメントとの位置関係を記録する。本実験で取得したアノテーションデータを調査することで認識に有効である形状特徴・位置関係特徴を決定し、被験者(筆記者)に依存しない堅牢な認識モデルを考案した。考案した認識モデルでは下線や囲い込み、縦線といった一般的な範囲選択アノテーションの検出に加え、筆記者の意図する選択範囲抽出を実現する。ここまでの研究成果をデータ工学分野で国内最大規模の会議であるDEIMフォーラム2014で発表し、各研究者との議論を行った。 また考案した認識モデルの性能を評価するため、被験者の規模を増やして提案認識モデルの評価を実施し、文字単位での認識では平均85%、行単位の選択では92%の精度を達成できることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度に研究計画として予定していた「手書きアノテーション認識モデルの開発」について、達成度を評価する。本年度の手書きアノテーション認識モデルの開発では、電子ドキュメント上に手書きで書き込まれたアノテーションの検出と、アノテーション対象となるコンテンツを推定する認識モデルを開発することを目標としている。 最初のフェーズであるデジタル手書きアノテーションデータ収集フェーズでは、まず手書き入力可能なタブレット端末上に表示された電子ドキュメントに対して、手書きでアノテーションの書き込みと書き込みデータ取得が実現できるアプリケーションの開発を行う。そして開発したアプリケーションを用いて被験者実験を実施し、アノテーションデータの収集を行うことを計画していた。本年度はHTMLドキュメント上に手書きでアノテーションを行うWindows Storeアプリケーションを実装し、モデル構築の検討に必要な被験者のアノテーションデータ収集の実験を実施したことで本フェーズの目標を達成した。 また次のフェーズであるデジタル手書きアノテーションの分析フェーズでは、前フェーズで収集したアノテーションデータをもとにパターンを抽出し、被験者に依存しない堅牢な手書きアノテーション認識モデルを考案することを計画していた。本年度は収集したアノテーションデータを分析し、下線・囲い込み・縦線のアノテーションパターンに対応したアノテーション認識モデルを考案した。また、追加で実施した被験者実験によって80~90%程度の認識精度を達成可能なことを確認した。 以上により、現在までの達成度としては概ね計画通り順調に進んでいると評価する。
|
今後の研究の推進方策 |
今後の研究計画としては、考案した認識モデルを様々なアプリケーションで利用可能なミドルウェアの開発と、認識モデルを適用したデジタル手書きアノテーションシステムの開発・評価を予定している。 ミドルウェアのの開発においては、オンライン手書きデータ(時系列手書きデータ)と電子ドキュメント情報を入力データとした際に、構造化されたアノテーション情報が出力として得られるモジュールを開発する。多くのアプリケーションで利用可能となるように、使用する手書きデータやアノテーションのフォーマットをW3Cによって標準化が進められているInkMLやOpen Annotation Data Modelといったフォーマットの採用を検討するなど、可用性について慎重に検討を進める必要があると考えている。 またデジタル手書きアノテーションシステムの開発では、実際に提案認識モデルを使用したアプリケーションを開発し、実用的な使用場面における提案モデルの性能評価を実施する予定である。現在の時点で挙がっている実用アプリケーション上での認識モデルを利用する際の懸念点として、誤認識によるユーザの負荷増大である。本年度に考案した認識モデルでは、推定したアノテーション対象範囲が1文字程度ずれるパターンが発生していることが評価実験によって確認されている。実用アプリケーションでこのズレが許容できるかを評価する必要があると考えている。もし認識のズレが許容できない場合は認識精度を向上させるためのモデル再検討や、ユーザによる修正インタラクションに関する検討を実施する予定である。
|
次年度の研究費の使用計画 |
初年度の目標であるアノテーション認識モデルの構築において、被験者からのデータ収集や解析に必要な経費として謝金・解析用計算機・検証端末の購入を予定していた。しかし、想定していた規模よりも小規模で本目標達成に十分なデータが得られたため、次年度使用額が発生した。 昨年度の研究成果として計画通りアノテーション認識モデルの構築が完了した一方、研究発表時における研究者との議論を通じて、提案モデルの実アプリケーションにおける評価の重要性が増した。そこで昨年度生じた次年度使用額については本年度予定している実アプリケーションにおける評価に使用する。昨年度購入予定であった評価で必要な検証端末や解析用計算機の購入、謝金の支払いに当てることを予定している。また交付申請時の計画通り、本年度交付予定の研究費については研究発表に必要な旅費として使用することを予定している。
|