2017 Fiscal Year Research-status Report
a Study of Efficient Human-assisted OCR of Japanese Books
Project/Area Number |
17K12790
|
Research Institution | Chiba University |
Principal Investigator |
池田 光雪 千葉大学, アカデミック・リンク・センター, 特任助教 (10779606)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | デジタル翻刻 / クラウドソーシング / マイクロタスク |
Outline of Annual Research Achievements |
本研究は,画像化されている日本語資料に対するマイクロタスク型クラウドソーシングを用いた効率の良い文字起こし,いわゆるデジタル翻刻手法の設計及びシステムの構築を行うことにより,デジタルアーカイブの更なる利便化等に資することを目的としている.複数の形式や粒度のタスクを組み合わせることや,光学的文字認識の精度により一度に校正する文字数を動的に変化させることなどにより,少ないタスク数でより多くの翻刻を高品質に行うことを目指す.平成29年度の実施内容は次の通りである. (1)デジタル翻刻を複数の段階に分割する設計の検討:既存のデジタルコレクションに対し実際に行われた光学的文字認識の結果を検討した.それにより,まず図画部分のような偽陽性の要因となる部分を除去し,その後文字認識の結果を校正するという二段階にデジタル翻刻を分ける検討を行った. (2)マイクロタスクの粒度に応じたタスク設計:文字認識の校正において,選択式や入力式のタスクを組み合わせることにより少ないタスク数で多くの文字の校正が行えるようなタスクの設計を行った.また,スマートフォンやパソコンといった環境の異なる媒体へのタスクの配信を想定し,媒体それぞれに対するタスクの最適化の検討を行った. (3)試験的なデジタル翻刻システムの実装:(1)(2)の結果を踏まえたマイクロタスク型クラウドソーシングによるデジタル翻刻システムの実装を部分的に行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究では,平成29年度中にマイクロタスク型クラウドソーシングによるデジタル翻刻システムの設計及び実装を終え,その評価を行うことを予定していたが,作業が遅れ一部が未完了であり,まだ評価には至っていない.設計通りの実装を行うことに想定以上に時間がかかっているが,研究代表者の職務上および家庭の事情による繁忙の重複等により当初の予定以上にエフォートを割くことが困難な状況であったことが一因である.
|
Strategy for Future Research Activity |
前述のとおり,マイクロタスク型クラウドソーシングによるデジタル翻刻システムの実装を平成30年度へ繰り越したため,早急に開発を完了する予定である.その上で,実際にデジタル翻刻を行うことで当該システムの評価を行い,タスク設計の改良等へ展開させる予定である.また,年度後半には検討したタスク設計及びデジタル翻刻の結果や得られたデータなどの成果の学会発表もしくは論文執筆による公表を予定する.
|
Causes of Carryover |
平成29年度の予算執行状況としては,研究計画の遅延により開発したシステムを用いたデジタル翻刻の実施とその評価に着手できなかったため,タスク実施のための人件費が発生しなかった.そのため残額が生じ,平成30年度に繰り越すこととなった.
|
Research Products
(2 results)