• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

クラウドソーシングを用いた効率の良いデジタル翻刻手法の開発

研究課題

研究課題/領域番号 17K12790
研究機関千葉大学

研究代表者

池田 光雪  千葉大学, アカデミック・リンク・センター, 特任助教 (10779606)

研究期間 (年度) 2017-04-01 – 2019-03-31
キーワードデジタル翻刻 / クラウドソーシング / マイクロタスク
研究実績の概要

本研究は,画像化されている日本語資料に対するマイクロタスク型クラウドソーシングを用いた効率の良い文字起こし,いわゆるデジタル翻刻手法の設計及びシステムの構築を行うことにより,デジタルアーカイブの更なる利便化等に資することを目的としている.複数の形式や粒度のタスクを組み合わせることや,光学的文字認識の精度により一度に校正する文字数を動的に変化させることなどにより,少ないタスク数でより多くの翻刻を高品質に行うことを目指す.平成29年度の実施内容は次の通りである.
(1)デジタル翻刻を複数の段階に分割する設計の検討:既存のデジタルコレクションに対し実際に行われた光学的文字認識の結果を検討した.それにより,まず図画部分のような偽陽性の要因となる部分を除去し,その後文字認識の結果を校正するという二段階にデジタル翻刻を分ける検討を行った.
(2)マイクロタスクの粒度に応じたタスク設計:文字認識の校正において,選択式や入力式のタスクを組み合わせることにより少ないタスク数で多くの文字の校正が行えるようなタスクの設計を行った.また,スマートフォンやパソコンといった環境の異なる媒体へのタスクの配信を想定し,媒体それぞれに対するタスクの最適化の検討を行った.
(3)試験的なデジタル翻刻システムの実装:(1)(2)の結果を踏まえたマイクロタスク型クラウドソーシングによるデジタル翻刻システムの実装を部分的に行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本研究では,平成29年度中にマイクロタスク型クラウドソーシングによるデジタル翻刻システムの設計及び実装を終え,その評価を行うことを予定していたが,作業が遅れ一部が未完了であり,まだ評価には至っていない.設計通りの実装を行うことに想定以上に時間がかかっているが,研究代表者の職務上および家庭の事情による繁忙の重複等により当初の予定以上にエフォートを割くことが困難な状況であったことが一因である.

今後の研究の推進方策

前述のとおり,マイクロタスク型クラウドソーシングによるデジタル翻刻システムの実装を平成30年度へ繰り越したため,早急に開発を完了する予定である.その上で,実際にデジタル翻刻を行うことで当該システムの評価を行い,タスク設計の改良等へ展開させる予定である.また,年度後半には検討したタスク設計及びデジタル翻刻の結果や得られたデータなどの成果の学会発表もしくは論文執筆による公表を予定する.

次年度使用額が生じた理由

平成29年度の予算執行状況としては,研究計画の遅延により開発したシステムを用いたデジタル翻刻の実施とその評価に着手できなかったため,タスク実施のための人件費が発生しなかった.そのため残額が生じ,平成30年度に繰り越すこととなった.

  • 研究成果

    (2件)

すべて 2018 2017

すべて 学会発表 (2件) (うち招待講演 2件)

  • [学会発表] マイクロタスク型クラウドソーシングを活用した図書館における取り組み2018

    • 著者名/発表者名
      池田光雪
    • 学会等名
      三田図書館情報学会
    • 招待講演
  • [学会発表] デジタルアーカイブの情報技術2017

    • 著者名/発表者名
      橋本雄太,亀田尭宙,池田光雪
    • 学会等名
      アーカイブサミット2017
    • 招待講演

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi