2019 Fiscal Year Research-status Report
紛争地域の史資料保存のための基礎的研究:イラクの新聞保存を事例に
Project/Area Number |
18K01019
|
Research Institution | Institute of Developing Economies, Japan External Trade Organization |
Principal Investigator |
高橋 理枝 独立行政法人日本貿易振興機構アジア経済研究所, 研究推進部地域研究推進課, 主幹・主任調査研究員 (00534877)
|
Co-Investigator(Kenkyū-buntansha) |
山尾 大 九州大学, 比較社会文化研究院, 准教授 (80598706)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | イラク / 新聞 / 資料保存 |
Outline of Annual Research Achievements |
本研究では、フセイン体制時代のイラクの新聞を取りあげ、紛争地域の史資料を保全し、将来にわたり学術研究および紛争地域の復興に活用するため、当該地 域外の図書館における可能かつ効果的な貢献方法について明らかにすることを目的としている。 2018-2019年度は、フセイン体制時代のイラクの新聞の国内外での所蔵状況の確認、新聞の変遷や各紙の性格を調査した。また効果的な保存方法に関する調査と検討を行い、保存部数の多いタイトルについて保存対策を施した。具体的には、①アジア経済研究所図書館で所蔵しているタイトルを中心に、国内および海外(主にアメリカ・イギリス)の他館での所蔵状況および書誌変遷についてWorldCat等の書誌データベースを用いて調査した。また現物を確認しながら、未整理分の書誌を整備した。②それらの新聞の性格を、イラクの新聞やジャーナリズムに関する資料にあたって調査した。③効果的な保存方法については、過去分との整合性がとれていることが利用に資すると判断し、バックナンバーの形態に合わせた保存対策を施すこととした。過去分が製本されているタイトルの未製本分を製本し、また既にマイクロフィルム化されている新聞についてはマイクロフィルム化を進めた。④マイクロフィルム化と電子化のどちらが保存対策として効果的かについては、検討の結果、技術的に確立されているマイクロフィルム化の方が長期にわたる保存に耐え、また費用も安いが、電子化の上OCRによるテキスト化を行う方が、新聞記事の検索やテキスト分析が可能となるため、研究の利便性を高めることが判明した。現在はデジタル化に合わせてOCRによるテキスト化を行うため、各種OCRソフトウェアを用いたテストを行っている。今後、テストの結果と費用対効果を鑑み、重要度と今後の利用見込みから、デジタル化するタイトルとマイクロフィルム化するタイトルを決定する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
マイクロフィルム化は順調に進んでいるが、デジタル化とOCRによるテキスト化はまだテスト段階にある。理由は、アラビア語紙面のOCRによるテキスト化が難航しているためである。 まずOCRのテストを行うために、紙面をテスト的にスキャンしたが、精度が高くない一方でファイル容量ばかりが大きくなり、どういう設定がOCRのテストに適切か試行錯誤する必要があった。スキャンの精度が落ち着いたところでOCRのテストを行ったが、最初にテストを行った無料のOCRソフトではアラビア語の分析レベルが低く、使用に耐えるものではなかった。加えて新聞の紙面は、通常の文書とは異なり、写真を含めブロック化された記事の流れを正確にとらえる必要がある。有料のOCRソフトを使ってテストしている段階であるが、記事の流れを含めて自動である程度正確に分析できるのかどうかが現段階では不明である。記事の流れを1ページずつ手動で指定するのは作業量が大きすぎるでため、OCRをどこまで実施するか、費用対効果を含めて検討する必要がある。 デジタル化を進めるためには、OCRの状況を確認し、それに合わせた仕様書を作成する必要があるが、OCR化のテストが難航しているため、遅れが生じている状況である。
|
Strategy for Future Research Activity |
現状でOCR化の鍵と考えられる紙面の分析を、手持ちのOCR有料ソフトにてどの程度まで正確に行えるのかのテストを続ける。場合によっては、他の有料ソフトの調達も視野に入れる。ある程度のテストが進んだ段階で、OCRソフトの分析能力に応じて、今回デジタル化だけでなくOCR化も合わせて行うのか、OCR化は業者に委託するのか自力で行うのか、あるいはデジタル化のみにとどめるのかを決定する。その上で、まだ保護対策を施していない新聞のどれをデジタル化し、どれをマイクロフィルム化するのかを決定し、デジタル化(場合によってはOCR化も含む)の仕様書を作成し、デジタル化を行う。マイクロフィルム化については対象紙が決まり次第、引き続き昨年度同様に業務委託で進める。 なお、各紙の内容の分析、およびそれらの情報をとりまとめてWebで公開する準備も合わせて進める。
|
Causes of Carryover |
マイクロフィルム化の業務委託を行ったが、2018年度から準備を進めてきた対象紙をまとめて発注したため、想定よりも単価が安くなった。またデジタル化も業務委託で行う予定だったが、テスト状況が芳しくなく、実施できなかったため、予定していた経費に残額が発生した。
|