今年度の研究成果として、編著書の出版と、2回の口頭発表が挙げられる。アラビア語テキストの画像ファイルから人名を抽出するため、OCR(光学式文字読取装置)の教師データにText Encoding Initiative (TEI)のタグ付けをしたテキストファイルを用いる手法や、精度が不十分であるアラビア語の形態素解析を介さずにテキストを分析するため、原文と注釈文の長さに注目する手法などを発表した。また、2020年度より年1回開催していたデジタル化技術研究会については、3回開催することができた。ネットワーク分析のための可視化ツールや、デジタルアーカイブの管理ツールなどの使用方法について情報を共有し、操作練習を行うことができた。 新型コロナウイルス感染症の拡大の影響により、本研究課題も当初予定していた海外での文献調査を実施できなかった。研究計画を大幅に変更し、デジタルヒューマニティーズの研究手法の修得に努めることにしたが、その成果の一部を出版物という形で残し、デジタルアーカイブ学会で受賞できたのは僥倖であった。国内外の研究会がオンライン化したことで、さまざまな分野の研究者と交流を深める機会が得られたことが大きい。その一方で、読書会で扱った出版予定の翻訳に基づくテキストデータなど、時間をかけて作業したものの今後も公開できないであろう成果物もある。デジタル化しなかった情報をどのように保存するのか、作成したデータの正確さをどのように保証するかといった、本研究だけでは解決できない課題にも直面した。研究期間としてはここで区切りをつけるが、今後も問題意識は引き継いで研究していきたい。
|