昨年度までの成果であるマルチメディアデータモデルの構想に従って、本年度は源氏物語を題材に手書き文字列検索システムを開発した。当館所蔵の源氏物語の一部のイメージデータとテキストデータ(本人翻字)ならびに行単位の対応情報を作成した。テキストを使って文字列検索した結果を両者の対応情報を利用してイメージ上で見るプロトタイプを開発した。現在、対応情報は行単位のみではあるが、古文書一般に適応し得るデータモデルであると考えている。 このマルチメディアデータモデルの考え方ならびにプロトタイプについては情報処理学会その他で論文発表を行い、特に古文書を計算機で扱う際のヒューマンインタフェースとして評価を受けた。 テキスト処理については、国文学らしい検索機能について検討を行ない、汎用的な処理ライブラリの開発を行った。具体的には堀河百首を対象に、ヨミを含めた異表記の検索、係受け関係の検索、和歌配列の規則性に基づいた和歌の編集、等。ここで開発した検索機能は上記手書き文字列検索システムに組み込んで行く予定である。 また、他の和歌集に適応して行き、処理プログラムの汎用性を評価する計画である。 開発したプロトタイプシステムを成す各ツールとテキスト処理プログラムをフリーソフトウェアとして国文学者に配布する準備を行っている。
|