研究課題/領域番号 |
13351001
|
研究機関 | 国文学研究資料館 |
研究代表者 |
山崎 誠 国文学研究資料館, 文献資料部, 教授 (70094696)
|
研究分担者 |
丸山 勝巳 国立情報学研究所, ソフトウェア研究系, 教授 (60280533)
永村 真 日本女子大学, 文学部, 教授 (40107470)
野本 忠司 国文学研究資料館, 研究情報部, 助教授 (20321557)
吉良 芳恵 日本女子大学, 文学部, 助教授 (80318584)
湯山 賢一 京都国立博物館, 学芸課, 課長 (00300690)
|
キーワード | 古典籍・古文書解読 / 文字列・画像相互検索DB / 国際研究者交流 / ロシア |
研究概要 |
本年度の本研究の研究実績は以下の四点に要約できる。 (1)基幹DBシステムの設計と開発 14年度までに処理システムの基礎となる文字列と画像DBを構築し、両方のDBを有機的に結合し、画像情報に対応する文字列情報を表示するための基幹システムを開発するため、概要設計・詳細設計をおこない、β版を開発することにほぼ成功した。この資産を承けて本年度は、部分画像の結合処理機能についてと、画像情報とこれに対応するテキスト情報のより緊密な対照処理機能を中心に開発と改良を行った。画像の自動取り込みについて多くの未解決の課題があることが判明した。この課題については、引き続き次年度の重要課題として継続する必要がある。 (2)データ記述方法の確定 史料データの記述方式を検討し、汎用性や可塑性を十分配慮した上で、あらましの記述要領を作成するとともに、先行研究を行っている研究者に参考意見・評価を徴した。カスタマイズ・オーサリングの改善についてはなお、大きい課題を抱えている。今回の開発では断念する方向である。 (3)教材資料の選定と蒐集 本研究の目的にかなった良質の教材を確保するとともに、資料の調査・撮影作業をおこなった。所蔵者の資料使用許諾については難航しているのが実際である。また、最近の電子メディアによる大量データを扱う出版物の構造分析をおこなった。 (4)教材データの生成 蒐集した資料を文字列・画像に分けてデータ化し、DBシステムを稼働させて逐次入力している。この研究は13年度末より、本年度にかけてある程度(約一万件)の入力を終えた。
|