研究課題/領域番号 |
15320090
|
研究種目 |
基盤研究(B)
|
研究機関 | 大阪国際大学 |
研究代表者 |
桶谷 猪久夫 大阪国際大学, 人間科学部, 教授 (90169269)
|
研究分担者 |
柴山 守 京都大学, 東南アジア研究所, 教授 (10162645)
福田 真規夫 大阪国際大学, 人間科学部, 教授 (20218936)
|
キーワード | 全文検索システム / 日本古典文献 / XML / インターネット / 外字属性データベース / 外字処理機能 |
研究概要 |
本研究では、歴史学研究分野における膨大な日本語・漢文文献を対象とする。直接対象とする文献は、日本の記紀である「古事記」、「日本書紀」や「続日本紀」、神祗関係の法令である「延喜式」、特定の地方誌的文書である「出雲国風土記」、日本初の解釈歴史書である「愚管抄」、歌集「万葉集」等であり、さらに、日本古典文献25巻のディジタル化、Web上で英語と日本語(または、両言語)を利用した文献内検索と文献間連携検索、閲覧、再利用を目標にしている。 日本古典文献の一部を文書の実体と共にその論理構造(階層構造)や属性(XML Schema)を定義可能なXML(eXtensible Markup Language)でマークアップし、それらXML化された各種文書ファイルをデータベース管理システム(OpenText:カナダ社)に格納し、インターネットのWebブラウザから高速で有効な検索を実現するためのインターフェースを開発する。今年度は、日本古典文献(「古事記」、「日本書紀」、「続日本紀」、「延喜式」、「愚管抄」、「神皇正統記」)を「日本文」、「英訳文」「原典のページイメージ画像」で格納し、簡易型タグを付加することで英日全文連携検索システムを設計し構築した。これらはURL:http://sunsite.berkeley.edu/JHTI/,http://pnc-ecai.oiu.ac.jp/で公開されている。 (1)日本古典文献の対象文献をOCRを利用し入力した(文字認識でディジタル情報化)。 (2)歴史史料の文書構造と歴史的記述方法に着目した検索手法を開発した。 (3)電子化する歴史史料に出現する外字フォント作成と外字属性データベースを整備・拡張した。 (4)一部文献(「日本書紀」や「続日本紀」)に対して、文書構造や相互関連から有効で効率的な検索を可能にするXMLのタグ付けを定義し、全文検索と組み合わせた文書構造検索方式を開発した。
|