1997 Fiscal Year Annual Research Report
WWWによる漢文フルテキスト検索システムの枠組みの研究と実用化
Project/Area Number |
09610372
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Osaka International University for Woman |
Principal Investigator |
桶谷 猪久夫 大阪国際女子大学, 人間科学部, 教授 (90169269)
|
Keywords | インターネット / KWIC / テキスト検索機能 / 画像表示機能 / 外字処理 |
Research Abstract |
本研究は開発の基盤としてワークステーションとパーソナルコンピュータを使用し、ネットワーク環境の下で漢文フルテキスト検索システムを実現し公開することである。検索システムが直接対象とする漢文文書は、個人記録・系図でありながら公的に作成され琉球王国の構造や特質の研究などを推進する上で重要な記録である『琉球家譜』、政事外交等の国策に関して評議し決定する最高機関である評定所で記録作成された『琉球王国評定所文書』とこれらに関連する中国側の文献である。検索システムは、WWW(Wor1d Wide Web)上のCGI(Common Gateway Interface)機能を利用し、インタープリタ言語Perlで実現し一部公開されている。 1.大量な文書データから特定の単語を指定し、その特定パターンを含む用例を検索するKWIC(Keyword in context)形式の検索を実現した。 2.KWICと連携した文書の物理的構成であるぺ一ジテキスト表示機能と原典に近いぺ-ジ画像表示機能を実現した。 3.本文献は外字を漢字通しの組み合わせ(漢字字形の部分品)としてタグ(☆)で囲んで入力した。その入力法を利用して、外字を含む文字列の入力と検索機能を実現した。 4.Unicode(JIS X0221)のGIF形式フォントファイル(20,902字)を作成した。それを利用し、外字表示機能とインターネット上での外字転送機能を実現した。 5.検索語のログファイルの蓄積と解析を可能にした。また、運用開始からのログファイルを利用した検索語の履歴表示機能とその検索語を目的別に分類し、検索時に指定可能にした。
|