研究課題/領域番号 |
10680401
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 富山大学 |
研究代表者 |
高井 正三 富山大学, 総合情報処理センター, 助教授 (80206705)
|
研究分担者 |
藤本 幸夫 富山大学, 人文学部, 教授 (70093458)
|
研究期間 (年度) |
1998 – 2001
|
キーワード | 朝鮮古書データベース / 旧字体漢字コード / 漢字表示システム / 古文書データベース / WEFT(Web Embedding Fonts Tool) / Web情報検索システム |
研究概要 |
筆者らは、日本現存朝鮮古書データベース(Database of Old Korean Books)システムの構築で最も重要な課題である、常用漢字コードで定義されていない旧字体漢字や朝鮮固有外字のデータ入力方法、検索語の入力方法、検索の方法、検索結果の表示方法およびデータの内容を印刷する方法を、4年に渡って調査、研究、開発した。 筆者らは、古文書のデータベース化(DB化)のための漢字コードの調査を日本、米国及び韓国で実施し、将来性を考慮してUnicodeを選択した。これをベースに、旧字体漢字や朝鮮固有外字は、フォント制作ツールTTEditを用いてDB化に必要な709字種のTrue Typeフォントを作成した。これと並行に、Webベース型DOKB情報検索システムを設計し、開発してきた。作成したフォントをUnicodeに組み込んで、検索結果を表示するシステムを、最初はPCのWindows OS上にMS-Accessを使って構築し、その後Web化してインターネットからのアクセスを可能にした。ついでUNIX-OS上にデータベース管理システムMySQLとWebサーバ管理システムApacheを用いて、PHP言語で構築した。 これらのDBシステムで、旧字体漢字及び朝鮮固有外字の表示方法として、WebのPlug-inソフトウェア、XML(eXtensible Markup Language)及びWEFTによる置換表示方法などを検討した結果、筆者らは、旧字体漢字や朝鮮固有の文字をWebブラウザに組み込んで、固有に定義した文字コードを変換出力する、Microsoft杜のWEFT(Web Embedding Fonts Tool)という手法を採用した。固有定義文字フォントの場合は、置換テーブルを用意し、置換関数を作成して、UnicodeのPrivate Areaに埋め込むなどの作業が必要になるが、このWEFTにより、固有定義文字フォントを、その文字コードに対応させて表示することができた。後の課題は、検索語の入力を、ローマ字入力により国際化に対応させることである。
|