研究課題/領域番号 |
03402051
|
研究種目 |
一般研究(A)
|
配分区分 | 補助金 |
研究分野 |
情報学
|
研究機関 | 国文学研究資料館 |
研究代表者 |
安永 尚志 国文学研究資料館, 研究情報部, 教授 (20017411)
|
研究分担者 |
原 正一郎 国文学研究資料館, 研究情報部, 助教授 (50218616)
中村 康夫 国文学研究資料館, 研究情報部, 助教授 (60144680)
武井 協三 国文学研究資料館, 研究情報部, 助教授 (60105567)
松村 雄二 国文学研究資料館, 研究情報部, 教授 (10086689)
佐竹 昭廣 国文学研究資料館, 館長 (10025025)
|
研究期間 (年度) |
1991 – 1994
|
キーワード | KOKINルール / 古典テキスト / フルテキストデータベース / テキストデータ記述文法 / SGML / 電子化テキスト / CD-ROM / 日本古典文学データベース |
研究概要 |
KOKINルールと呼ぶデータ記述文法を開発した。これにより、日本古典文学の全般的な作品のテキストのデータ記述の枠組を定義した。KOKINルールは3規則から成る。すなわち、KOKINルール♯1は、国文学作品の作品構造及び文体構造の定義を行う。韻文、散文、戯曲の文体毎に、さらに細かくジャンル対応に、TTD(Text-data Type Descripition)を定義する。TTDはSGMLのDTDにほゞ同等である。KOKINルール♯2は、日本語の特有な表記のためのデータ記述である。原文は本文と傍記から成るとする。傍記はテキストであるが、本文に対する付随的な情報と考え、意味を考えない(例えば、読み、振り漢字、校異註、参照等の区別をしない)。KOKINルール♯3は分かち書きを行い、品詞情報や各種属性情報を付加するための規則である。付加価値づけと呼んでいる。 KOKINルールに基づき、岩波書店刊行「日本古典文学大系」の全作品約600について、データ記述を行い、ホストコンピュータに本文データベースとして登録した。また、東京堂出版刊行「噺本大系」全20巻、正保版本歌集「二十一代集」を対象に、記述の精緻化を進め、KOKINルールを完成した。これらの研究成果は国際会議にも発表し、高い評価を得た。また、国際的なデータ流通のための、SGMLやTEIとの連携を進め、二十一代集のSGML化を進め、完成した。とくに、SGMLとKOKINルールとの機能互換性を検証し、評価した。 一方、研究者のデータ利用環境の進展のため、SINETやCD-ROMによるデータ流通の技術開発を進め、実現した。とくに、国際接続による海外からのデータ利用を進め、インターネットによる接続を可能にした。CD-ROMは噺本をサンプルとして、ワークステーション、パソコン用にシステムも含めて、作成し、専門業者との共同研究を行い、製品レベルのシステムの開発に成功した。
|