研究課題/領域番号 |
03402051
|
研究種目 |
一般研究(A)
|
配分区分 | 補助金 |
研究分野 |
情報学
|
研究機関 | 国文学研究資料館 |
研究代表者 |
安永 尚志 国文学研究資料館, 研究情報部, 教授 (20017411)
|
研究分担者 |
原 正一郎 国文学研究資料館, 研究情報部, 助教授 (50218616)
中村 康夫 国文学研究資料館, 研究情報部, 助教授 (60144680)
武井 協三 国文学研究資料館, 研究情報部, 助教授 (60105567)
松村 雄二 国文学研究資料館, 研究情報部, 教授 (10086689)
佐竹 昭廣 国文学研究資料館, 館長 (10025025)
岡 雅彦 国文学研究資料館, 文献資料部, 教授 (20044729)
新井 栄蔵 国文学研究資料館, 研究情報部, 教授 (90111070)
小山 弘志 国文学研究資料館, 館長 (90012179)
堀 浩一 東京大学, 先端科学技術研究センター, 助教授 (40173611)
|
研究期間 (年度) |
1991 – 1994
|
研究課題ステータス |
完了 (1994年度)
|
配分額 *注記 |
28,000千円 (直接経費: 28,000千円)
1994年度: 4,900千円 (直接経費: 4,900千円)
1993年度: 7,200千円 (直接経費: 7,200千円)
1992年度: 7,600千円 (直接経費: 7,600千円)
1991年度: 8,300千円 (直接経費: 8,300千円)
|
キーワード | KOKINルール / 古典テキスト / フルテキストデータベース / テキストデータ記述文法 / SGML / 電子化テキスト / CD-ROM / 日本古典文学データベース / 本文データベース / データ記述文法 / 古典文学 / 噺本大系 / フルテキスト / 日本古典文学作品本文データベース / データ型定義 / DTD / 国文学研究資料館 / 構造化全文データベース / 本文デ-タベ-ス / 日本古典文学作品本文デ-タベ-ス / デ-タ記述文法 / デ-タ型定義 / 構造化全文デ-タベ-ス |
研究概要 |
KOKINルールと呼ぶデータ記述文法を開発した。これにより、日本古典文学の全般的な作品のテキストのデータ記述の枠組を定義した。KOKINルールは3規則から成る。すなわち、KOKINルール♯1は、国文学作品の作品構造及び文体構造の定義を行う。韻文、散文、戯曲の文体毎に、さらに細かくジャンル対応に、TTD(Text-data Type Descripition)を定義する。TTDはSGMLのDTDにほゞ同等である。KOKINルール♯2は、日本語の特有な表記のためのデータ記述である。原文は本文と傍記から成るとする。傍記はテキストであるが、本文に対する付随的な情報と考え、意味を考えない(例えば、読み、振り漢字、校異註、参照等の区別をしない)。KOKINルール♯3は分かち書きを行い、品詞情報や各種属性情報を付加するための規則である。付加価値づけと呼んでいる。 KOKINルールに基づき、岩波書店刊行「日本古典文学大系」の全作品約600について、データ記述を行い、ホストコンピュータに本文データベースとして登録した。また、東京堂出版刊行「噺本大系」全20巻、正保版本歌集「二十一代集」を対象に、記述の精緻化を進め、KOKINルールを完成した。これらの研究成果は国際会議にも発表し、高い評価を得た。また、国際的なデータ流通のための、SGMLやTEIとの連携を進め、二十一代集のSGML化を進め、完成した。とくに、SGMLとKOKINルールとの機能互換性を検証し、評価した。 一方、研究者のデータ利用環境の進展のため、SINETやCD-ROMによるデータ流通の技術開発を進め、実現した。とくに、国際接続による海外からのデータ利用を進め、インターネットによる接続を可能にした。CD-ROMは噺本をサンプルとして、ワークステーション、パソコン用にシステムも含めて、作成し、専門業者との共同研究を行い、製品レベルのシステムの開発に成功した。
|