研究課題/領域番号 |
03402051
|
研究機関 | 国文学研究資料館 |
研究代表者 |
安永 尚志 国文学研究資料館, 研究情報部, 教授 (20017411)
|
研究分担者 |
堀 浩一 東京大学, 先端科学技術研究センター, 助教授 (40173611)
武井 協三 国文学研究資料館, 研究情報部, 助教授 (60105567)
新井 栄蔵 国文学研究資料館, 研究情報部, 教授 (90111070)
岡 雅彦 国文学研究資料館, 文献資料部, 教授 (20044729)
小山 弘志 国文学研究資料館, 館長 (90012179)
|
キーワード | 本文デ-タベ-ス / フルテキスト / 日本古典文学作品本文デ-タベ-ス / デ-タ記述文法 / デ-タ型定義 / DTD / 国文学研究資料館 / 構造化全文デ-タベ-ス |
研究概要 |
初年度に当たり、全体計画及び各年次計画の策定を行った。国文学研究資料館設置の大型コンピュ-タと日本古典文学本文デ-タベ-スを活用した。研究環境の整備として、これらのシステムにLAN経由にて高機能ワ-クステ-ション及び高機能パソコン(初年度購入)を接続し、実証実験を開始した。本文デ-タベ-スに対する国文学研究上の要求仕様を確定するために、専門領域の研究者を招き検討を行った。基本的なデ-タ記述文法の設計のために、研究対象ジャンルとして江戸期小噺集及びアンソロジとしての古今和歌集を選定し、プロトタイプ仕様を設計試作した。この文法をKOKIN文法と呼ぶ。作品の構造記述(デ-タ型定義:DTD)と日本語特有の表記形式の変換規則から成る。全体のシステム概念(本文デ-タベ-スの形成、管理、利用システム)を規定し、デ-タ記述文法のパ-ザシステムを大型コンピュ-タ、高機能パソコン上に試作した(プログラム作成費)。機能試験のため作品は論文形式である講演会発表論文を具体的対象とした。次年度にはワ-クステ-ション上で前述の作品に関する構造化デ-タ(DTDによる)を取扱う予定である。一方、今年度作成したKOKIN文法により、具体的なデ-タとして江戸期噺本作品の構造化を進め、約2万種の小噺デ-タベ-スを構築した(入力費、謝金)。この蓄積より、デ-タ入力や流通のための標準化が可能であり、特にエンドユ-ザが使い易くかつ憶え易いということが評価され、実証されたと思われる。 次年度以降は、KOKIN文法の精密化とその言語への拡張法、及び実装方式、ユ-ザインタフェ-ス等の検討を計画している。なお、ハ-ドウェアとして高速に文字列をスキャニングし、発見し統計処理可能なシステムの調査研究を行った。これは国文学研究資料館が導入したので次年度はこのシステムの活用を図る予定である。
|