1994 Fiscal Year Annual Research Report
日本史史料テキスト漢字文字列の自動句切処理システムの開発
Project/Area Number |
06551005
|
Research Category |
Grant-in-Aid for Developmental Scientific Research (B)
|
Research Institution | Japan Women's University |
Principal Investigator |
永村 眞 日本女子大学, 文学部, 教授 (40107470)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 勝海 内外エレクトロニクス株式会社, システム開発研究室, 室長
千本 英史 奈良女子大学, 文学部, 助教授 (50188489)
黒田 龍二 神戸大学, 工学部, 助教授 (40183800)
山岸 常人 奈良国立文化財研究所, 平城調査部・遺蹟調査室, 室長 (00142018)
|
Keywords | 日本史史料 / 漢字文字列 / テキスト・データベース / 句切 / 索引 / 語句辞書 / シソ-ラス辞書 / 東大寺続要録 |
Research Abstract |
研究代表者・分担者全員による合議のもとで、開発システムの仕様について検討を加え、システムの概要・詳細設計を行うとともに、プログラム開発を外注した。特に処理システムが大規模となるため、研究と作業の進展にあわせ、段階的に処理システムの開発を進めることとし、今年度は処理システムの基礎となる厖大な語句辞書を生成するための語句辞書ファイル生成システムの開発を実現し、開発システムの稼働による具体的な辞書蓄積の作業に着手した。 なおシステム開発と併行して、テストデータとして、古文書・古記録の両要素をもつ素材として、『東大寺続要録』(東大寺図書館所蔵本)を選定し、その文字列ファイルを入力するとともに、処理の効率を高めるために諸本との校合を施した。 本年度の研究成果として、第一に、漢字文字列処理にあたっての問題点を整理し、その前提となる漢字字種への対応、異体字の処理、複雑な校正符号ともなう原本文字列の表現、語句の同義語への対応、等々の問題について討議を行い、効率的な処理の方針を摸策するとともに、特に複雑な構造をもつ原本文字列や異体字の処理については、処理の前提としての規則化を行うこととした。第二に、データ処理を稼働させるための基本ソフト(UNIX、WINDOWS)における様々な機能上の制約を確認し、特に漢字文字列を取り扱うための画面処理をめぐる制約に対処する有効な方法について検討を加えた。この二点について特記しておきたい。
|