1996 Fiscal Year Annual Research Report
Project/Area Number |
06551005
|
Research Institution | JAPAN WPMEN'S UNIVERSITY |
Principal Investigator |
永村 眞 日本女子大学, 文学部, 教授 (40107470)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 勝海 エーヴァム, テクノロジー(株)・開発研究室, 研究室長(研究職)
千本 英史 奈良女子大学, 文学部, 助教授 (50188489)
黒田 龍二 神戸大学, 工学部, 助教授 (40183800)
山岸 常人 京都大学, 大学院・工学研究科, 助教授 (00142018)
|
Keywords | 句切 / 語句辞書 / テキスト・データベース / 語句索引 / 漢字文字列 / 古文書 / 自動句切 / 東大寺続要録 |
Research Abstract |
(1)自動「句切」処理プログラムの稼働点検 前年度に開発した自動「句切」処理プログラムについて、その機能的な問題点について検討を行った。語句索引の規模がさほど大きくない段階では、一応適正な自動「句切」の実現が確認されたが、「句切」処理の対象となる漢字文字列とマッチングされる語句索引ファイルの階層化が一つの重要な課題となった。 (2)索引編成プログラムの開発 「句切」処理の一つの結末としての索引編成を実現するために、一字KWIC索引、句切語句を配列した語句索引(所在明示形式、KWIC形式)、連関語句を対照して配列した連関語句索引の編成プログラムを開発した。 (3)テストデーターの句切処理作業 テストデーターとして作成した『東大寺続要録』のデータファイルを対象に、マニュアルによる句切指定を行い蓄積された語句索引ファイルにより自動「句切」を実行し、さらにその結果を点検して再句切を施すことにより、徐々に精度の高い語句句切を実現するという形で、句切処理作業を進めた。 (4)テストデータの索引集作成 句切処理作業の成果として蓄積された語句データ・連関語句データを、索引編成プログラムにより配列して索引集を作成した。 (5)開発システム実用化の検討 完結的な機能のまとまりをもつ本システムであるが、処理内容が特殊であるだけに、さしあたり処理機能に細分化し多様な文字列処理に組み込みを検討した。
|