• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1996 年度 実績報告書

日本史史料漢字文字列の自動句切処理システムの開発

研究課題

研究課題/領域番号 06551005
研究機関日本女子大学

研究代表者

永村 眞  日本女子大学, 文学部, 教授 (40107470)

研究分担者 阿部 勝海  エーヴァム, テクノロジー(株)・開発研究室, 研究室長(研究職)
千本 英史  奈良女子大学, 文学部, 助教授 (50188489)
黒田 龍二  神戸大学, 工学部, 助教授 (40183800)
山岸 常人  京都大学, 大学院・工学研究科, 助教授 (00142018)
キーワード句切 / 語句辞書 / テキスト・データベース / 語句索引 / 漢字文字列 / 古文書 / 自動句切 / 東大寺続要録
研究概要

(1)自動「句切」処理プログラムの稼働点検
前年度に開発した自動「句切」処理プログラムについて、その機能的な問題点について検討を行った。語句索引の規模がさほど大きくない段階では、一応適正な自動「句切」の実現が確認されたが、「句切」処理の対象となる漢字文字列とマッチングされる語句索引ファイルの階層化が一つの重要な課題となった。
(2)索引編成プログラムの開発
「句切」処理の一つの結末としての索引編成を実現するために、一字KWIC索引、句切語句を配列した語句索引(所在明示形式、KWIC形式)、連関語句を対照して配列した連関語句索引の編成プログラムを開発した。
(3)テストデーターの句切処理作業
テストデーターとして作成した『東大寺続要録』のデータファイルを対象に、マニュアルによる句切指定を行い蓄積された語句索引ファイルにより自動「句切」を実行し、さらにその結果を点検して再句切を施すことにより、徐々に精度の高い語句句切を実現するという形で、句切処理作業を進めた。
(4)テストデータの索引集作成
句切処理作業の成果として蓄積された語句データ・連関語句データを、索引編成プログラムにより配列して索引集を作成した。
(5)開発システム実用化の検討
完結的な機能のまとまりをもつ本システムであるが、処理内容が特殊であるだけに、さしあたり処理機能に細分化し多様な文字列処理に組み込みを検討した。

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 永村眞: "日本史史料全文テキスト・データベースの構築とその活用" 第一回シンポジウム コンピュータ国文学講演集(国文学研究資料館). 61-69 (1996)

URL: 

公開日: 1999-03-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi