2012 Fiscal Year Research-status Report
中世漢語声点資料による画像付きデータベース構築の研究
Project/Area Number |
24720213
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | 東北文教大学短期大学部 |
Principal Investigator |
加藤 大鶴 東北文教大学短期大学部, その他部局等, 准教授 (20318728)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | データベース / 漢語アクセント / 漢語声調 / 透明テキスト / 画像検索 |
Research Abstract |
本研究の大きな目的は、「画像つき漢語声点データベース(以下DB)」を作成することにある。漢語アクセント型の推定根拠となる声点は、漢字周囲のどの場所に付されるかによって識別される。その識別は研究者による抽象化を経た上で行われるが、なかでも例えば軽点は識別が困難であるために抽象化のプロセスが明示されないことがほとんどである。本研究では主としてDB内の文献画像を直接参照することで、抽象化のプロセスを明示化することを目指す。今年度の研究実績は以下のとおりである。 1. 画像付き漢語声点DBの準備 (1) 差声された漢語部分のみ切り抜いた画像DB(単字単位・単語単位)の集成を行った。予定していた資料は、『尾張国郡司百姓等解文』(早稲田大学図書館蔵本・東京大学史料編纂所蔵本・真福寺蔵本)・『宝物集』(久遠寺本・光長寺本)である。このうち昨年度末時点で公開の許諾が得られているのは『尾張解文』(早大本・東大本)である。(2) 単字・単語を本文文脈に即して理解できるよう、画像本文に検索可能な透明テキストを重ねあわせたPDFも作成した。(3) DBの中核をなす基本テーブルをCSV形式で作成した。テーブルには漢語声点の識別に関わる情報のほか、大漢和辞典番号、韻書における清濁、声調を付し、漢語アクセントの観点による分析のために、拍数や構成、推定アクセント型を掲げる。 2. 中世漢語声点資料の整理と拡充 漢語声点の信頼性・妥当性を検証するために、新たな声点資料として『新猿楽記』(古抄本・弘安本・康永本)を追加調査しDBにテキストデータのみ加えた。また当該資料に現れる漢語声点を分析した結果を、論文に公表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該年度の研究計画は、主として1.資料のデジタルデータ化、2.漢語声点データの切り出し、3.透明テキスト付き画像データの作成であったが、いずれもほぼ順調に進展している。ただし画像のWEB利用については、現段階において所蔵者の許諾を得られないケースもあった。この他、研究協力者の依田平氏から助言を受けながら、業者とDBのデザインや動作の方式などについて打ち合わせを行なっている。
|
Strategy for Future Research Activity |
2年目にあたる本年度は、1.画像データとテキストデータの整理を継続しつつ、2.画像付き漢語声点DBをサーバ上で試験稼働させるため、の具体的なプロセスに進む。サーバ上で実行されるクエリは(1)漢語(漢字表記)、(2)推定語形(仮名表記)、(3)声調の検索を基本的に行い、単字による部分検索も可能なものとする。また、本DBを仮公開しその意義を発表する。
|
Expenditure Plans for the Next FY Research Funding |
上記で述べたように、画像付き漢語声点DBを構築し公開するために、業者に謝礼を支払う。またDB構築にあたっての技術的な工夫に関わる専門的な知識の供与として、研究協力者にも謝礼を支払う。 この他、漢語声点・アクセント分析のための影印資料や専門図書購入費、資料収集のための旅費、資料複写費を予定している。
|