2016 Fiscal Year Annual Research Report
平安時代漢字字書総合データベースによる研究基盤の確立
Project/Area Number |
16H03422
|
Research Institution | Hokkaido University |
Principal Investigator |
池田 証壽 北海道大学, 文学研究科, 教授 (20176093)
|
Co-Investigator(Kenkyū-buntansha) |
大槻 信 京都大学, 文学研究科, 教授 (60291994)
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
鈴木 慎吾 大阪大学, 言語文化研究科(言語社会専攻、日本語・日本文化専攻), 講師 (20513360)
斎木 正直 北海道大学, 文学研究科, 専門研究員 (30609037)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 篆隷万象名義 / 新撰字鏡 / 類聚名義抄 / 玉篇 / 切韻 / Unicode / オープンデータ |
Outline of Annual Research Achievements |
本研究の目的は、7万字を超える漢字の処理が可能なUnicodeを用いて、平安時代を代表する部首分類体字書である『篆隷万象名義』『新撰字鏡』『類聚名義抄』を総合した全文テキストデータベースを構築・公開して、日本古辞書の研究基盤を確立することである。このデータベースは「平安時代漢字字書総合データベース」(Integrated Database of Hanzi Dictionaries in Early Japan、略称HDIC)と称する。 本研究は、データベース設計・構築・整備を行う「DB構築班」と、データベース利用・活用・評価を行う「DB活用班」とに分かれて活動した。 DB構築班は、翻刻本文作成について、原本字形の判読、原本字形のUnicode符号化、原本画像利用を検討した。またデータ・フォーマット設計について、字書の本文の構造化データの設計、Web公開方法、プレーンテキストの設計・評価を検討した。本年度のデータベースの入力・整備は、『新撰字鏡』と『類聚名義抄』を中心に行い、全文入力を完了した。データベース公開は、2016年9月、『篆隷万象名義』全文テキストデータベース(TSV形式)をオープンデータとして公開し、12月の人文科学とコンピュータシンポジウムでその概要を発表した(最優秀論文賞受賞)。 DB活用班は、漢字字体・音韻・訓詁・和訓、字書編纂史、文字字形のデジタル記述などの研究を行うことを最終目的とするが、初年度であるため、データベースの公開スケジュール等の事前準備を中心に行った。観智院本『類聚名義抄』のデータベース化と公開に関しては、所蔵者の天理図書館と出版者の八木書店との協議を進め、DB活用班の大槻信教授(研究分担者)、小助川貞次教授(連携協力者)、中井精一教授(富山大学)、石塚晴通教授の協力を得て公開について具体的スケジュールを立てることが可能となった。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
「平安時代漢字字書総合データベース」に収録する日本の漢字字書は、高山寺本『篆隷万象名義』、天治本『新撰字鏡』、図書寮本『類聚名義抄』、観智院本『類聚名義抄』である。以下、進捗状況を述べる。 『篆隷万象名義』全文テキストデータベースを2016年9月にTSV形式で公開した(http://hdic.jp)。その後、原本調査を行って翻刻テキストの精度を高めた。『篆隷万象名義』の文字数は、掲出字約16,000字、注文約120,000字である。『篆隷万象名義』の元になった原本『玉篇』の文字数は、掲出字2,087字、注文約8,800字であり、その一部を公開している。また宋本『玉篇』の文字数は、掲出字22,804字、約184,000字である(全文テキストデータベースは、2015年10月に公開済み)。 『新撰字鏡』は全文入力を完了した。原本調査は、困難だが、最新の写真版を入手できたので、それを利用して、点検と校正を進めた。『新撰字鏡』の文字数は、概算で掲出字約24,000字、注文約190,000字である。 『類聚名義抄』は入力をほぼ完了した。図書寮本『類聚名義抄』の文字数は、概算で掲出字約7,000字、注文約130,000字である。観智院本『類聚名義抄』の文字数は、概算で掲出字約42,000字、注文約310,000字である。観智院本『類聚名義抄』の全文入力を4年の研究期間中に完了することを目指していたが、最初の1年間で完了したので、当初の計画以上に進んでいると判断した。 研究成果の公表は、第61回国際東方学者会議(5月)、韓國口訣学会國際会議(10月)、人文科学とコンピュータシンポジウム2016(12月)などで研究発表を行い、論文公刊も順調に進めた。また、本プロジェクト主催の公開シンポジウムを8月に開催した。
|
Strategy for Future Research Activity |
DB構築班は、翻字本文作成とデータ・フォーマット設計を行うこととしているが、「平安時代漢字字書総合データベース」に収録する高山寺本『篆隷万象名義』、天治本『新撰字鏡』、図書寮本『類聚名義抄』、観智院本『類聚名義抄』の全文テキスト入力がほぼ完成したので、翻刻方針を再度見直して、すべての漢字字書に共通する翻刻方針と、それぞれの漢字字書ごとに個別に設定すべき翻刻方針とを峻別して、点検・校正の作業を進める。データ・フォーマット設計は、TSV形式であるものを、マークアップを施しXML形式に再構成する方策を検討する。 DB活用班は、データベース連携による応用研究の実践を行うこととしているが、「平安時代漢字字書総合データベース」に収録する漢字字書の基礎データが完成したので、それらの利用と点検を兼ねて、漢字字体・音韻・訓詁・和訓の研究、字書編纂史の研究、文字字形のデジタル記述の三つのテーマを検討して行く。具体的には、原本『玉篇』逸文との比較、『新撰字鏡』と『類聚名義抄』の字音・和訓・字体との比較、『色葉字類抄』和訓との比較、古写本翻刻に関する人文情報学的研究の調査と整理などである。 研究成果は、Webでの全文テキストデータベースの公開、検索システムの追加・整備として公表するとともに、第四屆東亞文獻研究國際學術研討會(4月、揚州)、訓点語学会(5月、京都)、EAJS2017(8月、リスボン)などで成果発表を行う計画である。また夏季には、北海道大学(札幌)で、研究代表者、研究分担者、連携研究者、研究協力者による発表を中心に研究集会を開催する。
|
Research Products
(45 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 表記辞書とコーパス2016
Author(s)
高田智和
Organizer
NINJALセミナー「言語データと日本語研究」
Place of Presentation
国立台湾大学(台湾・台北市)
Year and Date
2016-09-20
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-