中国殷周金文のデジタルテキスト作成に関する基礎的研究
Project/Area Number |
22K12738
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Ritsumeikan University |
Principal Investigator |
山田 崇仁 立命館大学, 文学部, 非常勤講師 (20425010)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 漢字 / 中国古文字 / 金文 / 甲骨文 / 竹簡文字 / 外字 / Unicode / 情報処理 / 漢字学 / 中国古文字学 / デジタルテキスト / デジタルフォント |
Outline of Research at the Start |
申請課題を含む研究全体の最終的な到達目標は、オープン且つ持続的に利用可能な(殷周金文を含めた)古文字学の標準デジタルテキスト(文字表・グリフ・フォントなど)環境の構築である。本申請は、最終的実装に至るまでのスタートアップ段階に位置づけられ、以下に整理する仮説に従って提示する作業方針に則って作成を進め、どの程度の問題が生ずるのかを調査・分析した結果を踏まえたデジタルテキスト構築が到達目標となる。
|
Outline of Annual Research Achievements |
今年度は、新型コロナウイルスの影響がまだ残っており、海外を中心に研究機関に赴ける機会が限られていたため、研究室で実施可能な内容に絞って取り組んだ。 まず、金文を翻刻(隷定・楷書化)する際に、従来の研究で提案された複数の異なる形での字説を含め、一つの金文をデジタル化する際にどの程度Unicode未収録字が発生するか、またそれを埋めるための外字作成作業量がどの程度発生するかを、実体験として調査した。その結果、文字数約500字の複数の金文でも、100字以上のUnicode未収録字が発生し、外字を作成する必要が生じた。その内訳は、フォントが提供されていないために外字を作成せざるを得なかったUnicode収録字と、現在使用されていない字や異体字であるUnicode未収録字である。 これらの作業については、古い文献を翻刻する際に必然的に生ずる問題だが、特に金文(甲骨文・竹簡などの中国古文字)の字体を隷書や楷書に変換する際に、この問題が顕著になることが改めて確認された。まず、現在使用されていない字の解釈に関して、研究者ごとに異なる見解があるため、論文に引用する際に(将来的に使用する機会がほぼないかもしれないが)、外字を作成する必要が生じた。次に、個々のデザインの違いによって文字を構成する部品配置が異なる場合もあり(偏旁の配置が逆になるなど)、研究者にとっては部品配置を中心とした一定の隷定ルールの設定が望ましいと感じた。また、外字作成に関する作業問題は、グリフウィキを利用した作字と登録がかなり便利なために、それによって一定程度軽減されたが、作字した文字を学術的にどのように扱うか(典拠情報の提供など)という新たな問題にも気がついた。2023年度の研究でも、この課題に取り組み、問題の解決に一定の方向性を付けたいと考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
外字処理に関するデータ構築作業の基礎は概ね予定通り達成できている。問題は、グリフウィキで、当該字が既に登録されているか否かを探す作業が、ともすれば実際の作字作業より長時間を要するという問題である。これについては、ある程度時間をかけて調査するにしても、重複をあえていとわないという姿勢(重複が見つかれば、その都度マージする)で作業を効率よく進めることにした。 これらの作業の結果、PC上での表示やPDFや紙媒体での使用・閲覧に問題ない品質で外字データの作成ができたと判断している。 実際に、作業を進めていて問題となったのは、作成した外字の紐付けである。学術上の信頼性を挙げるためには、外字と典拠(どの論文で誰が提示した字説か/どの著録書のデザインで隷定した字か)の関係を紐付けする必要があることに気がついた。現状のグリフウィキにはこのようなシステムが具わっていない。自作の外字には、コメントで典拠情報をメモとしているが、他者の作成した外字データにはそのような書き込みができない。そのため、別途外字データを管理するデータベースの作成を考えている。
|
Strategy for Future Research Activity |
外字処理に関するデータ構築作業の基礎は概ね予定通り達成できている。Word上での利用はもとより、学術雑誌での利用・印刷も問題なくできているため、この方針で進める予定である。 また、既存の金文著録書データの整理も、2023年度より作業従事者に依頼してデータ登録作業を進める予定である。 更に、2024年度に実施する研究作業の準備作業として、2023年度に内外の甲骨文字・青銅器銘文を観覧・資料を収集して調査し、その文字配置をデジタルテキストとしてどのように表現可能かについての情報収集を進める予定である。
|
Report
(1 results)
Research Products
(3 results)