2023 Fiscal Year Final Research Report
A High-accuracy digitisation of kunten material to generate transcriptions
Project/Area Number |
20K00654
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02070:Japanese linguistics-related
|
Research Institution | Gifu National College of Technology |
Principal Investigator |
Tajima Koji 岐阜工業高等専門学校, その他部局等, 准教授 (90611640)
|
Co-Investigator(Kenkyū-buntansha) |
堤 智昭 筑波大学, 人文社会系, 助教 (80759035)
小助川 貞次 富山大学, 学術研究部人文科学系, 教授 (20201486)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (90415612)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 訓点資料 / データベース / 自動解析 / ヲコト点 / 書き下し文 |
Outline of Final Research Achievements |
In this study, we tried to create a high-accuracy digitisation and analysis of the kunten material with the aim of automatically generating transcriptions of the kunten material. We developed a database of the National Institute for Japanese Language and Linguistics (NINJAL) collection of the Shosho (old printed type editions, Type 3), volumes 1 to 9. The results of this research were presented at the international conference, the 33rd EAJRS Conference. As for the kunten, we focused only on the vermilion Wokoto-ten and extracted them. However, our method was only successful for about 60% in extracting the correct position. We found that more analysis using information from the text, such as the shape of the characters and the characteristics of how they are used, is needed to be more precise.
|
Free Research Field |
情報工学
|
Academic Significance and Societal Importance of the Research Achievements |
本研究の成果は、訓点資料という、解読に必要な知識が多いため限られた研究者しか解析できない資料を、計算機を用いて自動分析する仕組みを構築したことに社会的な意味がある。国語辞典や漢和辞典には、特定の単語の実例として漢籍(漢文による訓点資料)を提示していることが多いが、訓点研究を専門としない研究者が実際の漢文資料を使って、実例を理解することは、必要となる知識が不足するため極めて難しい。本研究では、誰もが平易な形で資料の訓点を詳細に把握できる、資料の訓点情報を詳細に記録したデータベースを構築した。 また、データ使った訓点資料の自動認識も行い、文字の位置に関しては自動で抽出できる成果が得られている。
|