2014 Fiscal Year Annual Research Report
表意文字曖昧検索のための文字表現および検索手法の研究
Project/Area Number |
24500116
|
Research Institution | Hiroshima University |
Principal Investigator |
鈴木 俊哉 広島大学, 情報メディア教育研究センタ, 助教 (70311545)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 敦 茨城大学, 人文学部, 教授 (00272104)
三上 喜貴 長岡技術科学大学, 工学(系)研究科(研究院), 教授 (70293264)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 殷墟卜辭綜類 / 殷墟甲骨刻辭類纂 / 女書 |
Outline of Annual Research Achievements |
最終年度は、『殷墟卜辭綜類』(島邦男, 1969, 以下『綜類』と略す)と『殷墟甲骨刻辭類纂』(姚孝遂, 1989, 以下『類纂』と略す)の見出し字の対応関係調査を全項目に対して行い、また、それぞれが掲出する拓本数を分析し、両書での文字対応関係と字形の揺れの関係の分析を行った。具体的には『綜類』検字総表7569字と、『類纂』項目見出し字4499字の対応関係調査を実施した。この作業は文字の出現文脈などに配慮せず、見出し字字形のみによって行い、その結果、『類纂』項目見出し字のうち2514字を『綜類』に対応づけることができた。残り約2000字に関しては字形差があるため、この字形差が統合可能であるかどうかを出現例数の多寡によって検討した。例数について、『綜類』『類纂』の本文を画像処理的手法により行分解し、拓本番号部分を検出して例数の概算とした(それぞれが掲出する拓本名の数であり、厳密な意味での文字出現数ではなく、また、甲骨資料の断片化も考えた場合「甲骨数」とも異なることには注意が必要である)。その結果、字形対応づけが困難なものの大半は10例未満であり、統合の可否を判断することが困難であることがわかった。具体的には、出現例数が10例以上の項目は900項目未満であり、統合の可否を用例から機械的・帰納的に判断できる甲骨文字は1000個程度と見積もられることがわかった。また、『綜類』『類纂』の比較から、従来、出現例数が少なく同定困難であった文字が、新出甲骨資料によって機械的・帰納的に同定できるようになった例は殆どなく、その意味では統合範囲を議論する材料の検討においては新出資料の網羅性はあまり影響がないこともわかった。 また、本研究で開発した画像分析プログラムを応用し、近年ISO/IEC 10646への追加が提案されている女書の文字同定に関しても検討し、標準化会議での提言を行った。
|