• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

表意文字曖昧検索のための文字表現および検索手法の研究

Research Project

Project/Area Number 24500116
Research InstitutionHiroshima University

Principal Investigator

鈴木 俊哉  広島大学, 情報メディア教育研究センター, 助教 (70311545)

Co-Investigator(Kenkyū-buntansha) 鈴木 敦  茨城大学, 人文学部, 教授 (00272104)
三上 喜貴  長岡技術科学大学, 原子力安全系, 教授 (70293264)
Keywords甲骨文字 / 国際標準
Research Abstract

第2年度は、初年度に「人」「女」部に対してのみ予備的に調査した『殷墟卜辞綜類』(島邦男, 1970(増訂版))と『殷墟甲骨刻辞類纂』(姚孝隧, 1989)見出し字の単純突き合わせを全面的に行った。『殷墟卜辞綜類』検字表総数7508字は4124項目に集約でき、これを『殷墟甲骨刻辞類纂』見出し字4496字とつき合わせた結果、2514字が単純対応可能であった。約2000文字に関しては、甲骨文字における包摂可能な字形差の議論を待つべきものと、拓本資料が不鮮明なために両著書で模写が異なるものが混在している。拓本資料確認の準備段階として、『甲骨文合集』『甲骨文合集補編』から拓本番号ごとの画像の切り出しプログラムを作成し、番号別の画像分解を行った。
また、国際標準における既存の甲骨文字情報として、ISO/IEC 10036のグリフ指示子登録簿に登録された甲骨文字に関する調査を行った。多くは『殷墟卜辞綜類』見出し字をデジタルツールによって模写したものと思われるが、一部は含まれないものもあり、十分な可用性・一般性を持つかどうか(ISO/IEC 10036は符号化文字集合規格ではないので、各グリフの可用性・一般性にはばらつきがある)さらに調査が必要である。また、現時点でグリフデータベースが過負荷のために十分な公開ができていないため、これをデータベースへのクエリが発生しないよう更新するための準備を進めている。
また、『新編甲骨文字形總表』(沈建華, 2001)、『甲骨文字形表』(沈建華, 2008)、『甲骨文字編』(李宗焜, 2012)の見出し字調査を行い、『類纂』に対する差分を明らかにする準備を進めている。さらに中国および台湾での既存の甲骨文字デジタル化動向について調査し、その多くは『殷墟甲骨模釈總集』の隷定現代漢字をデジタル化し、その後甲骨文字に置き換えていることがわかった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

昨年度に開発した画像抽出および対応づけ作業の支援プログラムをさらに改善し斜行補正や等サイズ分割、分割領域の再調整などの機能を付加し、作業効率を高めることができた。さらに、ラスタ画像に対する再符号化を行なわないSVG形式によるクリッピング機能を追加することにより、原画像に対するトラッキングを容易にし、抽出もれの確認の効率を向上させた。これにより、全面的な突き合わせ(初年度の予備的な調査は2部首に対するものであるが、全面的な調査は約150部首に対して行なわねばならない)を実施し、2514字までの対応を明らかにすることができた。
先行する様々な甲骨文字デジタル化事業において、それぞれ個別の文字域設定が行われ、また、その排列方法も自然分類法から説文分類法にいたるまで様々なものがあることが予想された。これらを網羅的に調査し、同字・別字の判断基準を整理することで、先行研究との互換性を保ちながら可用性・一般性の高い甲骨文字の統合基準を設計するために必須である。しかし、中国・台湾の先行研究を調査した結果、成果物がまとまった多くのデジタル化事業は、『殷墟甲骨模釈總集』が隷定した現代漢字をもとに甲骨文字へ置換していることが推測された(現代漢字のデジタル化だけで終了してしまったデジタル化事業も少なくない)。したがって、文字同定基準に関しては本研究の基礎的な方針である『殷墟卜辞綜類』『殷墟甲骨刻辞類纂』の突き合わせに対して差分を調査するという方式でかなりの部分をカバーできることがわかった。このため、計画を円滑に進めることができた。

Strategy for Future Research Activity

『殷墟卜辞綜類』『殷墟甲骨刻辞類纂』の突き合わせ可能な文字に関しては、『殷墟卜辞綜類』の検字表の特性(可能性がある部首全てに掲出する)により、部首分解も実質的に完了したと考えられる。本年度実施した対応結果は、このままでは著作権上の問題があり一般公開がむずかしい。第三者検証が可能な形での公開方法の検討が必要である(たとえば、典拠資料画像はユーザが独自に入手する前提でのクリッピングの位置情報のみによる公開など)。残り2000文字に関して、両書が掲出する用例数を調査し、十分な用例が得られないもの、また、不鮮明資料または極端な断片化により字形が議論困難なもの、を除外し、字形統合範囲の議論が必要なものを選定する。この成果をISO/IEC 10036登録済みの甲骨文字グリフと突き合わせ、現段階で独立な文字符号位置の割り当てが妥当なものを選定し、国際提案に移りたい。
また、現在、漢字から分節した表意・表音の中間状態の文字体系として、女書の標準化が進められているが、甲骨文字と同様に文字の同定基準が不安定なために一貫性がない文字集合での作業が続いている。これに関しても同定手法の検討を行いたい。現時点では中南民族大学グループが検討した部首体系について予備調査を進めている。

Expenditure Plans for the Next FY Research Funding

2013年より女書の標準化が再開され、この文字集合の妥当性評価のため本研究課題の手法適用を進めている(分担者の三上喜貴は2009年に当時の女書の標準文字集合提案に対する日本の専門家からの懸念を紹介し、日本の専門家の窓口となっている)。しかしながら、標準化提案の背景資料の多くが版元やほぼ全ての業者で品切れの状態であり(特に『女書読本』および『女書用字比較』は規格票で参照される資料であるにも関わらず再版予定がない)、やむをえず古書店で手配している状況である。2013年度中には発注した資料の全てについての確保および納品が完了しなかったため、結果として未執行額として残った。
発注済みの資料は2014年度中に納品の見込みである。

  • Research Products

    (8 results)

All 2014 2013

All Journal Article (8 results) (of which Peer Reviewed: 1 results)

  • [Journal Article] 甲骨文字研究の成果蓄積とデジタル化技術-近年の中国・台湾における動向を踏まえて-2014

    • Author(s)
      鈴木敦
    • Journal Title

      飯島武次教授退官記念論集

      Volume: 1 Pages: 101-111

    • Peer Reviewed
  • [Journal Article] HTML文書へのキャラクタデバイスの接続2013

    • Author(s)
      鈴木俊哉
    • Journal Title

      情報処理学会研究報告DD-90-1

      Volume: 1 Pages: 1-8

  • [Journal Article] A Survey on the Achievements of the Oracle Bone Digitization Projects and Prior Definitions of the Targets2013

    • Author(s)
      鈴木敦、鈴木俊哉
    • Journal Title

      情報処理学会研究報告DD-90-6

      Volume: 6 Pages: 1-8

  • [Journal Article] 悉曇文字の国際標準化の動向2013

    • Author(s)
      川幡太一、鈴木俊哉、永崎研宣、下田正弘
    • Journal Title

      情報処理学会研究報告DD-90-7

      Volume: 7 Pages: 1-4

  • [Journal Article] ウイグル文字古文献デジタル化のためのグリフデザインの検討2013

    • Author(s)
      ウメルジャン・オスマン, 中平勝子, 鈴木俊哉, 植村俊亮, 三上喜貴
    • Journal Title

      情報処理学会研究報告DD-90-5

      Volume: 5 Pages: 1-8

  • [Journal Article] Comments on Nushu script in N4484/PDAM12013

    • Author(s)
      suzuki toshiya
    • Journal Title

      ISO/IEC JTC1/SC2/WG2/N4513

      Volume: 1 Pages: 1-13

  • [Journal Article] Additional comments on N4483/PDAM1 - Nushu2013

    • Author(s)
      suzuki toshiya, Orie Endo
    • Journal Title

      ISO/IEC JTC1/SC2/WG2/N4533

      Volume: 1 Pages: 1-2,20-63

  • [Journal Article] Brief Summary of the Discussion about Shape-Based Separation of Siddham Vowel Sign U/UU2013

    • Author(s)
      suzuki toshiya
    • Journal Title

      ISO/IEC JTC1/SC2/WG2/N4557

      Volume: 1 Pages: 1-12

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi