2013 Fiscal Year Annual Research Report
アジア文化圏の古文書アーカイビングのための基盤構築
Project/Area Number |
24300095
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
中川 正樹 東京農工大学, 工学(系)研究科(研究院), 教授 (10126295)
|
Co-Investigator(Kenkyū-buntansha) |
朱 碧蘭 東京農工大学, 工学(系)研究科(研究院), 助教 (50466918)
斎藤 隆文 東京農工大学, 工学(系)研究科(研究院), 教授 (60293007)
堀田 政二 東京農工大学, 工学(系)研究科(研究院), 准教授 (90346932)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 古文書 / アーカイブ / 画像処理 / 言語処理 / 文字認識 |
Research Abstract |
本研究では,研究期間内に次の4つの項目を達成することを目標にしている. (1)媒体に特有な画像処理方式の確立とライブラリ化.アジア文化圏においては,紙以前は木簡,竹簡などに墨で筆記されていることが多い.これらの媒体に特有な劣化,汚損・破損に対応できる画像処理技術を確立する.(2)言語に共通な文書解析手法の確立とライブラリ化. 多字種,分かち書きなし,縦書き横書き混在,などに対応した手法を言語独立に確立する.(3)言語依存の文字認識と文書解析の確立とライブラリ化.言語共通にメタなシステムを提供し,個々の言語ごとに学習パターンから認識システムを構築できる戦略をとる.そのための方式やツールを確立する.(4)上記機能によるタグ付けと手書きアノテーション機能の確立.古文書のディジタルアーカイブには,発掘や採集情報のほかに,文書や文字にコードを割り振るタグ付けとアノテーションの付与が必須である. 初年度には,古文書に見られる黒ずみやくすみなどを除去するノイズ除去,そして,文書からの行切り出し・文字切り出しの手法を研究し,そのプロトタイプを作成した.本年度は,その改良に加えて, ベトナムのチュノム文書を解読するために,4万字種にも及ぶチュノム文字認識システムのプロトタイプを作成した.また,奈良平城京などから出土する木簡を対象に,アノテーションツールを開発した.このアノテーションツールは,奈良文化財研究所で試用に供している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は、計画に従いベトナムのチュノム文書を解読するために,4万字種にも及ぶチュノム文字認識システムのプロトタイプを作成した.また,奈良平城京などから出土する木簡を対象に,アノテーションツールを開発した.このアノテーションツールは,奈良文化財研究所で試用に供している.
|
Strategy for Future Research Activity |
開発したソフトウェアの完成度を高める.機械翻訳の組み込みやWebアプリケーションとして公開するために,ベトナムの大学との共同研究を企画する.本年度は主にシステム開発のための謝金と、学会発表経費に利用する.
|