研究課題/領域番号 |
15102001
|
研究種目 |
基盤研究(S)
|
配分区分 | 補助金 |
研究分野 |
日本史
|
研究機関 | 独立行政法人文化財研究所奈良文化財研究所 |
研究代表者 |
渡辺 晃宏 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 史料研究室長 (30212319)
|
研究分担者 |
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 史料研究室研究員 (70332195)
市 大樹 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 史料研究室研究員 (00343004)
山田 奨治 独立行政法人国立文化財機構奈良文化財研究所, 大学共同利用機関法人国際日本文化研究センター, 准教授 (20248751)
中川 正樹 東京農工大学, 共生科学技術研究院, 教授 (10126295)
柴山 守 京都大学, 東南アジア研究所, 教授 (10162645)
山本 崇 独立行政法人文化財研究所奈良文化財研究所, 都城発掘調査部, 史料研究室研究員 (00359449)
鈴木 卓治 国立歴史民俗博物館, 情報資料研究部, 助手 (70270402)
|
研究期間 (年度) |
2003 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
96,980千円 (直接経費: 74,600千円、間接経費: 22,380千円)
2007年度: 21,060千円 (直接経費: 16,200千円、間接経費: 4,860千円)
2006年度: 17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2005年度: 20,670千円 (直接経費: 15,900千円、間接経費: 4,770千円)
2004年度: 22,490千円 (直接経費: 17,300千円、間接経費: 5,190千円)
2003年度: 15,470千円 (直接経費: 11,900千円、間接経費: 3,570千円)
|
キーワード | 木簡 / 出土文字資料 / データベース / 赤外線写真 / 文字自動認識(OCR) / 漢字 / 文脈処理 |
研究概要 |
奈良文化財研究所では、1961年に平城宮跡で初めて木簡を発掘調査して以来、20万点を超える木簡を調査・研究してきた。今回の研究では、この蓄積と、文字認識や情報処理に関する最新の情報学・情報工学との連携を図り、(1)木簡の情報を簡易にデジタル化するシステムの開発、(2)木簡の文字画像データベースの作成、(3)木簡解読支援データベース群の構築、(4)木簡の文字自動認識システム(OCR)の開発の4点を軸に研究を進め、木簡の文字画像データベース「木簡字典」と、木簡の文字解読支援システム「Mokkan Shop」(モッカンショップ)を開発した。 「木簡字典」には、カラー・モノクロ・赤外線写真・記帳ノート(木簡の読み取り記録)の4種類の画像を掲載しており、これまでに約1,200字種、約20,000文字を収録した。「Mokkan Shop」には、今回開発した墨の部分を抽出するための画像処理手法や欠損文字に有効な文字認識システム、及び今回入力した古代の地名・人名・物品名のデータベースに基づく文脈処理モジュールを搭載し、解読の有効性を高めることができた。これにより、全体が残るとは限らない、また劣化の著しい、いわば不完全な状態にあるのを特徴とする木簡を対象とする、画期的な文字の自動認識システムの実用化に成功した。 「木簡字典」と「Mokkan Shop」は、木簡など出土文字資料の総合的研究拠点構築のための有力なツールであり、当該史料の研究だけでなく、歴史学・史料学の研究を大きく前進させることが期待される。 なお、今回の研究成果の公開を含めて木簡に関する情報を広く共有するために総合情報サイト「木簡ひろば」を奈良文化財研究所のホームページ上に開設した。また、WEB公開する木簡字典とは別に、『平城宮木簡』所収木簡を対象とした印刷版「木簡字典」として、『日本古代木簡字典』を刊行した。
|