2007 Fiscal Year Annual Research Report
推論機能を有する木簡など出土文字資料の文字自動認識システムの開発
Project/Area Number |
15102001
|
Research Institution | National Research Institute Cultural Properties, Nara |
Principal Investigator |
渡辺 晃宏 National Research Institute Cultural Properties, Nara, 都城発掘調査部, 史料研究室長 (30212319)
|
Co-Investigator(Kenkyū-buntansha) |
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 史料研究室研究員 (70332195)
市 大樹 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 史料研究室研究員 (00343004)
山田 奨治 国際日本文化研究センター, 准教授 (20248751)
中川 正樹 東京農業工業大学, 共生科学技術研究院, 教授 (10126295)
柴山 守 京都大学, 東南アジア研究所, 教授 (10162645)
|
Keywords | 木簡 / 出土文字資料 / データベース / 赤外線写真 / 文字自動認識(OCR) / 漢字 / 文脈処理 |
Research Abstract |
1、文字画像データベースの充実 ア、文字画像の切り出し:既存木簡写真のデータの切り出しを行い、5カ年間で延べ約20,000文字を蓄積した。イ、「木簡字典」のデータ拡充切り出しデータに基づいてデータを増補した。収録木簡点数は、カラー約1,000点・モノクロ約800点・赤外約200点・記帳約500点、文字種約1,200種、文字数約20,000文字となった。他機関が調査した木簡についても掲載を進め、今年度は束広島市教育委員会のご協力により、安藝国分寺跡の木簡を収録した。今後全国の主要な木簡群を順次掲載し、時代的に地域的に広がりをもつデータベースとして充実を図る予定である。ウ、印刷版「木簡字典」の刊行:WEB公開とは別に、『平城宮木簡』1〜6所収木簡について、親字約940文字、延べ5,000文字を掲載した『日本古代木簡字典』を刊行した。 2、文字自動認識システム(OCR)の改良公開 昨年度試作版を公開した木簡の文字彩読支援システム「Mokkan Shop」を、使用アンケートに基づいて改良し、2008年3月、奈文研のホームページ上でWEB公開した。主な改良点は、字書の入れ替えと、候補表示を文字コードから字形そのものに変更したことである。 3、木簡に関する総合情報サイト「木簡ひろば」の開設 「木簡字典」と「Mokkan Shop」の実用化で所期の目的を達成した研究成果を広く公開するために、木簡に関する総合情報サイト「木簡ひろば」を奈文研のホームページ上に開設し、公開シンポジウム「木簡研究の最前線-地下の正倉院文書をよむ」を実施した(2007/11/23。参加者約100名)。また、木簡のもつ情報のデータ化のあり方を考えるため、「木簡の情報解読・発信・保存活用に関するワークショップ」を開催した(2008/1/8。参加者約30名)。
|
Research Products
(25 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Book] 日本古代木簡字典2008
Author(s)
奈良文化財研究所
Total Pages
192
Publisher
八木書店
Description
「研究成果報告書概要(和文)」より
-
-
-
-