研究課題/領域番号 |
15K00472
|
研究機関 | 長崎県立大学 |
研究代表者 |
山口 文彦 長崎県立大学, 情報システム学部, 教授 (60339124)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 失われた言語 / ロンゴロンゴ / 三次元形状 |
研究実績の概要 |
本課題では、イースター島で作られた記号の列が彫り込まれた木製品のデジタルデータを収集するとともに、そのような収集に必要な技術の研究、および収集したデジタルデータから言語情報を抽出することを目的としている。対象となる遺物は20点ほどが遺されており、そのうち、比較的大きなものを所有する教会に連絡をとるなど、所有者・所有機関に対して研究への協力を要請している。デジタルデータの収集にあたっては、SfM というモデリング方法を使うことを検討している。SfMは、対象物を複数の方向から撮影した二次元のデジタル写真から三次元の形状を復元する技術であり、従来のレーザーを用いた三次元の形状計測に比べて、強い光を当てる必要がないために遺物にダメージを与えるリスクが小さい。 彫られた線を認識するための手法の概要としては、表面を構成する平均的な面と表面の点の位置の差分を用いる。このとき、平均的な面が自由曲面であるために、平均的な面の構成の仕方に工夫を要する。また、彫られた線を文字として認識するために、手書き文字認識の手法を参考にしている。とくにグレイスケールの文字画像から文字の輪郭を識別しようとする手法は、画素の濃度を平均面との差分に置き換えて考えることで、本課題に大きなヒントを与えるものと注目している。 未解読言語の解読という、正解が不明なために評価が難しい課題であるため、手法自体を既知の言語を使って評価するという研究方法をとる。その目的で、既知言語の文字画像から言語情報を抽出する実験を行うのに必要な、対照実験用データの整備を進めている。 また、こうした、失われた言語を対象とする計算機を用いた研究分野を知ってもらうために、学会誌への解説記事の執筆および学会での講演を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初購入を予定していた三次元形状測定用の機材は、その後の調査により、公称の精度が確保できないなどの問題があることが分かった。代わりに SfM を検討しているが、実際のロンゴロンゴ遺物においては、線が浅くなだらかに彫られているため、文字形状を判別できる精度を確保するには工夫が必要である。 文字形状を得たあとの段階については、言語情報として文字への分類を抽出することを目的としている。その提案手法を評価するために対照実験用データの整備を進めている。こちらについては、碑文の写真画像からエジプト古代文字のデータを作成した。また、NIIと国文研から江戸くずし文字のデータが公開されたので、これを実験に使うためのソフトウェアを開発している。
|
今後の研究の推進方策 |
ひきつづき、ロンゴロンゴ遺物の所有者および所有機関に、三次元データ取得への協力を依頼していく。 対照実験用データである既知言語の文字画像としては、現代日本語の手書き文字、碑文の写真画像から得たエジプトの古代文字、江戸くずし文字が用意できる体制が整っている。このほか、楔形文字についても検討している。
|
次年度使用額が生じた理由 |
申請時には高額な三次元形状測定器の購入を予定していたが、その後の調査により当該機材は公称の精度を確保できないなどの問題があることが分かった。また申請時からの為替変動などによって、当該機材の購入は資金面でも不可能となっている。代わりに、三次元形状測定には SfM という方法を検討中であり、必要な機材およびソフトウェアを購入しているが、当初予定していたものよりも安価である。
|
次年度使用額の使用計画 |
SfM は安価だが、必要な精度を確保するには工夫が必要である。精度を確保できる機材も検討中であり、高価な機材については、レンタルも考えている。また、機材を購入する場合には研究者本人が機材の扱いに習熟できるが、レンタルの場合には機材の扱いに慣れた技術者が必要であり、測定に際しては技術者の出張旅費なども支出する必要があると考えている。
|