2017 Fiscal Year Research-status Report
インド古典のフレーズインデックス付き統合アーカイブ構築とフレーズ分析
Project/Area Number |
16K12544
|
Research Institution | Kansai Gaidai University |
Principal Investigator |
中谷 英明 関西外国語大学, 外国語学部, 教授 (20140395)
|
Co-Investigator(Kenkyū-buntansha) |
芝野 耕司 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (50216024)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | インド古典 / フレーズ抽出 / インド古典アーカイブ / インド古典の相対年代 / リグ・ヴェーダ / 百道梵書 / フレーズインデックス / パーリ聖典 |
Outline of Annual Research Achievements |
近年インドアーリア古典のデジタル化は急進捗し、プレーン・テキストで約500メガバイトに達する。従来の研究は、中間データ及び処理が膨大になることによる計算限界があったため、1~数件の文献の分析に終始してきた。しかし、グーグルによって開発されたビッグデータ処理技法、MapReduce (2004年)を用い、全く新しい技法として芝野によって開発されたフレ-ズ抽出法によって、すべての「フレーズ」(連続する単語群)の抽出が初めて可能になった。 これを受けて本研究は、次の(1)、(2)を実施し、(3)を解明することを目指す。(1)すべてのフレーズの抽出によるフレーズインデックスを備えたインド主要古典統合アーカイブの構築。(2)データベース構築法、アクセスメソッドサービス並びに索引構成法の開発による、単なる文字コードではなく、フレーズという、言語 の本質的な要素による検索サービス構築方式の確立。(3)パイロットスタディとして、従来の単語、文、韻律単位のテキスト分析にフレーズ分析を加えた総合分析による『リグ・ヴェーダ』『百道党書1『マハーパーラタ』等の解明。 本年度はGRETIL(Goettingen Register of Electronic Texts in Indian Languages)サイトより主要テキストをダウンロードし、そのうち『リグ・ヴェーダ』、『百道梵書』についてフレーズ分析を行った。従来のインデックスに見られないフレーズが多数抽出され、フレーズ分析の有効性が確認された。成立年代が不詳の文献、一文献内に制作年代の異なる諸層が混在する文献が多数を占めるインド古典にとって、フレーズ分析が相対年代を明かす重要な手掛かりとなり、今後インド古典研究の必須のツールとなると考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
以下の2つの理由によって、研究はおおむね順調に進捗していると言える。 1)フレーズ抽出法に改善を加え、前後の文字列を的確に抽出できるように改善した。 2)インド古典内部の層分けに、フレーズ分析がきわめて有効であることが判明した。
|
Strategy for Future Research Activity |
できるだけ多くのインド古典についてフレーズ抽出を行い、それによる分析を1テキストに限らず、複数のテキストに共通のインデックスとして用いる研究を今後推進する。 大部分のテキストの作成年代が不詳であり、また1テキスト内部にも制作年代の異なる層が混在するインド古典にあって、フレーズ分析の有効性は極めて大きいと考えられ、それを実証する。
|
Causes of Carryover |
研究代表者中谷英明が2018年3月末に所属大学を変更したため、引っ越し等に時間を取られ、若干研究費執行が遅れたため。
|
Research Products
(12 results)