研究課題/領域番号 |
21KK0004
|
研究種目 |
国際共同研究加速基金(国際共同研究強化(B))
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 京都大学 |
研究代表者 |
天野 恭子 京都大学, 文学研究科, 京都大学人文学連携研究者 (80343250)
|
研究分担者 |
宮川 創 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 助教 (40887345)
夏川 浩明 大阪成蹊大学, データサイエンス学部, 准教授 (90712951)
塚越 柚季 東京大学, 大学院人文社会系研究科(文学部), 助教 (30981782)
横地 優子 京都大学, 文学研究科, 教授 (30230650)
|
研究期間 (年度) |
2021-10-07 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
18,720千円 (直接経費: 14,400千円、間接経費: 4,320千円)
2026年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2025年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2024年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2022年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | 古代インド / ヴェーダ / 年代推定 / データベース / コーパス / 言語分析 / TEIデータ / 情報可視化 / サンスクリット / XMLデータ / 言語層 |
研究開始時の研究の概要 |
本研究は、成立年代や地域、作者についての情報を有しない古代インドのヴェーダ文献群の個々の文献成立の年代・地理同定という難題に、文献学および情報学的手法の両面から取り組む。情報学的手法による言語分析の分野で世界をリードするドイツ、デュッセルドルフ大学のOliver Hellwigと、ヴェーダ文献学の研究蓄積による知見を提供する天野恭子との共同研究によって、ヴェーダ文献の年代推定プログラムの開発に挑む。日々発展しているデジタルヒューマニティーズ分野の新しい手法を取り入れつつ、文献の成立と発展および文献同士の関係を、時空間に位置付けて可視化する、文献史研究成果の新しい表現方法の創出も目指している。
|
研究実績の概要 |
本研究では、古代インドにおいて1500-500BCEに多くの文献を成立させたヴェーダを対象とする。文献の語彙・統語論分析を行い言語の変遷を考察し、ヴェーダ文献の年代を推定するプログラムを完成することが目的である。本研究は、1)ヴェーダ文献の言語層の考察、2)言語層の考察を利用して年代推定を行う、Hellwigの開発する年代推定プログラムの結果を評価しフィードバックを行う、3)ヴェーダ文献の時空間的変遷についてデータ可視化する、ことからなる。1)は天野、宮川、塚越、横地、京極(ライプツィヒ大学)、2)は国際共同研究の相手であるHellwigおよび天野、3)は天野と夏川で担当する。本研究は、Hellwigの率いる、2021-2023年度ドイツ研究教育省Digital Huamanitiesプロジェクト「ChromBMM」と協働する。 2023年度は、1)ヴェーダ文献の言語層の考察として前年度から引き続き、Word2Vec, Transformers, TRACER等の語彙分析ツールを用いた類似分析をもとに、文献の内部構造および文献間関係の考察を進めた。語彙の分布をもとに文献間の類似を章ごとに析出し、その特徴をもとに章の成立年代を推論するという新たな手法を試み、この手法が非常に有効であることが確認できた。 2)については、Hellwigのプロジェクトとの共同研究をさらに進めるため、2日間の国際研究ミーティングを開催し、議論を行った。本研究がターゲットとする文献をHellwigの年代推定プログラムにかけるための条件等を議論した。 3)については、文献の内部構造を、語彙等の条件を変えて可視化できるインタラクティブなシステムの開発に着手し、研究ミーティングにおいて発表を行った。このグラフをAIによる画像分析にかけて類似している(=成立年代が同じ)章を探す新たなアイデアを得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究は、1)ヴェーダ文献の言語層の考察、2)年代推定プログラムの開発、3)文献内部構造および文献間関係の可視化、の3つの柱についてこれまでより一層方針が具体化し、研究が進捗した。部分的には目覚ましい成果を挙げることもできた。 1)のヴェーダ文献の言語層の考察については、これまで文献を章ごとに分け、いくつかの文献の多くの章を一度に分析して類似度を析出しようと試みてきた。しかし結果のデータからある一定の傾向は読み取れるものの、大まかな考察しかできず、行き詰りを見せていた。今年度は2つの文献において対応しているいくつかの章にターゲットを絞り込み、章ごとに文献間の類似を詳しく見るという方針に変更した。分析を試行したところこの方法が非常に有効であることがわかり、文献の年代推定に繋げることができることがわかった。今年度は文献の3つの章について分析することができ、今後文献全体の分析へと進む目途がついた。 2)の年代推定プログラムについては、Hellwigによる開発の状況が良好であり、1)の方法による分析で扱った章をHellwigのプログラムによって分析し、結果を比較するための条件を議論することができ、次年度にいよいよプログラムによる章ごとの分析に着手する準備ができた。 3)の可視化では、これまでに開発してきたマントラ共起関係による文献間関係の可視化システムが実用段階になり、今後新たな考察を生むことが期待できる。また、文献の内部構造を細かく表すことのできる新たな可視化システムについて、データの取り扱いおよびシステム構築の方針が出来上がり、データを試作することができた。グラフの見え方に工夫を加え、文献の内部構造をより直観的に把握できる可視化を考案することができ、今後は何を表示させるかの条件をインタラクティブに変更できるシステムの開発へと研究を進めることができる。
|
今後の研究の推進方策 |
今後も1)ヴェーダ文献の言語層の考察、2)年代推定プログラムの開発、3)文献内部構造および文献間関係の可視化、の3つを柱として研究を推進する。 1)については、今年度行った章ごとに対応する2つの文献間の類似を詳しく分析する手法を、ターゲットとする章を増やして分析を進める。分析を可能にするデータの整形には未だ人力が必要であるが、この方法での分析結果が非常に有意義であるため、この分析を進めることに注力する。2)年代推定プログラムについては、Hellwigが開発したプログラム(ChronBMM)によって、天野が1)でターゲットとする章を分析する。これまでの研究により、文献全体を分析するよりも章ごとに分けたほうがより正しい分析が得られることがわかり、初めてその方法によってChronBMMによる分析を行う。分析結果を評価しフィードバックを行う。 3)については、2023年度に試作したデータを、今後はユーザーインターフェースのシステムによって表示できるよう開発する。このシステムでは、文献における語彙数をもとに章ごとに帯を表示し文献を白地図と見立て、そこに特定の語彙や構文の出現を表示させる。それにより文献の内部構造を考察することが目的である。ユーザーは、特定の語彙や構文を選び表示させることで、様々な視点から文献の内部構造を浮かび上がらせることができる。将来的にはこのグラフをAIの画像分析によって分析し、特徴の類似している章や文献を選び出す、というアイデアを得た。類似している章や文献について、同時期の成立であったり、地理的に近い関係にあるなど、文献の成立背景を論じることが可能となる。 上で述べたの分析はすべて、ヴェーダ文献の形態素解析データを前提としているが、形態素解析データの作成は未だ途上であり文献全体をカバーしておらず、分析は文献の一部分に留まっている。データ作成を進めることにも注力する。
|