• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

インド古典のフレーズインデックス付き統合アーカイブ構築とフレーズ分析

研究課題

研究課題/領域番号 16K12544
研究機関関西外国語大学

研究代表者

中谷 英明  関西外国語大学, 外国語学部, 教授 (20140395)

研究分担者 芝野 耕司  東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (50216024)
研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードインド古典 / フレーズ抽出 / インド古典アーカイブ / インド古典の相対年代 / リグ・ヴェーダ / 百道梵書 / フレーズインデックス / パーリ聖典
研究実績の概要

近年インドアーリア古典のデジタル化は急進捗し、プレーン・テキストで約500メガバイトに達する。従来の研究は、中間データ及び処理が膨大になることによる計算限界があったため、1~数件の文献の分析に終始してきた。しかし、グーグルによって開発されたビッグデータ処理技法、MapReduce (2004年)を用い、全く新しい技法として芝野によって開発されたフレ-ズ抽出法によって、すべての「フレーズ」(連続する単語群)の抽出が初めて可能になった。
これを受けて本研究は、次の(1)、(2)を実施し、(3)を解明することを目指す。(1)すべてのフレーズの抽出によるフレーズインデックスを備えたインド主要古典統合アーカイブの構築。(2)データベース構築法、アクセスメソッドサービス並びに索引構成法の開発による、単なる文字コードではなく、フレーズという、言語
の本質的な要素による検索サービス構築方式の確立。(3)パイロットスタディとして、従来の単語、文、韻律単位のテキスト分析にフレーズ分析を加えた総合分析による『リグ・ヴェーダ』『百道党書1『マハーパーラタ』等の解明。
本年度はGRETIL(Goettingen Register of Electronic Texts in Indian Languages)サイトより主要テキストをダウンロードし、そのうち『リグ・ヴェーダ』、『百道梵書』についてフレーズ分析を行った。従来のインデックスに見られないフレーズが多数抽出され、フレーズ分析の有効性が確認された。成立年代が不詳の文献、一文献内に制作年代の異なる諸層が混在する文献が多数を占めるインド古典にとって、フレーズ分析が相対年代を明かす重要な手掛かりとなり、今後インド古典研究の必須のツールとなると考えられる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

以下の2つの理由によって、研究はおおむね順調に進捗していると言える。
1)フレーズ抽出法に改善を加え、前後の文字列を的確に抽出できるように改善した。
2)インド古典内部の層分けに、フレーズ分析がきわめて有効であることが判明した。

今後の研究の推進方策

できるだけ多くのインド古典についてフレーズ抽出を行い、それによる分析を1テキストに限らず、複数のテキストに共通のインデックスとして用いる研究を今後推進する。
大部分のテキストの作成年代が不詳であり、また1テキスト内部にも制作年代の異なる層が混在するインド古典にあって、フレーズ分析の有効性は極めて大きいと考えられ、それを実証する。

次年度使用額が生じた理由

研究代表者中谷英明が2018年3月末に所属大学を変更したため、引っ越し等に時間を取られ、若干研究費執行が遅れたため。

  • 研究成果

    (12件)

すべて 2018 2017

すべて 雑誌論文 (6件) (うち国際共著 6件、 査読あり 6件、 オープンアクセス 1件) 学会発表 (6件) (うち国際学会 5件)

  • [雑誌論文] Analyzing Usefulness of Dialogues from Closed Caption TV Corpus as an Example of Can-do Statements for Language Learning2018

    • 著者名/発表者名
      Hajime Mochizuki and Kohji Shibano
    • 雑誌名

      2018 Hawaii University Conference, Arts, Humanities, Social Sciences & Education (AHSE), Hawaii, USA

      巻: 1 ページ: ‐

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Analyzing formulaic sequences in spoken Japanese from a large Japanese TV closed caption corpus2017

    • 著者名/発表者名
      Kohji Shibano
    • 雑誌名

      The 18th World Congress of Applied Linguistics (AILA 2017), 23-28 July 2017

      巻: 1 ページ: -

    • 査読あり / 国際共著
  • [雑誌論文] Developing Intimacy by Style-shifting in Japanese: A TV Subtitle Corpus-based Study, XIAO Tingting,2017

    • 著者名/発表者名
      Kohji Shibano
    • 雑誌名

      The 2017 conference of the American Association for Applied Linguistics (AAAL 2017), 18-21 March, 2017

      巻: 1 ページ: -

    • 査読あり / 国際共著
  • [雑誌論文] Searching Discourse Segments for Formulaic Sequences in a Closed Caption TV Corpus for Language Learning,2017

    • 著者名/発表者名
      Hajime Mochizuki and Kohji Shibano
    • 雑誌名

      World Conference on E-Learning in Corporate, Government, Healthcare, and Higher Education

      巻: 1 ページ: 19-27

    • 査読あり / 国際共著
  • [雑誌論文] Discourse Segment Clustering with Word Embedding based on Formulaic Sequences for Language Education2017

    • 著者名/発表者名
      Kohji ShibanoHajime Mochizuki and Kohji Shibano,
    • 雑誌名

      International Conference on Education and Multimedia Technology (ICEMT 2017)

      巻: 1 ページ: -

    • 査読あり / 国際共著
  • [雑誌論文] The Acquisition of a Japanese Practical Formulaic Sequences List from a Closed Caption TV Corpus2017

    • 著者名/発表者名
      Hajime Mochizuki and Kohji Shibano,
    • 雑誌名

      Hawaii University Conferences, STAM/STEAM Education Conference

      巻: 1 ページ: -

    • 査読あり / 国際共著
  • [学会発表] nalyzing formulaic sequences in spoken Japanese from a large Japanese TV closed caption corpus2018

    • 著者名/発表者名
      Kohji Shibano
    • 学会等名
      The 18th World Congress of Applied Linguistics
    • 国際学会
  • [学会発表] 八頌品(アッタカ・ヴァッガ)の韻律と思想2017

    • 著者名/発表者名
      中谷英明
    • 学会等名
      日本印度学仏教学会第68回学術大会
  • [学会発表] eveloping Intimacy by Style-shifting in Japanese: A TV Subtitle Corpus-based Study, XIAO Tingting,2017

    • 著者名/発表者名
      Kohji Shibano
    • 学会等名
      The 2017 conference of the American Association for Applied Linguistics
    • 国際学会
  • [学会発表] Analyzing Usefulness of Dialogues from Closed Caption TV Corpus as an Example of Can-do Statements for Language Learning,2017

    • 著者名/発表者名
      Hajime Mochizuki and Kohji Shibano
    • 学会等名
      2018 Hawaii University Conference, Arts, Humanities, Social Sciences & Education
    • 国際学会
  • [学会発表] Discourse Segment Clustering with Word Embedding based on Formulaic Sequences for Language Education2017

    • 著者名/発表者名
      Hajime Mochizuki and Kohji Shibano
    • 学会等名
      International Conference on Education and Multimedia Technology
    • 国際学会
  • [学会発表] The Acquisition of a Japanese Practical Formulaic Sequences List from a Closed Caption TV Corpus,2017

    • 著者名/発表者名
      Hajime Mochizuki and Kohji Shibano
    • 学会等名
      2017 Hawaii University Conferences, STAM/STEAM Education Conference
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi