• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

インド古典のフレーズインデックス付き統合アーカイブ構築とフレーズ分析

Research Project

Project/Area Number 16K12544
Research InstitutionKansai Gaidai University

Principal Investigator

中谷 英明  関西外国語大学, 外国語学部, 教授 (20140395)

Co-Investigator(Kenkyū-buntansha) 芝野 耕司  東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (50216024)
Project Period (FY) 2016-04-01 – 2019-03-31
Keywordsインド古典 / フレーズ抽出 / インド古典アーカイブ / インド古典の層分け / リグ・ヴェーダ / マハーバーラタ / パーリ仏典 / フレーズインデックス
Outline of Annual Research Achievements

近年インドアーリア古典のデジタル化は急進捗し、プレーン・テキストで約500メガバイトに達する。従来の研究は、中間データ及び処理が膨大になることによる計算限界があったため、1~数件の文献の分析に終始してきた。しかし、グーグルによって開発されたビッグデータ処理技法、MapReduce (2004年)を用い、全く新しい技法として芝野によって開発されたフレ-ズ抽出法によって、すべての「フレーズ」(連続する単語群)の抽出が初めて可能になった。これを受けて本研究は、次の(1)、(2)を実施し、(3)を解明することを目指す。(1)すべてのフレーズの抽出によるフレーズインデックスを備えたインド主要古典統合アーカイブの構築。(2)データベース構築法、アクセスメソッドサービス並びに索引構成法の開発による、単なる文字コードではなく、フレーズという、言語の本質的な要素による検索サービス構築方式の確立。(3)パイロットスタディとして、従来の単語、文、韻律単位のテキスト分析にフレーズ分析を加えた総合分析による『リグ・ヴェーダ』『百道党書1『マハーパーラタ』等の解明。本年度はGRETIL(Goettingen Register of Electronic Texts in Indian Languages)サイトより主要テキストをダウンロードし、そのうち『リグ・ヴェーダ』についてフレーズ分析を行った。従来のインデックスに見られないフレーズが多数抽出され、フレーズ分析の有効性が確認された。成立年代不詳のインド古典にとって、相対年代を明かす重要な手掛かりとなるフレーズ分析は、今後インド古典研究の必須のツールとなると考えられる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

以下の2つの理由によって、研究はおおむね順調に進捗していると言える。
1)フレーズ抽出法に改善を加え、前後の文字列を的確に抽出できるように改善した。
2)インド古典内部の層分けに、フレーズ分析がきわめて有効であることが判明した。

Strategy for Future Research Activity

できるだけ多くのインド古典についてフレーズ抽出を行い、それによる分析を1テキストに限らず、複数のテキストに共通のインデックスとして用いる研究を今後推進する。大部分のテキストの作成年代が不詳であり、また1テキスト内部にも時代の異なる層が混在するインド古典にあって、フレーズ分析の有効性は極めて大きいと考えられ、それを実証する。

Causes of Carryover

インド古典に関する文献学的研究書、すなわち文法、音韻、語形、語彙等に関する主要研究書の多くが出版後50年以上を経過したものであるため、それら文献のpdfファイルがGoogle Scholar, Scribd, Persee等のサイトに直近1~2年において急激にアップロードされ、購入の必要がなくなったことによって図書費を多く節減できたことによる。

Expenditure Plan for Carryover Budget

データ分析に必要な数台のコンピュータを購入する。また引き続きネット上の文献のダウンロード、およびデータの整理のために、アルバイト謝金をを使用する。

  • Research Products

    (8 results)

All 2017 2016

All Journal Article (6 results) (of which Int'l Joint Research: 6 results,  Acknowledgement Compliant: 1 results,  Peer Reviewed: 3 results) Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Buddha’s denial of the universality of mind2017

    • Author(s)
      Hideaki NAKATANI
    • Journal Title

      Bouddhisme et universalisme : de l’Inde au Japon

      Volume: 1 Pages: 印刷中

    • Int'l Joint Research
  • [Journal Article] Le Pali, langue de la realisation de l’enseignement du Buddha2017

    • Author(s)
      Hideaki NAKATANI
    • Journal Title

      Symposium Hieroglossie I, College de France

      Volume: 1 Pages: 印刷中

    • Int'l Joint Research / Acknowledgement Compliant
  • [Journal Article] 2.Modification of word2vec by Formulaic Sequences and Extraction of Useful Expressions for Language Learning from Closed Caption TV Corpus2017

    • Author(s)
      Hajime Mochizuki and Kohji Shibano
    • Journal Title

      The IAFOR International Conference on Language Learning, Hawaii 2017, IICLLHawaii 2017, Honolulu, USA

      Volume: 1 Pages: ポスター発表

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] 3.Developing Intimacy by Style-shifting in Japanese: A TV Subtitle Corpus-based Study, XIAO Tingting2017

    • Author(s)
      Kohji Shibano
    • Journal Title

      The 2017 conference of the American Association for Applied Linguistics (AAAL 2017)

      Volume: 1 Pages: 印刷中

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] 4.Analyzing formulaic sequences in spoken Japanese from a large Japanese TV closed caption corpus2017

    • Author(s)
      Kohji Shibano
    • Journal Title

      The 18th World Congress of Applied Linguistics (AILA 2017), 23-28 July 2017, Rio de Janeiro, Brazil

      Volume: 1 Pages: 印刷中

    • Int'l Joint Research
  • [Journal Article] 1.Extracting Formulaic Sequences Containing Useful Expressions for Language Learning from Closed Caption TV Corpus2016

    • Author(s)
      Hajime Mochizuki and Kohji Shibano
    • Journal Title

      World Conference on E-Learning in Corporate, Government, Healthcare, and Higher Education, E-Learn 2016, Alexandria, USA

      Volume: 1 Pages: 29-37

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] Analyzing formulaic sequences in spoken Japanese from a large Japanese TV closed caption corpus2017

    • Author(s)
      Kohji Shibano
    • Organizer
      The 18th World Congress of Applied Linguistics (AILA 2017), 23-28 July 2017, Rio de Janeiro, Brazil
    • Place of Presentation
      Rio de Janeiro, Brazil
    • Year and Date
      2017-07-23 – 2017-07-28
    • Int'l Joint Research
  • [Presentation] Developing Intimacy by Style-shifting in Japanese: A TV Subtitle Corpus-based Study, XIAO Tingting2017

    • Author(s)
      Kohji Shibano
    • Organizer
      The 2017 conference of the American Association for Applied Linguistics (AAAL 2017)
    • Place of Presentation
      Portland, USA
    • Year and Date
      2017-03-18 – 2017-03-21

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi