• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

ことばを測る ―ヒンディー語とウルドゥー語の語彙属性に関する研究―

Research Project

Project/Area Number 24320074
Research InstitutionTokyo University of Foreign Studies

Principal Investigator

町田 和彦  東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)

Co-Investigator(Kenkyū-buntansha) 三上 喜貴  長岡技術科学大学, 工学(系)研究科(研究院), 教授 (70293264)
萩田 博  東京外国語大学, 大学院総合国際学研究院, 准教授 (80143618)
萬宮 健策  東京外国語大学, 大学院総合国際学研究院, 准教授 (00403204)
Project Period (FY) 2012-04-01 – 2015-03-31
Keywords言語学 / ヒンディー語 / ウルドゥー語 / 語彙 / 機械処理
Research Abstract

ヒンディー語・ウルドゥー語の定量分析の対象である語彙属性に関し語源情報(供給源言語、音韻変化の程度など)をもとにきめ細かく設定し、機械辞書(見出し語形、語彙属性、品詞、活用変化情報、語義など)を作成し、時代ごと(19、20,21 世紀)に選定された両言語の散文テキストを電子化し蓄積する作業を継続した。さらにこれらのテキストに対する機械辞書を利用した自動タグ付け(tagging)の出力結果をもとに語彙属性の定量分析を実施した。また前年度の研究成果をヒンディー語・ウルドゥー語教育に反映させ、各研究項目にフィードバックさせた。
1)【語彙属性の設定と機械辞書作成】機械辞書の量的拡充(新たに約10,000 語、累計約15,000 語)を図ると同時に、精度を向上させた。初年度の研究成果をもとに語彙属性の設定に修正の必要の有無があるか確認し、必要があれば修正し機械辞書全体に反映させた。
2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】散文テキストの電子化(新たに約100 万語、累計約200 万語)をさらに進めた。前年度電子化が済んだテキストについても、より拡充した機械辞書による自動スペルチェックを実施し正確さを向上させた。
3)【語彙属性の定量分析】平成25 年度までの語彙属性の定量分析の結果をもとに日本南アジア学会(2013年10月15日)において研究成果を発表した。内容は、ヒンディー語とウルドゥー語の差異を特徴づける根拠とされるそれぞれの言語に含まれる借用語彙の語源別含有率に関してであった。発表では、両言語の散文作品に出現する語彙の語源別定量分析の過程で明らかになりつつある問題の一部を報告した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

1)【語彙属性の設定と機械辞書作成】 機械辞書の量的拡充が予定通りに進んだ。2013年度は、新たに約10,000 語、累計約15,000 語の目標を達成した。
2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】散文テキストの電子化についても予定通りに進んだ。2013年度は、新たに約100 万語、累計約200 万語の目標を達成した。
3)【語彙属性の定量分析】平成25 年度までの語彙属性の定量分析の結果をもとに日本南アジア学会(2013年10月15日)において研究成果を発表した。

Strategy for Future Research Activity

1)【語彙属性の設定と機械辞書作成】平成25 年度に引き続き、機械辞書の量的拡充(新たに約10,000 語、累計約25,000 語)をはかると同時に、精度を向上させる。作成した機械辞書の語義の充実にも努め、ヒンディー語・ウルドゥー語・英語・日本語辞書への応用とその学習者への公開をはかる。この公開予定の辞書には、本研究の研究成果が反映された両言語の共通基本語彙および各言語特有の使用語彙の区別が明示されるようにする。2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】
前年度に引き続き散文テキストの電子化(新たに約100 万語、累計約300 万語)を進め、目標を達成する。蓄積した電子テキストは、著作権の許す範囲でweb 上に公開する。
3)【語彙属性の定量分析】語彙属性の定量分析の最終結果を反映した、ヒンディー語とウルドゥー語の個別の「語彙属性スペクトル」としてweb 上に公開する。その際、海外の研究者による本研究成果利用の便を考慮し、本研究の問題設定、アプローチの手法、結果について詳細な解説を英語でもつける。

  • Research Products

    (9 results)

All 2014 2013 Other

All Journal Article (5 results) (of which Peer Reviewed: 1 results) Presentation (1 results) Remarks (3 results)

  • [Journal Article] ウルドゥー語2014

    • Author(s)
      萬宮健策
    • Journal Title

      ことばの読み方事典(丸善出版)

      Volume: 1 Pages: 1-4

  • [Journal Article] ヒンディー語2014

    • Author(s)
      町田和彦
    • Journal Title

      ことばの読み方事典(丸善出版)

      Volume: 1 Pages: 1-8

  • [Journal Article] インド系文字2014

    • Author(s)
      町田和彦
    • Journal Title

      ことばの読み方事典(丸善出版)

      Volume: 1 Pages: 1-4

  • [Journal Article] 文字からことばへ ― 17 世紀のフィールド言語調査を読み解く―2014

    • Author(s)
      町田和彦
    • Journal Title

      人文学のフィールドサイエンス

      Volume: 1 Pages: 1-20

  • [Journal Article] ウルドゥー語の所有・存在表現:接尾辞walaを用いた表現が表すもの2013

    • Author(s)
      萬宮健策
    • Journal Title

      東京外国語大学語学研究所論集

      Volume: 18 Pages: 121-139

    • Peer Reviewed
  • [Presentation] ヒンディー語とウルドゥー語における語形成の問題について

    • Author(s)
      町田 和彦、萩田 博、萬宮 健策
    • Organizer
      日本南アジア学会
    • Place of Presentation
      広島大学
  • [Remarks] 語彙解析

    • URL

      http://www.aa.tufs.ac.jp/~kmach/hirdu/html/MorphologicalAnalysis.htm

  • [Remarks] 全文検索

    • URL

      http://www.aa.tufs.ac.jp/~kmach/hirdu/html/fulltextsearch.htm

  • [Remarks] 語彙頻度

    • URL

      http://www.aa.tufs.ac.jp/~kmach/hirdu/html/wordcount.htm

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi