• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

ことばを測る ―ヒンディー語とウルドゥー語の語彙属性に関する研究―

研究課題

研究課題/領域番号 24320074
研究機関東京外国語大学

研究代表者

町田 和彦  東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)

研究分担者 三上 喜貴  長岡技術科学大学, 工学(系)研究科(研究院), 教授 (70293264)
萩田 博  東京外国語大学, 大学院総合国際学研究院, 准教授 (80143618)
萬宮 健策  東京外国語大学, 大学院総合国際学研究院, 准教授 (00403204)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード言語学 / ヒンディー語 / ウルドゥー語 / 語彙 / 機械処理
研究概要

ヒンディー語・ウルドゥー語の定量分析の対象である語彙属性に関し語源情報(供給源言語、音韻変化の程度など)をもとにきめ細かく設定し、機械辞書(見出し語形、語彙属性、品詞、活用変化情報、語義など)を作成し、時代ごと(19、20,21 世紀)に選定された両言語の散文テキストを電子化し蓄積する作業を継続した。さらにこれらのテキストに対する機械辞書を利用した自動タグ付け(tagging)の出力結果をもとに語彙属性の定量分析を実施した。また前年度の研究成果をヒンディー語・ウルドゥー語教育に反映させ、各研究項目にフィードバックさせた。
1)【語彙属性の設定と機械辞書作成】機械辞書の量的拡充(新たに約10,000 語、累計約15,000 語)を図ると同時に、精度を向上させた。初年度の研究成果をもとに語彙属性の設定に修正の必要の有無があるか確認し、必要があれば修正し機械辞書全体に反映させた。
2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】散文テキストの電子化(新たに約100 万語、累計約200 万語)をさらに進めた。前年度電子化が済んだテキストについても、より拡充した機械辞書による自動スペルチェックを実施し正確さを向上させた。
3)【語彙属性の定量分析】平成25 年度までの語彙属性の定量分析の結果をもとに日本南アジア学会(2013年10月15日)において研究成果を発表した。内容は、ヒンディー語とウルドゥー語の差異を特徴づける根拠とされるそれぞれの言語に含まれる借用語彙の語源別含有率に関してであった。発表では、両言語の散文作品に出現する語彙の語源別定量分析の過程で明らかになりつつある問題の一部を報告した。

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

1)【語彙属性の設定と機械辞書作成】 機械辞書の量的拡充が予定通りに進んだ。2013年度は、新たに約10,000 語、累計約15,000 語の目標を達成した。
2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】散文テキストの電子化についても予定通りに進んだ。2013年度は、新たに約100 万語、累計約200 万語の目標を達成した。
3)【語彙属性の定量分析】平成25 年度までの語彙属性の定量分析の結果をもとに日本南アジア学会(2013年10月15日)において研究成果を発表した。

今後の研究の推進方策

1)【語彙属性の設定と機械辞書作成】平成25 年度に引き続き、機械辞書の量的拡充(新たに約10,000 語、累計約25,000 語)をはかると同時に、精度を向上させる。作成した機械辞書の語義の充実にも努め、ヒンディー語・ウルドゥー語・英語・日本語辞書への応用とその学習者への公開をはかる。この公開予定の辞書には、本研究の研究成果が反映された両言語の共通基本語彙および各言語特有の使用語彙の区別が明示されるようにする。2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】
前年度に引き続き散文テキストの電子化(新たに約100 万語、累計約300 万語)を進め、目標を達成する。蓄積した電子テキストは、著作権の許す範囲でweb 上に公開する。
3)【語彙属性の定量分析】語彙属性の定量分析の最終結果を反映した、ヒンディー語とウルドゥー語の個別の「語彙属性スペクトル」としてweb 上に公開する。その際、海外の研究者による本研究成果利用の便を考慮し、本研究の問題設定、アプローチの手法、結果について詳細な解説を英語でもつける。

  • 研究成果

    (9件)

すべて 2014 2013 その他

すべて 雑誌論文 (5件) (うち査読あり 1件) 学会発表 (1件) 備考 (3件)

  • [雑誌論文] ウルドゥー語2014

    • 著者名/発表者名
      萬宮健策
    • 雑誌名

      ことばの読み方事典(丸善出版)

      巻: 1 ページ: 1-4

  • [雑誌論文] ヒンディー語2014

    • 著者名/発表者名
      町田和彦
    • 雑誌名

      ことばの読み方事典(丸善出版)

      巻: 1 ページ: 1-8

  • [雑誌論文] インド系文字2014

    • 著者名/発表者名
      町田和彦
    • 雑誌名

      ことばの読み方事典(丸善出版)

      巻: 1 ページ: 1-4

  • [雑誌論文] 文字からことばへ ― 17 世紀のフィールド言語調査を読み解く―2014

    • 著者名/発表者名
      町田和彦
    • 雑誌名

      人文学のフィールドサイエンス

      巻: 1 ページ: 1-20

  • [雑誌論文] ウルドゥー語の所有・存在表現:接尾辞walaを用いた表現が表すもの2013

    • 著者名/発表者名
      萬宮健策
    • 雑誌名

      東京外国語大学語学研究所論集

      巻: 18 ページ: 121-139

    • 査読あり
  • [学会発表] ヒンディー語とウルドゥー語における語形成の問題について

    • 著者名/発表者名
      町田 和彦、萩田 博、萬宮 健策
    • 学会等名
      日本南アジア学会
    • 発表場所
      広島大学
  • [備考] 語彙解析

    • URL

      http://www.aa.tufs.ac.jp/~kmach/hirdu/html/MorphologicalAnalysis.htm

  • [備考] 全文検索

    • URL

      http://www.aa.tufs.ac.jp/~kmach/hirdu/html/fulltextsearch.htm

  • [備考] 語彙頻度

    • URL

      http://www.aa.tufs.ac.jp/~kmach/hirdu/html/wordcount.htm

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi