• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声記号等で表記された言語資料のマークアップとコンピュータ処理

研究課題

研究課題/領域番号 15202008
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 言語学
研究機関東京大学

研究代表者

松村 一登  東京大学, 大学院人文社会系研究科, 教授 (40165866)

研究分担者 福井 玲  東京大学, 大学院人文社会系研究科, 助教授 (50199189)
滝沢 直宏  名古屋大学, 大学院国際開発研究科, 教授 (60252285)
山田 久就  小樽商科大学, 言語センター, 助教授 (60345246)
千葉 庄寿  麗澤大学, 外国語学部, 助教授 (70337723)
畑野 智栄  東京大学, 大学院人文社会系研究科, 助手 (40376520)
研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
20,930千円 (直接経費: 16,100千円、間接経費: 4,830千円)
2005年度: 7,150千円 (直接経費: 5,500千円、間接経費: 1,650千円)
2004年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
2003年度: 7,020千円 (直接経費: 5,400千円、間接経費: 1,620千円)
キーワード音声記号 / キリル文字 / コーパス / 少数言語 / マークアップ / 多言語処理 / 言語資料 / Unicode / コンピュータ / XML / フォント
研究概要

この3年間の研究プロジェクトの第一の目的は,ロシアとその周辺諸国における危機言語をはじめとする少数言語の言語資料を電子化するための方法を研究し,そのための実用的なツールを開発するとともに,実際に少数言語の言語資料を電子化することである。この研究において電子化したのは,アヴァル語(ダゲスタン),イテリメン語(カムチャツカ),ウラル諸語(エストニア語,マリ語,ベプス語)などで,言語資料の大部分は,キリル文字系のアルファベットで表記されたテクスト,ないしは,録音資料を音声記号で転写したものである。このようにして電子化された言語資料は,すべて,Unicode(UTF-8)で入力された。この作業のために,Unicode標準4.0で定義されているすべてのウラル音声記号とキリル文字が実装された高品質のOpenTypeフォント(JLOT-FLuralic)を,海外研究協力者(フィンランド)の協力を得て開発した。また,言語資料のXML文書化のための公開セミナーを開催するなどして,XMLに対する知見も深め,言語資料にXML準拠したマークアップを施して,well-formedなXML文書とすることが実際にできる段階まで到達した。この研究プロジェクトで目的とする言語資料の電子化は,少数言語のコミュニティ(地域方言のコミュニティも含む)の言語使用を記録する営み(language documentation)のもっとも基本的な部分をなすものである。熊本県人吉市(球磨方言),沖縄本島(沖縄語)を訪れて,日本国内の地域方言コミュニティの活動家や研究者にあい,地域方言の書きことばの現状や,言語意識に関する情報を収集したほか,北京の中央民族大学,中国社会科学研究院民族研究所を訪問し,中華人民共和国における少数言語事情,少数言語研究に関する情報収集と研究交流を行った。

報告書

(4件)
  • 2005 実績報告書   研究成果報告書概要
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (52件)

すべて 2006 2005 2004 2003 2002 その他

すべて 雑誌論文 (40件) 図書 (8件) 文献書誌 (4件)

  • [雑誌論文] マリ語の言語資料とその電子化2006

    • 著者名/発表者名
      松村一登
    • 雑誌名

      Uralica 14

      ページ: 45-56

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 『青空文庫』を言語コーパスとして使おう-メタデータ構築による歴史的・社会言語学的研究への応用の試み-2006

    • 著者名/発表者名
      千葉庄寿
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 915-918

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Digitization of Mari linguistic resources2006

    • 著者名/発表者名
      Kazuto Matsumura
    • 雑誌名

      Uralica 14

      ページ: 45-56

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] How to use Aozora Bunko as linguistic corpora : building and utilizing metadata for diacronic and sociolinguistic study2006

    • 著者名/発表者名
      Shoju Chiba
    • 雑誌名

      Proceedings of the 12th Annual Meeting of the Association for Natural Language Processing

      ページ: 915-918

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] マリ語の言語資料とその電子化2006

    • 著者名/発表者名
      松村一登
    • 雑誌名

      Uralica 14(印刷中)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A corpus-based study of the'haven't NP' pattern in American English2005

    • 著者名/発表者名
      滝沢直宏
    • 雑誌名

      Aspects of English Negation

      ページ: 159-171

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] コーパスと言語研究2005

    • 著者名/発表者名
      滝沢直宏
    • 雑誌名

      日語教育 32

      ページ: 3-20

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] イテリメン語テキスト12005

    • 著者名/発表者名
      小野智香子
    • 雑誌名

      環北太平洋の言語 12

      ページ: 81-88

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 1930年代のカルムイクにおける言語政策2005

    • 著者名/発表者名
      荒井幸康
    • 雑誌名

      日本モンゴル学会紀要 35

      ページ: 41-56

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 1930年代のブリヤー卜の言語政策2005

    • 著者名/発表者名
      荒井幸康
    • 雑誌名

      スラヴ研究 52

      ページ: 145-176

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A corpus-based study of the 'haven't NP' pattern in American English2005

    • 著者名/発表者名
      Naohiro Takizawa
    • 雑誌名

      Aspects of English Negation

      ページ: 159-171

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Corpora and Linguistic Studies2005

    • 著者名/発表者名
      Naohiro Takizawa
    • 雑誌名

      Journal of Japanese Language Education Association 32

      ページ: 3-20

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Itelmen Text 12005

    • 著者名/発表者名
      Chikako Ono
    • 雑誌名

      Languages of the North Pacific Rim 12

      ページ: 81-88

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A corpus-based study of the 'haven't NP' pattern in American English2005

    • 著者名/発表者名
      滝沢直宏
    • 雑誌名

      Aspects of English Negation (Iyeiri, Yoko (ed.))

      ページ: 159-171

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] マリ語の言語資料とその電子化2005

    • 著者名/発表者名
      松村 一登
    • 雑誌名

      Uralica 14(印刷中)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] コーパスと言語研究2005

    • 著者名/発表者名
      滝沢直宏
    • 雑誌名

      日語教育 31(印刷中)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Mapping (in)direct causation : a corpus-based approach to the Finnish causative constructions2005

    • 著者名/発表者名
      千葉庄寿
    • 雑誌名

      東北大学言語学論集 11(印刷中)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 周辺的な構文を記述するためのコーパス利用-現代英語におけるSOV構文を例に-2004

    • 著者名/発表者名
      滝沢直宏
    • 雑誌名

      英語コーパス研究 11

      ページ: 153-167

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 形態情報注釈入りロシア語コーパス作成のためのツール2004

    • 著者名/発表者名
      山田久就
    • 雑誌名

      ロシア語ロシア文学研究 36

      ページ: 111-118

    • NAID

      110001247122

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要 2004 実績報告書
  • [雑誌論文] The Cognitive Unit of Segmentation for Speech in Japanese2004

    • 著者名/発表者名
      畑野智栄
    • 雑誌名

      The 18th Internat ional Congress on Acoustics

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] l telmen Verb stem : Morphological Features and Syntactic structure of Intransitive and Transitive2004

    • 著者名/発表者名
      小野智香子
    • 雑誌名

      Languages of the North Pacific Rim 9

      ページ: 169-177

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] イテリメン語の両唇軟口蓋音について2004

    • 著者名/発表者名
      小野智香子
    • 雑誌名

      環北太平洋の言語 11

      ページ: 79-90

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Corpus-Based Description of Peripheral Linguistic Phenomena : With Special Reference to the SOV Construction in Present-Day English2004

    • 著者名/発表者名
      Naohiro Takizawa
    • 雑誌名

      English Corpus Studies 11

      ページ: 153-167

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Tools for building morphologically annotated corpora of Russian2004

    • 著者名/発表者名
      Hisanari Yamada
    • 雑誌名

      Bulletin of the Japan Association for the Study of Russian Language and Literature 36

      ページ: 111-118

    • NAID

      110001247122

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] The cognitive unit of segmentation for speech in Japanese2004

    • 著者名/発表者名
      Toshie Hatano
    • 雑誌名

      The 18th International Congress on Acoustics

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Itelmen verb stem : morphological features and syntactic structure of Intransitive and Transitive2004

    • 著者名/発表者名
      Chikako Ono
    • 雑誌名

      Languages of the North Pacific Rim 9

      ページ: 169-177

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Itelmen labial-velar fricative and approximant2004

    • 著者名/発表者名
      Chikako Ono
    • 雑誌名

      Languages of the North Pacific Rim 11

      ページ: 79-90

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Pitch accent systems in Korean2003

    • 著者名/発表者名
      福井玲
    • 雑誌名

      Proceeding of the Symposium : Cross-linguistic studies of Tonal Phonomena. ILCAA

      ページ: 275-286

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] ロシア北東部における先住少数民族の言語使用2003

    • 著者名/発表者名
      小野智香子
    • 雑誌名

      ことばと社会 7

      ページ: 63-87

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] カムチャッカの自然とともに生きる-イテリメン2003

    • 著者名/発表者名
      小野智香子
    • 雑誌名

      北のことばフィールド・ノート-18の言語と文化-

      ページ: 119-134

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Pitch accent systems in Korean, Proceeding of the Symposium : Cross-linguistic Studies of Tonal Phonomena.2003

    • 著者名/発表者名
      Rei Fukui
    • 雑誌名

      ILCAA

      ページ: 275-286

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Language use of the indigenous minority peoples in the north-eastern part of Russia2003

    • 著者名/発表者名
      Chikako Ono
    • 雑誌名

      Language and Society 7

      ページ: 63-87

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] To Live in the Nature of Kamchatka-Itelmen2003

    • 著者名/発表者名
      Chikako Ono
    • 雑誌名

      Field notes on Northern Languages-18 languages and cultures

      ページ: 119-134

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] カルムィクのことば2002

    • 著者名/発表者名
      荒井幸康
    • 雑誌名

      日本モンゴル学会紀要 32

      ページ: 13-27

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Mapping (in) direct causation : a corpus-based approach to the Finnish causative constructions

    • 著者名/発表者名
      千葉庄寿
    • 雑誌名

      東北大学言語学論集 (印刷中)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 構造化された言語データが言語研究にもたらすもの-コーパスを利用する言語研究者の知識基盤としてのXML-

    • 著者名/発表者名
      千葉庄寿
    • 雑誌名

      麗澤大学紀要 82(印刷中)

    • NAID

      110007326528

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] イテリメン語の動詞語幹の分類とその派生法

    • 著者名/発表者名
      小野智香子
    • 雑誌名

      環北太平洋の言語 13(印刷中)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Mapping (in) direct causation : a corpus-based approach to the Finnish causative constructions

    • 著者名/発表者名
      Shoju Chiba
    • 雑誌名

      Tohoku University Linguistics Journal (in press)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Structured electronic data and corpus-based research : XML as (coming) technological core for linguists

    • 著者名/発表者名
      Shoju Chiba
    • 雑誌名

      Reitaku University Journal 82(in press)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Classification of Itelmen verb stems and their derivation system

    • 著者名/発表者名
      Chikako Ono
    • 雑誌名

      Languages of the North Pacific Rim 13(in press)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] コーパスで一目瞭然2006

    • 著者名/発表者名
      滝沢直宏
    • 総ページ数
      207
    • 出版者
      小学館
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] 言語の統合と分離-1920-1940年代のモンゴル・ブリヤート・カルムイクの言語政策の相関関係を中心に-2006

    • 著者名/発表者名
      荒井幸康
    • 総ページ数
      251
    • 出版者
      三元社
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] A corpus is Indeed Informative!2006

    • 著者名/発表者名
      Naohiro Takizawa
    • 総ページ数
      207
    • 出版者
      Shogakukan
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] 文科系研究者のための多言語処理入門-WindowsXP環境を例に-2005

    • 著者名/発表者名
      千葉庄寿
    • 総ページ数
      80
    • 出版者
      麗澤大学言語研究センター
    • 関連する報告書
      2004 実績報告書
  • [図書] 言語学 第2版2004

    • 著者名/発表者名
      松村一登
    • 総ページ数
      272
    • 出版者
      東京大学出版会
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] Linguistics : an introduction 2 Edition2004

    • 著者名/発表者名
      Kazuto Matsumura
    • 総ページ数
      272
    • 出版者
      University of Tokyo press
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] 麗澤大学言語研究センター

    • 著者名/発表者名
      千葉庄寿
    • 出版者
      文科系研究者のための多言語処理入門-Windows XP環境を例に-(印刷中)
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] An Introduction to Multilingual Computing for the Humanities : Handling Multilingual Texts wih Windows XP

    • 著者名/発表者名
      Shoju Chiba
    • 出版者
      Linguistic Research Center, Reitaku University(in press)
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [文献書誌] MATSUMURA Kazuto: "The Activities of ICHEL and its Future Prospects."UNESCO. (印刷中).

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] FUKUI Rei: "Pitch accent systems in Korean."Kaji S.(ed.) Proceedings of the Symposium : Cross-linguistic Studies of Tonal Phenomena. ILCAA. 275-286 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 鈴木麗璽, 小野智香子, 松村一登: "フィールド言語学者のためのUnicodeツール(CD-ROM付)"大阪学院大学情報学部「環太平洋の言語」. v+33 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 千葉庄寿: "危機言語のコーパス構築のために"大阪学院大学情報学部「環太平洋の言語」. iv+119 (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi