• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

音声記号等で表記された言語資料のマークアップとコンピュータ処理

研究課題

研究課題/領域番号 15202008
研究種目

基盤研究(A)

研究機関東京大学

研究代表者

松村 一登  東京大学, 大学院・人文社会系研究科, 教授 (40165866)

研究分担者 千葉 庄寿  麗澤大学, 外国語学部, 専任講師 (70337723)
滝沢 直宏  名古屋大学, 大学院・国際開発研究科, 助教授 (60252285)
福井 玲  東京大学, 大学院・人文社会系研究科, 助教授 (50199189)
山田 久就  東京大学, 大学院・人文社会系研究科, 助手 (60345246)
キーワード多言語処理 / 音声記号 / キリル文字 / Unicode / フォント / コンピュータ / コーパス / マークアップ
研究概要

【Unicodeフォントの作成】フィンランドのフォント専門業者に委託し,Unicode 4.0のラテン文字系,ギリシア文字系,キリル文字系の特殊文字(音声記号を含む)を網羅したSerif体のOpenTypeフォント(JLOT-Fluralic)を作成。海外研究協力者Klaas Ruppel(フィンランド)の協力を得た。
【テキスト入力・加工ツールの開発】マリ語(ウラル諸語)のテクスト(キリル文字系)をUTF-8に変換し,品詞・形態情報付加のための簡易辞書とアルゴリズムの作成にとりかかる(松村)。コーパスから情報を引き出すためのデータ整形,統計処理のツールを開発(滝沢)。品詞形態情報を付加したXMLデータ形式のロシア語コーパスを作成するための研究(山田)。XMLを利用したコーパス検索・分析ツールの研究。
【言語データの準備・追加】イテリメン語(チュクチ・カムチャツカ諸語)のテキスト(ラテン文字系音声転写)とその英語訳を対照させるコーパス作成に取りかかる(研究協力者・小野智香子)。アヴァル語(ダゲスタン諸語)のテキスト(キリル文字系)の入力とかんたんなタグ付け(山田)。19世紀のエストニア語の新聞記事(ドイツ旧字体)のマイクロフィルム撮影とそのデジタル画像資料化を行い,その一部を入力(松村)。
【海外出張】ペテルブルク(ロシア)の言語研究所と北方大学を訪問,ウラル系,チュクチ・カムチャツカ系など,ロシアの少数言語の専門家と情報交換を行い,言語テクスト(当該言語の学校教科書など)を入手(松村,研究協力者・小野)。ヘルシンキのフィンランド内国語研究センターを訪問,フォント開発のための最終打ち合わせ(松村)。タリンのエストニア言語監督庁を訪問,同庁長官とエストニアにおけるロシア語系住民に対する言語政策を中心に,情報交換・意見交換を行う(松村)。

  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] MATSUMURA Kazuto: "The Activities of ICHEL and its Future Prospects."UNESCO. (印刷中).

  • [文献書誌] FUKUI Rei: "Pitch accent systems in Korean."Kaji S.(ed.) Proceedings of the Symposium : Cross-linguistic Studies of Tonal Phenomena. ILCAA. 275-286 (2003)

  • [文献書誌] 鈴木麗璽, 小野智香子, 松村一登: "フィールド言語学者のためのUnicodeツール(CD-ROM付)"大阪学院大学情報学部「環太平洋の言語」. v+33 (2003)

  • [文献書誌] 千葉庄寿: "危機言語のコーパス構築のために"大阪学院大学情報学部「環太平洋の言語」. iv+119 (2003)

URL: 

公開日: 2005-04-18   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi