2003 Fiscal Year Annual Research Report
音声記号等で表記された言語資料のマークアップとコンピュータ処理
Project/Area Number |
15202008
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Research Institution | The University of Tokyo |
Principal Investigator |
松村 一登 東京大学, 大学院・人文社会系研究科, 教授 (40165866)
|
Co-Investigator(Kenkyū-buntansha) |
千葉 庄寿 麗澤大学, 外国語学部, 専任講師 (70337723)
滝沢 直宏 名古屋大学, 大学院・国際開発研究科, 助教授 (60252285)
福井 玲 東京大学, 大学院・人文社会系研究科, 助教授 (50199189)
山田 久就 東京大学, 大学院・人文社会系研究科, 助手 (60345246)
|
Keywords | 多言語処理 / 音声記号 / キリル文字 / Unicode / フォント / コンピュータ / コーパス / マークアップ |
Research Abstract |
【Unicodeフォントの作成】フィンランドのフォント専門業者に委託し,Unicode 4.0のラテン文字系,ギリシア文字系,キリル文字系の特殊文字(音声記号を含む)を網羅したSerif体のOpenTypeフォント(JLOT-Fluralic)を作成。海外研究協力者Klaas Ruppel(フィンランド)の協力を得た。 【テキスト入力・加工ツールの開発】マリ語(ウラル諸語)のテクスト(キリル文字系)をUTF-8に変換し,品詞・形態情報付加のための簡易辞書とアルゴリズムの作成にとりかかる(松村)。コーパスから情報を引き出すためのデータ整形,統計処理のツールを開発(滝沢)。品詞形態情報を付加したXMLデータ形式のロシア語コーパスを作成するための研究(山田)。XMLを利用したコーパス検索・分析ツールの研究。 【言語データの準備・追加】イテリメン語(チュクチ・カムチャツカ諸語)のテキスト(ラテン文字系音声転写)とその英語訳を対照させるコーパス作成に取りかかる(研究協力者・小野智香子)。アヴァル語(ダゲスタン諸語)のテキスト(キリル文字系)の入力とかんたんなタグ付け(山田)。19世紀のエストニア語の新聞記事(ドイツ旧字体)のマイクロフィルム撮影とそのデジタル画像資料化を行い,その一部を入力(松村)。 【海外出張】ペテルブルク(ロシア)の言語研究所と北方大学を訪問,ウラル系,チュクチ・カムチャツカ系など,ロシアの少数言語の専門家と情報交換を行い,言語テクスト(当該言語の学校教科書など)を入手(松村,研究協力者・小野)。ヘルシンキのフィンランド内国語研究センターを訪問,フォント開発のための最終打ち合わせ(松村)。タリンのエストニア言語監督庁を訪問,同庁長官とエストニアにおけるロシア語系住民に対する言語政策を中心に,情報交換・意見交換を行う(松村)。
|
Research Products
(4 results)
-
[Publications] MATSUMURA Kazuto: "The Activities of ICHEL and its Future Prospects."UNESCO. (印刷中).
-
[Publications] FUKUI Rei: "Pitch accent systems in Korean."Kaji S.(ed.) Proceedings of the Symposium : Cross-linguistic Studies of Tonal Phenomena. ILCAA. 275-286 (2003)
-
[Publications] 鈴木麗璽, 小野智香子, 松村一登: "フィールド言語学者のためのUnicodeツール(CD-ROM付)"大阪学院大学情報学部「環太平洋の言語」. v+33 (2003)
-
[Publications] 千葉庄寿: "危機言語のコーパス構築のために"大阪学院大学情報学部「環太平洋の言語」. iv+119 (2003)