研究分担者 |
竹原 新 大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹 関西大学, 外国語教育研究機構, 教授 (30230402)
小島 一秀 大阪大学, サイバーメディアセンター, 講師 (60372637)
石島 悌 大阪府立産業技術総合研究所, 情報電子部, 主任研究員 (80359398)
上原 順一 大阪大学, 言語文化研究科, 准教授 (30252737)
|
研究概要 |
本年度は主に、言語資源タグ付け方式の検討のための作業とサポートソフトウェアの開発、ペルシア語資源へのタグ付け試行・ロシア語資源の構築、携帯端末への資源データ搭載調査作業を行った。 本プロジェクトで独自に選定した「言語学的た興味深い文100」(オリジナルは日本語)に,統語情報を示すタグをつける作業を進め,完成させた。また,これを中国語に翻訳し,同様のタグ付け作業を進めた。今後は,これをタグ付けのためのガイドラインとして,日本語と中国語の文法情報付きデータをさらに拡充していく予定である。また,さらに他の言語に翻訳して,タグ付け作業を進める予定である。また作業を補助するためのFLASHソフトウェアを開発し、その成果を言語処理学会で発表する。購入物品の防音室を導入し、録音作業可能な体制を整えた。 GDA化の作業を進めていたペルシア語の会話データについて、試験的に分野ごとによるXMLデータ化の作業を行った。文単位でID番号を付与し、言語名(ペルシア語)を識別するためのデータを付与した。この結果、作成したデータは、ID番号を付与された各文章において、日本語、英語、ペルシア語が並記され、且つ、ペルシア語の部分はGDA方式により構造化された状態となり、試験的とはいえデータとして一通りの完成となった。 ロシア語の言語資源構築については、会話リストにロシア語部分を追加する作業を行った。このリストには約1100項目が記載されており、結果的に、ほぼ全体についてロシア語文を記載することができた。ロシア語文の記載に際しては、文体的なニュアンスは母語話者の判断を尊重した。 携帯端末への応用としてWindows Mobile端末への資源搭載作業を行っているがフォントの扱いに問題があることがわかった。対処方法を検討中である。
|