2008 Fiscal Year Annual Research Report
LCTLを含む多言語平行マルチメディア資源の構築と構造化方式の研究
Project/Area Number |
19300047
|
Research Institution | Osaka University |
Principal Investigator |
堀 一成 Osaka University, 大学教育実践センター, 准教授 (80270346)
|
Co-Investigator(Kenkyū-buntansha) |
竹原 新 大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹 関西大学, 外国語教育研究機構, 教授 (30230402)
小島 一秀 大阪大学, サイバーメディアセンター, 講師 (60372637)
上原 順一 大阪大学, 言語文化研究科, 准教授 (30252737)
鈴木 慎吾 京都産業大学, 外国語学部, 助教 (20513360)
|
Keywords | 外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL |
Research Abstract |
本年度は主に、言語資源タグ付け方式の検討作業と、オントロジー情報を付加する作業のためのソフトウェア開発、ペルシア語資源へのタグ付け完成、ロシア語資源の構築を行った。また、携帯端末技術についても研究を行った。 昨年度は、本プロジェクトで独自に選定した「言語学的に興味深い文100」に、統語情報を示すタグをつける作業を進めた。本年度も作業を進め、100文タグ付加作業は、日本語・中国語が完成し、現在朝鮮語の翻訳作業を行っている状況である。さらに、オントロジー情報も付与すべきであるとの結論に至った。オントロジー情報付与支援ツールは数種類知られているが、いずれも、外国語学専攻の作業者には利用が困難であった。作業を補助するためのFLASHソフトウェアを開発し、言語処理学会で発表した。このツールを用いてオントロジーを付加するための、サンプル文も中国語と日本語で作成している。 GDA化の作業を進めていたペルシア語の会話データについては、データとしての質を一層高めた。特にGDA構造化情報はレベル3(詳細な統語構造)までの付与に進展した。その作業において人称語尾の変化を動詞のタグ内に埋め込む必要があるなど、改良すべき問題点が発見された。その成果を「イラン研究」誌に論文として発表した。 ロシア語の言語資源構築については、テーマごとに11の部分に分れており、1000以上のフレーズを含む会話集のロシア語訳を、アルバイト作業者を雇用して完了した。 前年度Windows Mobile端末では問題があることが判明したが、適切な対処方法が判明しなかった。しかし、Windows Vista搭載PCの小型化、処理高速化により、実用が可能であると予測できたので、フィールドでの利用を想定した堅牢PCを購入し、現在も活用方法を研究中である。
|