2010 Fiscal Year Annual Research Report
LCTLを含む多言語平行マルチメディア資源の構築と構造化方式の研究
Project/Area Number |
19300047
|
Research Institution | Osaka University |
Principal Investigator |
堀 一成 大阪大学, 大学教育実践センター, 准教授 (80270346)
|
Co-Investigator(Kenkyū-buntansha) |
竹原 新 大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
小島 一秀 大阪大学, サイバーメディアセンター, 講師 (60372637)
上原 順一 大阪大学, 言語文化研究科, 准教授 (30252737)
鈴木 慎吾 京都産業大学, 外国語学部, 助教 (20513360)
|
Keywords | 外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL |
Research Abstract |
本年度は、最終年度にあたるため、言語資源の最終蓄積作業、言語資源構築作業用ソフトウェア開発の進行、これまでの結果取りまとめと学会発表を行った。 言語資源の構築作業は、英語のGDAに基づく肌構造化会話文集(1000文)を完成させた。また、前年度から着手していたトルコ語会話文のXML構造化作業を、挨拶文などを中心とする基本会話部分(100文強)について進展させた。これにより、肌構造化した会話文集は、英語・日本語・ペルシア語についてはそれぞれ1000文、トルコ語については約100文が完成したことになる。前年度までに構築済みの構造化されていない会話文集(1000文)は12言語分、そのうちの5言語分に対応する音声データ、日本語頻度情報により選定した基本語5000単語(7言語分)に、上記データが加わったことになる。これらの成果を取りまとめ、2011年3月の言語処理学会第17回年次大会で報告した。 外国語専攻の作業者が統語情報とオントロジー情報を共に言語資源に付加するためのソフトウェア開発を行った。この成果は2010年9月の第9回情報科学技術フォーラムに査読論文を投稿するとともに発表を行った。また、形態素解析エンジンMeCabでロシア語処理が円滑に行えるよう、辞書の開発手法についても研究を行い、論文として発表した。 2011年3月に東北および関東地方で大地震と津波による被害が発生した。本課題で作成した言語資源の一部を、在留外国人被災者の救援活動に役立ててもらえるよう整理し、ネット上で提供している。
|