研究課題/領域番号 |
19300047
|
研究機関 | 大阪大学 |
研究代表者 |
堀 一成 大阪大学, 大学教育実践センター, 准教授 (80270346)
|
研究分担者 |
竹原 新 大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
小島 一秀 大阪大学, サイバーメディアセンター, 講師 (60372637)
上原 順一 大阪大学, 言語文化研究科, 准教授 (30252737)
鈴木 慎吾 京都産業大学, 外国語学部, 助教 (20513360)
|
キーワード | 外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL |
研究概要 |
本年度は主に、統語情報とオントロジー情報を共に言語資源に付加する作業のためのソフトウェア開発、タグ付きペルシア語資源の充実、ロシア語音声資源の構築を行った。また、年度当初には予定していなかったタグ付きトルコ語資源の構築作業も開始した。 一昨年度から開発を開始している、外国語学専攻の作業者用タグ付き言語資源作成支援ツールについては、昨年度開発したオントロジー情報付加のための機能と、一昨年度来開発を継続している統語情報付加のための機能を統一し、オントロジー情報をXMLデータの属性として付与できるようFLASHアプリケーションを改良した。この成果は平成22年3月の言語処理学会で発表した。このツールを用いて言語資源構築作業をするうち、従来のタグ付け方式であるGDAの多言語対応に対する不備な点が明らかになり、現在その改良となるタグ付加方式の提案をすべく研究中である。 ペルシア語資源については、基本会話文1000文のGDAによる構造化の作業を補足的に行った。これに加え、日本語の基本会話文1000文のGDAによる構造化の作業も行った。補足的な作業は今後もあり得るが、ほぼ作業は終了した。これらの作業はいずれも補助者を活用して行った。 ロシア語の言語資源構築については、テーマごとに11の部分に分れている1000以上のフレーズを含む会話集の録音を完了した。また、この音声資料の編集作業を開始した。いずれも雇用した大学院生などの支援を得ている。 トルコ語資源については、ペルシア語で構築済みのデータを参考に、基本的な会話文100文程度を選び、同内容のトルコ語会話文データとそのGDAタグ付け作業を進めた。
|