研究課題
基礎語彙の文字・音声データの集積前年度に続き、録音済みの海外旅行ダイアログと基本語彙(日本語、朝鮮語、トルコ語、アラビア語)の音声データを完成させ、広東語については音声収録を行った。電子化レキシコンの構造化と試行的構築電子化レキシコンを構築するにあたり、XMLを用いて行うためには、詳細なデータ設計が必要である。本年度はGDA(大域文書修飾)に基づいた共通文書タグ付けの問題点と改良点について、計10回の研究会を行い検討するとともに改善項目をまとめ、ワークショップやシンポジウムで公開した。モバイル端末での利用のための技術的検討Linux搭載HPCにおけるシステムでは、実現していなかった音声データの提供技術を完成した。既存の多言語会話データの完成度向上海外旅行ダイアログと基礎語彙に基づき、13言語による「多言語データ見本」をHTML形式で作成し、下記のワークショップやシンポジウムで公開した。研究成果の発表について1)2003年11月12-13日開催のワークショップ(岐阜大学工学部応用情報学料池田研究室と共催)において「多言語処理と機械翻訳」「コプラなしコプラ文の諸相」に関して研究を発表するとともに知見を交流した。2)2005年3月2-3日開催の国際シンポジウムとワークショップ(本学主催)においてアジア言語資源構築に関する専門家を招き最新の知見を学ぶとともに研究成果を発表した。3)言語処理学会第11回年次大会(2005年3月14-18日)において研究成果を発表の予定である。
すべて 2005 2004
すべて 雑誌論文 (2件)
言語処理学会第11回年次大会(NLP2005)講演論文集 (2005年3月刊行予定)
第12届国際中国語言学学会年会学術論文摘要集
ページ: 134-134