研究課題/領域番号 |
19300047
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 大阪大学 |
研究代表者 |
堀 一成 大阪大学, 大学教育実践センター, 准教授 (80270346)
|
研究分担者 |
竹原 新 大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹 関西大学, 外国語学部, 教授 (30230402)
小島 一秀 大阪大学, サイバーメディアセンター, 講師 (60372637)
上原 順一 大阪大学, 言語文化研究科, 准教授 (30252737)
鈴木 慎吾 京都産業大学, 外国語学部, 助教 (20513360)
|
連携研究者 |
石島 悌 大阪府立産業技術総合研究所, 情報電子部, 主任研究員 (80359398)
高階 美行 大阪大学, 世界言語研究センター, 教授 (70144540)
藤家 洋昭 大阪大学, 世界言語研究センター, 准教授 (90283837)
谷村 緑 京都外国語大学, 外国語学部, 講師 (00434647)
|
研究期間 (年度) |
2007 – 2010
|
キーワード | 自然言語処理 / 多言語資源 / 会話文データベース / 語彙データベース |
研究概要 |
本研究は、大阪大学の多言語資源研究グループを中心とし、文字・音声情報を含む多言語間比較可能なパラレルコーパス(平行言語資源)の構築と、その構築作業をサポートするXML情報付加Webソフトウェアの開発を行ったものである。作成した言語資源の内訳は、5000語の基本単語集(7言語)、旅行時の会話を中心とする1000文会話文集(12言語)、前記会話集に文構造を示すXMLタグを付与した構造化文集(5言語)である。文構造を表すXMLタグのセットは産業技術総合研究所で開発されたGDA : Global Document Annotationを採用した。言語資源作成作業の補助となるXML情報付加ソフトウェアは、Flashシステムを用いたWebプログラムとなっており、GUI操作により直感的に作業者が文の木構造を創り上げることができ、同時にXMLデータも自動生成する仕様となっている。
|