研究課題
基礎語彙の文字・音声データの集積前年度に続き、海外旅行ダイアログと基本語彙(日本語、広東語、朝鮮語、トルコ語、ヒンディー語)の文字・音声データの集積を行った。電子化レキシコンの構造化と試行的構築電子化レキシコンを構築するにあたり、XMLを用いて行うためには、詳細なデータ設計が必要である。本年度は独立行政法人産業技術総合研究所の橋田浩一氏が提唱するGDA(大域文書修飾)に基づいた共通文書タグ付けを試み、その問題点と改良点について研究し、成果を研究会で発表した。モバイル端末での利用のための技術的検討Linux搭載HPCにおけるシステムは、特に表示が不完全であったタイ語の表示の改良を行い、その成果を研究会で発表した。また言語処理学会で発表の予定である。既存の多言語会話データの完成度向上海外旅行ダイアログの不備な点を改良し、Ver.2を作成した。これによるダイアログ・テキスト改訂は中国語とアラビア語で行い、アラビア語は修正用音声データも作成した。研究成果の発表について1)大阪府主催の産学官連携展示会である「テクノパワー2003in OSAKA」において上記の研究成果を発表展示した。2)2003年12月6日開催の漢字文献情報処理研究会において、データの構造化研究として山崎直樹氏が「XMLで既存のテクストを構造化する-中国古典詩での試み」を発表した。3)2004年3月開催の言語処理学会において本年度の研究成果をまとめて発表する予定である。4)学内外をあわせ3回の研究会を開催し、研究成果について発表し討論を行った。
すべて その他
すべて 文献書誌 (2件)