研究概要 |
本研究期間,まず,曖昧性解消研究に必要な英語・日本語・中国語のオンライン言語資源を集めた.また,言語資源から必要な情報を抽出するアルゴリズムと曖昧性解消のアルゴリズムを作りプログラミングをしました.以上のものをコンピュータにインプットし,多言語曖昧性解消とその応用のプラットホームを作成した. 研究成果として,第一に,各言語の特徴に基づいて統合的な曖昧性解消モデルを提案し,英語の前置詞句の係り先,等位構造,複合名詞における統語的な曖昧性,日本語文節間係り受けにおける曖昧性,中国語の複合名詞における曖昧性解消の実験を行った.これらの曖昧性解消モデルは,曖昧性解消の手がかり(たとえば,構文的特徴,意味類似性,共起情報,概念情報,選択制限,テキストと画像,音声など文脈情報,世界知識)をどこからどう抽出するか,そしてどんな方法で曖昧性解消するか,などに関しより妥当な方法を研究し,独自な手法を提案し,統計的な技法と記号的技法を統合した曖昧性解消モデルを開発している.第二に,曖昧性解消の応用のひとつとして、自然言語処理技術とMPEG-7技術を利用し,マルチメディア・コンテンツの検索方法提案している。成果を発表していた.第三に,インターネット上のコーパスを利用した中国語単語分割における曖昧性の解消の新しい手法を提案した.中国語単語分割の過程で生ずる複数の単語結合候補の中から正しい単語結合を決定するために,最初に双方向最大一致法によって単語結合候補を検出する.次に,コーパスからの統計量を使い,候補中の単語間の関連度を計算する.その際、希薄性の問題を対応するため,インターネット上のコーパスを使用する.最後に,単語関連度が最大になったものを正しい単語結合として選択する.本手法を評価するために行った実験では,他の手法に基づいた比較しうる実験結果を大幅に凌ぐものであることを実証した.
|