研究課題/領域番号 |
08878050
|
研究機関 | 広島市立大学 |
研究代表者 |
任 福継 広島市立大学, 情報科学部, 助教授 (20264947)
|
研究分担者 |
ADAMS Rolf 広島市立大学, 情報科学部, 助教授 (00264929)
北上 始 広島市立大学, 情報科学部, 教授 (50234240)
|
キーワード | 文法 / 深層構造 / 浅層構造 / 中国語 / 自然言語処理 / 機械翻訳 / コーパス |
研究概要 |
T+文法とは、文の深層構造にはT(Theme)S(Subject)P(Predication)O(Object)四つの項があり、TはS、P、Oと同一のレベルで使われている文法項であるとする考え方である。本年度では、T+文法の体系の導出、特にTSPOの深層構造の特徴の抽出のため、中国語テキストコーパスの構築作業を行った。以下のことを実験から分かった。(1)主題Tが主語Sと同じ場合には、主語は殆ど省略される。(2)目的語が主題になる場合には、省略した場合もあり、省略していない場合もある。(3)複文の場合には、幾つかのケースが存在しているが、さらる検討する必要がある。そして、T+文法の考えを機械翻訳にどう応用するかについて検討を行った。結論としては、T+文法の発想により、省略文の翻訳が容易的に実現できることがあげられる。しかし、その前題は、深層構造から浅層構造への派生方式の導出、などがある。現段階では、コーパスの自動情報付けは幾つかの問題がまだ残されており、特に、品詞の自動推定については、統計の手法と辞書に基づく手法が提案されたが、その精度がまだ低い現状である。それで、コーパスから深層構造から浅層構造への派生方式の自動導出が当面、無理であると考える。我々は人手で情報付けコーパス(小規模)をまず構築し、それにより、派生方式の導出を行うと考えた。なお、いまのコーパス規模が小さいので、有用なデータの抽出作業は難しいことが判明された。来年度、引き続き、コーパス規模の拡大を行い、データの分類及び探索アルゴリズムの開発を行う予定である。
|