1997 Fiscal Year Annual Research Report
T+文法の開発及びその日中言語処理への応用に関する研究
Project/Area Number |
08878050
|
Research Institution | Hiroshima City University |
Principal Investigator |
任 福継 広島市立大学, 情報科学部, 助教授 (20264947)
|
Co-Investigator(Kenkyū-buntansha) |
ADAMS Rolf 広島市立大学, 情報科学部, 助教授 (00264929)
北上 始 広島市立大学, 情報科学部, 教授 (50234240)
|
Keywords | 文法 / 深層構造 / 浅層構造 / 中国語 / 自然言語処理 / 機械翻訳 / コーパス |
Research Abstract |
T+文法とは、文の深層構造にはT(Theme)S(Subject)P(Predication)O(Object)四つの項があり、TはS、P、Oと同一のレベルで使われている文法項であるとする考え方である。本年度では、T+文法の体系の導出、特にTSPOの深層構造の特徴の抽出のため、中国語テキストコーパスの構築作業を行った。以下のことを実験から分かった。(1)主題Tが主語Sと同じ場合には、主語は殆ど省略される。(2)目的語が主題になる場合には、省略した場合もあり、省略していない場合もある。(3)複文の場合には、幾つかのケースが存在しているが、さらる検討する必要がある。そして、T+文法の考えを機械翻訳にどう応用するかについて検討を行った。結論としては、T+文法の発想により、省略文の翻訳が容易的に実現できることがあげられる。しかし、その前題は、深層構造から浅層構造への派生方式の導出、などがある。現段階では、コーパスの自動情報付けは幾つかの問題がまだ残されており、特に、品詞の自動推定については、統計の手法と辞書に基づく手法が提案されたが、その精度がまだ低い現状である。それで、コーパスから深層構造から浅層構造への派生方式の自動導出が当面、無理であると考える。我々は人手で情報付けコーパス(小規模)をまず構築し、それにより、派生方式の導出を行うと考えた。なお、いまのコーパス規模が小さいので、有用なデータの抽出作業は難しいことが判明された。来年度、引き続き、コーパス規模の拡大を行い、データの分類及び探索アルゴリズムの開発を行う予定である。
|
-
[Publications] Fuji Ren: "A Robust Machine Translation system Based on Multi-Processes" Communications of COLIPS. 7・1. 17-26 (1997)
-
[Publications] Fuji Ren: "New Concept of Sensitive Word" 広島市立大学研究報告. 97・8. 1-11 (1997)