研究課題/領域番号 |
12780283
|
研究種目 |
奨励研究(A)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
宮田 高志 奈良先端科技大, 情報科学研究科, 助手 (00283929)
|
研究期間 (年度) |
2000 – 2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
2001年度: 900千円 (直接経費: 900千円)
2000年度: 1,200千円 (直接経費: 1,200千円)
|
キーワード | 文法開発 / 単一化文法 / JPSG / 素性構造 |
研究概要 |
本年度は、南[1974]によって指摘された日本語における従属節の構造に関する制約「従属節を導く接続詞はA類・B類・C類の三つの階層に分類され、低い階層に属する接続詞が導く従属節は高い階層に属する接続詞が導く従属節を含むことはできない」に着目して文法を拡張した。例えば、一般には従属節は他の従属節に埋め込むことができるので、「奈緒美が歌うとギターを弾きながら...」という文は、「*((奈緒美が歌うと)ギターを弾きながら)...」と「(奈緒美が歌うと)(ギターを弾きながら)...」という二通りの構造が可能であるはずだが、前者の構造は解釈不能である。このような従属節の構造に関する制約を、南[1974]では、1.接続詞ナガラ・トはそれぞれA類・B類に属する。2.A類の方がB類よりも階層が低いので、『*((奈緒美が歌うと)ギターを弾きながら)...』という埋め込み構造はとれず、『(奈緒美が歌うと)(ギターを弾きながら)...』のように二つの従属節が後続する動詞に係る構造しかとれない、と説明している。本研究では従属節中の時制と相の有無に着目することで、A類・B類・C類のような恣意的な分類を導入しなくとも上記のような言語現象を説明できることを示し、これをHPSGの枠組で記述・実装した。 また当初の予定のうち、例文集の作成は残念ながら達成できなかったが、上記の現象を説明するために文法を拡張した際に、次のような点に関して文法開発環境を改善すべきであることがわかった。1.素性・型階層の定義自身をグラフィカルユーザインターフェースを用いて修正・拡張できるようにすべきである。さらに、この変更に伴って全ての辞書項目や原理に関しても(半)自動的に変更が反映されるようにすべきである。2.拡張した文法が新聞などの現実に出現する文のうちどれだけの範囲を説明できるのかに関して、(精密な評価は不可能にしても)大まかな見積りができることが望ましい。 構築した文法開発環境のプロトタイプシステムはすでに完成した文法が正しく動作するかどうか、動作しないならばどこに原因があるかなどを確認するには便利であるが、文法や素性・型階層の定義自身は構文解析システムに依存した形で書かれているために、変更が容易ではない。これはプロトタイプシステムの設計段階で「文法は言語学に通じたごく少数の専門家が一度記述すればよく、あとは語彙を簡単に修正できれば充分であろう」という見込みがあったからであるが、実際には文法の根幹に関わる試行錯誤の方が重要であった。二つ目の点に関しては当初の予定である例文集の他に、(必ずしも解析されている必要はないが)大規模なデータから特定の言語現象が出現している文を簡単に抽出できると文法の網羅性を確認しやすい。このようなツール自体はすでにいくつか存在するが、文法開発環境の中から利用できるようになっていると便利である。
|