研究課題/領域番号 |
11680422
|
研究機関 | 武蔵工業大学 |
研究代表者 |
上原 徹三 武蔵工業大学, 工学部, 教授 (60257102)
|
研究分担者 |
清水 由美子 武蔵工業大学, 環境情報学部, 助教授 (30298020)
荒井 秀一 武蔵工業大学, 工学部, 助教授 (20212590)
|
キーワード | 日本語処理 / 自然言語処理 / コーパス / 文法 |
研究概要 |
平安時代の物語文を対象にコンピュータによる文法的解析を既に実施していた。その評価と改良が本研究の目的である。まず、複数の物語文について文法情報を含むコーパス(品詞・係り受け情報を含む例文集)を作成し、それを対象とするコーパス関係ツールを試作し、これらを用いて既設定の文法規則の適用性・一般性の評価と文法的解析の改良を行なう。前半の本年度は、コーパス関係ツールの作成、それによる古文コーパスの作成と文法規則の評価を、次に示すようにほぼ計画通り実施した。 1.古文コーパスの準備:まず、古典文のコーパスの作成基準を作成した。例えば、文法を理解する人間が考えても具体的な文の係り受け関係の設定には任意性・個人差がある得る。複数人が作成するコーパスの品質を上げるにはこれらを統一する作成基準が重要である。これに従い、コーパス形式変換ツールを用いて「伊勢物語」の全文と「竹取物語」の約半分(和歌を除く)についてEDR電子化辞書の形式に準したコーパスを試作した。 2.文法規則の適用性と一般性の評価:コーパスの例文から順次指定した部分を取り出す関数群より成るプログラマ向けの参照ツールと、指定の文法的条件をコーパス内で照合しその出現頻度や出現状況を調査する対話型ツールとの試作を一応、完成させた。特に前者を利用して、上記の古文コーパスを対象に既作成の文法規則の一般性を評価し改良する実験を継続的に実施中である。また、文節の係り受け特性のみでは妥当な係り受け解析をあいまい性なく実現することは困難であり、格文法解析などの援用を予定しているが、今回、その予備検討に着手した。すなわち、古語辞典に記載された古語動詞の現代語訳動詞に対する格フレーム情報を利用して古語動詞の格フレームを求める実験を開始した。
|