研究課題/領域番号 |
25280084
|
研究種目 |
基盤研究(B)
|
研究機関 | 愛媛大学 |
研究代表者 |
二宮 崇 愛媛大学, 理工学研究科, 准教授 (20444094)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 自然言語処理 / 構文解析 / HPSG / 言語学 / 人工知能 |
研究概要 |
平成25年度は、研究計画に沿って、日本語文法に関する調査、日本語HPSG文法の設計について検討を行い、文法の設計方針を定めた。調査の対象として、日本語GPSGとして著名なJPSG、日本語HPSGであるJACY、日本語CCGの研究、本研究と同様コーパス指向文法開発による吉田の日本語HPSGの研究について調査を行った。 特に言語学において厳密に議論しているJPSGに注目して文法設計の検討を行った。JPSGをHPSGに対応させると、4つの文法規則(補語、修飾、等位接続、長距離依存)の文法規則で記述することができることがわかった。特にもっとも曖昧な助詞「は」の扱いとその意味論について詳細な記述があるため、助詞「は」の扱いはJPSGの理論にあわせると良いこともわかった。計算機で扱いにくい空範疇が頻出するため、空範疇を扱う語彙規則や文法規則が必要となることも判明した。格解析の学習および評価のためのデータとして、京都大学テキストコーパス、NAISTテキストコーパスを用いることを想定しており、これらの格解析つきデータについてもあわせて調査を行った。NAISTテキストコーパスの格の定義は非常に粗く、逆に京都大学テキストコーパスは詳細すぎることもわかった。いずれかの格解析コーパスを基に格の定義を改める必要がある。 また、平成25年度には平成26年度以降にも研究を円滑に行うための高性能な計算サーバーを購入し、計算および開発のための環境を整えることを行った。また、文法開発および構文解析に関する知見を得るため、研究打ち合わせを行った。 関連する応用研究として、日本語格解析を用いた機械翻訳の研究、自動要約の研究、機械翻訳のためのドメイン適応の研究も行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究目的の年度計画に従って予定通り研究が進んだ。平成25年度は日本語文法の設計を行う予定であったが、その目的をおおよそ達成することができた。特にGunjiによって提案されたJPSGを参考にし、文法規則の設計、語彙項目の設計も行った。JPSGにはもっとも曖昧な助詞「は」の扱いを詳細に記述しているため、格解析に応用する上で非常に有用な統語理論となる。
|
今後の研究の推進方策 |
平成26年度はコーパス指向文法開発の手法を適用することにより平成25年度に設計した日本語HPSG文法の開発を行う。まず、文法の核となる少数の文法規則を開発する。次に、構文木の統語情報を決定するルールを開発し、係り受け解析付テキストから日本語HPSGツリーバンクを半自動的に作成する。得られた日本語HPSGツリーバンクからHPSGの語彙項目を自動的に獲得し、開発した文法規則とあわせて日本語HPSG文法を得る。開発のためのファイルサーバー、計算サーバー、端末を購入し、これらを用いて日本語HPSG文法の開発を行う。また開発する文法について意見を求めるため研究打ち合わせを行う。
|
次年度の研究費の使用計画 |
平成25年度に研究を行った結果、想定よりも性能の高い計算サーバーと容量の大きいハードディスクが次年度以降必要になることが判明した。そのため、新たに計算機の選定とハードディスクの選定を行う必要があるが、この選定作業と納品に時間を要すると判断したため、平成26年度に購入することにした。 研究開発で作成するデータを保存するためのハードディスクの購入、および計算サーバーの購入に用いる。
|