研究課題/領域番号 |
11680422
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 武蔵工業大学 |
研究代表者 |
上原 徹三 武蔵工業大学, 工学部, 教授 (60257102)
|
研究分担者 |
清水 由美子 武蔵工業大学, 環境情報学部, 助教授 (30298020)
荒井 秀一 武蔵工業大学, 工学部, 助教授 (20212590)
|
研究期間 (年度) |
1999 – 2000
|
キーワード | 係り受け解析 / コーパス / 構文規則 / 概念 / 辞書 / 日本語処理 |
研究概要 |
平安時代の仮名文の解析に関し、初年度はA1.構文木を持つ古文コーパスの作成、A2.コーパス参照ツールの試作、A3.文法規則の評価を計画した。この内A3.の評価を除いて実施した。次年度はB1.文法規則の確定とB2.その解析による評価を予定した。しかし文法規則はコーパスで確認しつつ繰返し試行すべきと判明した。そこで文法規則を外から与える解析機能の試作とコーパス参照ツールの高速化に変更した。以下、他の実施項目を含む全体の内容を記す。 1.古典文コーパスの作成:作成コーパスの品質を上げるため係り受け関係などの設定基準を作成した。これに従い「伊勢物語」全文と「竹取物語」の約半数の文について構文木を持つコーパスを試作した。 2.EDR日本語コーパス参照支援ツール:コーパスから指定部を取り出す関数群より成るプログラマ向け参照ツールと、その応用プログラムとして指定の文法的条件をコーパス内で照合しその出現頻度や出現状況を報告するツールを試作した。各々学会発表及び論文発表を行った。前者は全件探索のため低速であったので、単語の品詞と表記に対しコーパス上の出現位置を与える索引を作成し、それによって探索する高速化を実施し、品詞参照性能が2から10倍(出現頻度による)に向上した。これについて学会発表した。 3.構文規則の変更可能な古文係り受け解析:品詞情報つき単語列を対象に、文節係り受け特性設定規則、2文節が係り受け関係を持つ条件、および、ある種の副詞の呼応規則から成る制約規則と、動詞の結合価パターンに基づく優先規則とを共に外部から与える係り受け解析を試作した。内蔵した同格構文・係り結び則については使用/不使用の指定を可能とした。ある文法規則のセットに対して適用して機能確認した。 これに関して学会発表した。 4.古語辞典による古典語の辞書情報推定:今後の解析処理の準備として、古典語の動詞の格フレーム情報及び古語の概念を古語辞典の記述より推定する方法を試作し実験した。これに関して二件を学会発表した。
|