2011 Fiscal Year Annual Research Report
文脈依存の意味情報を判別する機能表現抽出WEBシステムの開発と運用実験
Project/Area Number |
23320105
|
Research Institution | Kanazawa University |
Principal Investigator |
松田 真希子 金沢大学, 留学生センター, 准教授 (10361932)
|
Co-Investigator(Kenkyū-buntansha) |
川村 よし子 東京国際大学, 言語コミュニケーション学部, 教授 (40214704)
森 篤嗣 帝塚山大学, 現代生活学部, 准教授 (30407209)
山口 昌也 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (30302920)
山本 和英 長岡技術科学大学, 工学部, 准教授 (40359708)
|
Keywords | 深層格 / 機能表現 / コーパス / 概念辞書 / 意味属性体系 |
Research Abstract |
本課題では日本語教育,日本語学,自然言語処理分野への貢献を目的とした,文脈依存の意味情報を判別する機能表現抽出WEBシステムの開発と運用実験を行う。これまでの研究では機能表現を文字列等の表層情報から抽出することは可能だが,用法・意味等の機能表現が有する深層情報の抽出は,文脈や出現条件に依存するため,十分な成果が出ていない。また,難易度情報を伴った抽出機能や,複数の文節にまたがった連続しない機能表現の抽出機能もまだ開発されていない。そこで本課題では言語処理,日本語学,日本語教育の研究者が連携し,深層格・難易度等の深層情報を表示できる機能表現辞書やタグ付コーパスを開発するとともに,より精度の高い自動検出手法を考案し,高精度の機能表現抽出システムの提案を目指す。 平成23年度は主として深層格の自動判定のための研究を行った。名詞と述語の関係のあり方は表層格である格助詞が規定しているが,その一方で,当該格助詞の有する深層格は名詞とその述語によって決定されているという側面もある。そのため,過去の研究も表層格の前後の情報から深層格の自動判定を試みている。しかし,その精度判定はEDRの概念関係子との照合で行われることが多い。ところがEDRが提供する深層格タグは網羅性に問題があり,Ayaなどでは修正を施して用いているのが現状である。そこでより網羅的で妥当性の高い深層格タグの提案を目指し,深層格タグと助詞の前に出現する名詞に日本語語彙体系の意味属性体系情報を付与したコーパスを開発した。さらに,それらの情報がどの程度深層格判定に有効かを,格助詞のニとデを例に検討した。その結果、前の名詞と後ろの動詞にタグを付与されたコーパスを開発すれば、それを教師データに機械学習することで自動判定が可能になる可能性を示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
深層格の規格化に時間がかかりタグ付きコーパスの開発が遅れたが、基礎的な研究や実現に向けての理論的な検討については順調に進んでいる。
|
Strategy for Future Research Activity |
今後の計画は以下の通りである。 平成23年~平成24年冬:多言語翻訳のための階層性を有する深層格リストの提案 平成23年~平成25年春:日本語深層格タグの自動付与のためのコーパス開発 平成24年春~平成25年夏:文脈依存の意味抽出を可能にする形態素解析器とその評価 平成25年夏~平成25年秋:機能表現辞書への実装と評価。
|
Research Products
(8 results)