研究課題/領域番号 |
24652089
|
研究種目 |
挑戦的萌芽研究
|
研究機関 | 国立情報学研究所 |
研究代表者 |
宮尾 祐介 国立情報学研究所, コンテンツ科学研究系, 准教授 (00343096)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 形式意味論 / 含意関係認識 |
研究概要 |
平成24年度は、1.自然言語の意味に関する理論の調査、および2.含意関係コーパスの分析を行った。 項目1については、述語論理や動的論理などの形式意味論、オントロジー工学を中心とした語彙的意味論、モダリティに関する言語理論、時間・アスペクトに関する言語理論や言語処理研究について調査を行った。形式意味論と語彙的意味論については形式モデルが提案されており、ほぼそのまま利用することができる。特に、形式意味論の記述枠組みは、語彙的意味論を実装するのに十分な記述力があるため、これらは統合的に実装できると期待される。ただし、これらの推論手法は計算量の問題が大きいため、計算量を抑えるための形式化や推論手法が必要と考えられる。一方、モダリティや時間・アスペクトに関する研究では、非形式的な言語学研究やリソース構築の研究が主である。これらについては、引き続き形式モデルの検討を行うが、項目2の研究成果によりこれらの意味的関係は出現頻度が低いことが明らかとなったため、場合によっては研究の優先順位を下げる。 項目2については、評価型ワークショップNTCIR10のRITE2タスクで提供されている含意関係コーパスを用いて、実テキストの含意関係において現れる意味的関係の分析を行った。英語における既存研究を参考に、含意関係を基本文関係にブレイクダウンする手法を開発し、実際にアノテーション作業を行った。その結果、このデータにおいては上位・下位、同義、含意などのオントロジー的関係、特にフレーズ間の関係が高頻度で現れることが明らかとなった。なお、このデータは現在公開している。 また、項目1および2の研究の中で、理由、目的、因果関係などの意味的関係を形式化する必要があることを認識した。しかし、これらの意味的関係については言語学においても自然言語処理においても研究が少ないため、今後さらなる調査を行う必要がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
項目1. 自然言語の意味に関する理論の調査, 2. 含意関係コーパスの分析, はほぼ計画通りに研究が進捗しているが、以下の点については当初予想を上回る成果を挙げている。項目1については、当初想定していなかった、既存の意味論研究ではあまり対象となっていない意味的関係の存在を確認した。次年度以降は、これについても合わせて研究を進める予定である。項目2については、含意関係コーパスの分析結果を実際にデータとして公開するところまで進捗している。
|
今後の研究の推進方策 |
研究計画における1.自然言語の意味に関する理論の調査を引き続き推進し、また本年度の成果に基づき3. 意味理論の形式的な記述についての研究を開始する。1 については、本年度の研究によって明らかになった、今まで形式的な取り扱いがされてこなかった意味的関係(目的、理由など)について、既存研究の調査を行う。3については、本年度調査を行った形式意味論の枠組みのうち一つを採用し、オントロジーや語彙概念構造でとらえられている意味的関係、モダリティ、時間・アスペクトについてその形式的記述方法を検討する。
|
次年度の研究費の使用計画 |
平成25年度は、研究調査のための海外旅費、および研究調査・研究打合せ・学会発表のための国内旅費に、それぞれ40万円の研究費を使用する。また、データ分析作業の補助のため、20万円程度の謝金を使用する予定である。
|