2013 Fiscal Year Research-status Report
含意関係コーパスの分析に基づく自然言語の統一的形式意味論の研究
Project/Area Number |
24652089
|
Research Institution | National Institute of Informatics |
Principal Investigator |
宮尾 祐介 国立情報学研究所, コンテンツ科学研究系, 准教授 (00343096)
|
Keywords | 形式意味論 / 含意関係認識 |
Research Abstract |
平成25年度は、前年度に引き続き1. 自然言語の意味に関する理論の調査を行うとともに、3. 意味理論の形式的な記述の研究を推進した。 項目1については、目的、理由、手段、原因、結果などの意味的関係に関する理論の調査を行った。これらの関係について形式理論は存在しないが、いくつかの関係については談話関係として研究が行われており、RST Treebank や Penn Discourse Treebank といったコーパスが開発されている。ただし、これらの研究では関係ラベルの種類を天下り的に決めており、それを支持する基準や相互作用については研究がされていない。例えば理由と原因は似た性質を持っているため、単に関係ラベルを列挙するのではなく、これらの相互作用を説明できる枠組みを構築する必要がある。 項目3については、現在開発を進めているテキスト間含意関係認識システムで採用している集合間関係に基づく意味表示理論に基づき、時間、アスペクト、モダリティの実装について検討を行った。形式論理ではこれらの意味構造については集合間関係として記述されているため、それぞれの構造やその規則を記述することは可能である。しかし、これらの間の相互作用については不明な点が多く、今後引き続き検討が必要である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
項目1, 3 についてほぼ計画通りに研究が進捗している。項目1については、調査すべき研究はほぼ網羅し、一通り完了した。項目3については、異なる種類の意味構造間の関係を記述することが本質的な難しさであることが明らかになり、今後の研究のポイントの一つとなると考えられる。
|
Strategy for Future Research Activity |
平成26年度は、前年度に引き続き3. 意味理論の形式的な記述の研究を進めるとともに、4. 意味の統一的記述枠組みの研究を推進する。研究実績・達成度の項目で述べたように、異なる種類の意味構造間の関係を記述することが本質的な難しさである。全ての意味構造に対して完全な意味記述を確立することは短期的には不可能であるため、現在研究を進めている論理表現、時間・アスペクト・モダリティ、およびオントロジーを統合し、含意関係コーパスにおいて頻度の高い現象について形式的記述を与えることを目指す。 また、含意関係コーパスの分析では、パラフレーズの認識が必要なケースの頻度が高いことが明らかとなった。自然言語処理ではパラフレーズの自動獲得の研究がさかんに行われているが、特定の形のパラフレーズを対象とした研究が主であり、実際のコーパスを網羅できるものはない。高精度な含意関係認識のためには実データを網羅できるパラフレーズ認識手法の研究が必要である。
|
Expenditure Plans for the Next FY Research Funding |
テキスト間含意関係認識システムの実装にかかる作業を次年度に行うため。 プログラム実装の謝金として使用する。
|
Research Products
(1 results)