2011 Fiscal Year Research-status Report
高精度モダリティ解析のための言語資源構築に関する研究
Project/Area Number |
23700176
|
Research Institution | University of Yamanashi |
Principal Investigator |
松吉 俊 山梨大学, 医学工学総合研究部, 助教 (10512163)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 自然言語処理 / モダリティ解析 / 言語学 / 言語資源 / 機能表現 |
Research Abstract |
本研究では、文章の書き手が表明している心的態度や真偽判断、価値判断などの情報を解析するために必要となる言語資源を構築し、実際にこの解析システムを実装する。本年度は、次の3点を実施した。(i)言語資源の調査、(ii) 既存のコーパスの整理、(iii) モダリティ解析のための言語資源とツールの整備。具体的には、まず、文に存在する述語のモダリティを決定する語句にどのようなものがあるか、言語学および日本語教育学における関連研究の文献を広く収集することにより調査した。この調査の結果、副詞や機能語、複合辞に代表される明らかな手がかり語に加え、動詞や形容詞などの用言が非常に語彙的な知識としてモダリティの決定に寄与することが再認識された。モダリティ解析のための言語資源を構築する際には、動詞や形容詞などの用言の意味分類を考慮し、これらの体系をうまく取り込む必要があるという重要な知見が得られた。次に、これまでに構築したモダリティタグ付きコーパスの見直しと変換を行った。文章に存在する用言句が事象であるかどうかの基準を見直し、ラベルを修正した。加えて、このコーパスを一般公開し、多くの研究者間で有益なデータを共有できるように、DVD配布版「現代日本語書き言葉均衡コーパス」のデータ形式を解析し、ここにモダリティタグ付きコーパスの情報を追加できるツールの開発に取り組んだ。約4万事象に対するモダリティの情報をコミュニティで共有できることに意義があると考える。最後に、モダリティ解析のための手がかり語を検出するツール、特に、複合辞を自動検出するツールを整備した。研究成果として、約3万のラベル付き訓練データとツールを一般公開予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の目的の「モダリティ解析のための言語資源構築」と「コーパス構築」については当初の目標レベルまで達していないが、代わりに次年度開始予定であった「解析システム実装」に前倒しで取り組んだため。
|
Strategy for Future Research Activity |
計画通り、「コーパス構築」と「解析システム実装」を実施する。また、「モダリティ解析のための言語資源構築」も引き続き実施する。
|
Expenditure Plans for the Next FY Research Funding |
解析システムを開発・運用するための計算機を購入する。コーパス構築に関する作業者を雇用する。昨年度は、転任により、適切な作業者を見つけて雇用することができなかったため、その分も補う。また、得られた研究成果を発表するため、学会参加費および論文誌投稿料にも研究費を使用する。
|