2013 Fiscal Year Research-status Report
Project/Area Number |
25870278
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | University of Yamanashi |
Principal Investigator |
松吉 俊 山梨大学, 医学工学総合研究部, 助教 (10512163)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 自然言語処理 / コーパス言語学 / 否定表現 / モダリティ |
Research Abstract |
本研究では、現代日本語における否定焦点の統計的分布を明らかにするとともに、否定の焦点を自動的に特定する解析システムを実装する。本年度は、次の4点を実施した。1.文献調査、2.コーパス構築、3.否定焦点の分析、4.データフォーマット仕様の策定。 具体的には、まず、否定辞、および、否定の焦点に関する先行研究と文献を調査した。この調査の結果、否定要素と呼応する程度・頻度の副詞が重要であり、特に、完全否定と弱否定の分類が焦点の有無に深く関わることが分かった。日本語においては、とりたて詞の種類が否定焦点の位置に影響し、とりたて詞のスコープと否定辞のスコープの包含関係により、文の解釈が決定することを考慮する必要があるという知見も得られた。次に、否定の焦点に関するコーパスを構築した。テキストデータとしては、楽天データの「楽天トラベル: レビューデータ」と、現代日本語書き言葉均衡コーパスの新聞データを利用した。約1万文のテキストデータから、否定辞を含む文2,147文を抽出し、否定辞の種類と焦点の情報を人手で記述した。否定のスコープの一部に焦点がある場合は、全体の約23%であることや、ジャンルによって焦点部分の品詞列に異なる傾向があること等、統計的分布に関する知見が得られた。続いて、否定焦点をとりまく文脈について分析を行った。その結果、対象文内の内容語とその前文脈の内容語との関連性を単純に計測するだけでは、否定焦点の特定に十分ではなく、もう少し深い意味解析が必要であることが分かった。最後に、否定焦点コーパスをコミュニティで共有するためのデータフォーマット仕様を提案した。これに従うと、同一のテキストに対する複数の追記言語情報を統一的に扱うことができる。これは意義のある提案であり、コーパスを利用する言語研究分野の発展に貢献すると思われる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の目的の「否定の焦点をラベル付けしたコーパスの構築」と「否定焦点の分析」がほぼ予定どおりに進んでいるため。否定焦点の分析の結果を受け、次年度開始予定であった「解析システム実装」にも前倒しで取り組んでいる。
|
Strategy for Future Research Activity |
計画通り、「コーパス構築」、「否定焦点の分析」、「解析システム実装」を実施する。システムの開発後、その評価を行い、構築した言語資源の有効性を検証する。
|
Expenditure Plans for the Next FY Research Funding |
次の3点が理由である。1. コーパス構築に携わる適切な技術補佐員を探すことができず、謝金の支出がなかったため。2. 計画に挙げていた外国での研究発表の機会が今年度はなかったため。3. 年度末に学会誌に採録が決定した論文の別刷代の支払いが、次年度となったため。 解析システム開発・運用のための計算機については、翌年度の計画どおりに購入する。早急にコーパス構築のための技術補佐員を探し、前年度分と合わせ、コーパス構築に関する作業に研究費を使用する。国際会議に論文を投稿し、海外での研究成果発表にも研究費を使用する。
|