研究課題/領域番号 |
24520437
|
研究種目 |
基盤研究(C)
|
研究機関 | 慶應義塾大学 |
研究代表者 |
小原 京子 慶應義塾大学, 理工学部, 教授 (00286650)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | コーパス言語学 / 言語資源 / 語彙意味論 / 認知言語学 / 日本語 / フレーム意味論 / 構文文法 |
研究概要 |
本研究の目的は、研究代表者が構築中の日本語フレームネット(JFN)を、語彙の意味情報に加え、構文の意味情報をも含む語彙・構文複合言語資源へと発展させることである。具体的には、文全体の意味に、語彙素の意味の他にどのような文要素の意味が関与しているかを明らかにし、それらを記述して言語資源とする。記述の枠組みとしてフレーム意味論と構文理論を用い、語彙素以外の文要素の意味も語彙素の意味と統一的に記述する。コーパス上の文の意味分析を行いその結果を蓄積することで、将来的に自然言語処理技術や日本語学習者にとって有益な言語資源とすることを目指す。 言語分析に関しては、1. 文全体の意味に寄与する語彙素以外の表現形式の洗い出し、2.上記表現形式の意味分析、3.英語フレームネット・プロジェクト訪問ならびに意見交換、4.LREC(言語資源評価学会)、ICCG(国際構文理論学会)、FRIAS CONSTRUCTIONS ACROSS GRAMMARSワークショップなどでの成果発表、5.成果についての論文執筆を行った。特に1.2.に関しては、『現代書き言葉均衡コーパス』(BCCWJ)の白書ジャンルのテキストを分析し、そこに現れる構文の洗い出しを行い、それらの意味分析を行った。 システムに関しては、主にコーパスアノテーション(タグ付け)用のソフトウェアのバージョンアップを行った。 本研究の当該年度の活動により、1.コーパスデータの詳細な意味分析を行い、その重要性を示すことができた。さらに、2.フレーム意味論・構文理論の精緻化に日本語分析の観点から貢献することができた。また、3.言語資源はこれまで言語処理研究者らによって構築されることが多かったが、本研究により言語学的枠組みに則った言語資源の有用性を示すことができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成24年度の目標は、環境の整備であった。 言語分析関連では、 1)文全体の意味に寄与する語彙素以外の表現形式の洗い出し、2)上記表現形式の意味分析、3)英語フレームネット・プロジェクト訪問・意見交換、4)LREC(言語資源評価学会)、ICCG(国際構文理論学会)、FRIAS CONSTRUCTIONS ACROSS GRAMMARSワークショップなどで成果発表、5)成果に関する論文執筆、を計画した。1)から5)までのすべてについて、特に3)、4)、5)について成果を上げることができた。 システム関連では、1)サーバ移行、2)ソフトウェアのバージョンアップ、3)英語フレームネット・プロジェクトから構文への意味情報付与用アノテーションツールを移植、 4)構文への意味情報付与用アノテーションツールの日本語対応化、を計画した。1)は調査の結果時期尚早であることが判明し行わなかった。2)から4)については現在進行中である。
|
今後の研究の推進方策 |
平成24年度に得られた結果を基にして、アノテーション作業の本格化を年度目標とする。 言語分析関連では、1)引き続き文全体の意味に寄与する語彙素以外の表現形式の洗い出し:主にBCCJコーパスの白書ジャンルのテキストを分析する。2)英語フレームネット・プロジェクトを訪問し、アノテーション結果に関する考察、ソフトウェアのバージョンアップなどについて意見交換を行う。3)国際会議、国内学会で成果発表を行う。4)成果に関する論文を執筆する。 システム関連では、1)英語フレームネット・プロジェクトから構文への意味情報付与用アノテーションツールを移植する。2)構文への意味情報付与用アノテーションツールの日本語対応化を行う。
|
次年度の研究費の使用計画 |
主に、データ分析・アノテーション作業のための人件費、システム整備のための謝金、研究成果発表のための旅費に使用する予定である。
|