2014 Fiscal Year Research-status Report
次世代日本語コーパスプロトタイプの構築とその脳認知言語学実験への応用
Project/Area Number |
25370457
|
Research Institution | Tohoku University |
Principal Investigator |
吉本 啓 東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
|
Co-Investigator(Kenkyū-buntansha) |
横山 悟 千葉科学大学, 薬学部, 准教授 (20451627)
森 芳樹 東京大学, 総合文化研究科, 教授 (30306831)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | コーパス言語学 / 統辞書解析 / 意味解析 / 脳機能画像法 |
Outline of Annual Research Achievements |
当初からの目標である、約4万文からなる統辞・意味情報付きツリーバンク構築を順調に進めた。そのノウハウは、これまでの研究を通じて (Butler and Yoshimoto 2012, 吉本他 2013) 十分に蓄積されてきている。まず入手したテクストを形態素解析器および Probabilistic Context-Free Grammar にもとづく統辞解析器にかけ、文の文節への分割およびそれらの間の依存関係に関する情報を得た。これをさらに、木構造の検索・変換用ツールtsurgeonのスクリプトを用いて句構造へと変換した。その結果のほとんどすべてについて人手による修正が必要であり、これが全体の中で主要な作業を占めた。得られた統辞解析結果は、構造変換を経て、SCTシステムに入力されて論理意味表示 (新デイヴィドソン式表示) が得られた。その結果は、統辞解析情報の修正へとフィードバックされた。さらに、得られた統辞・意味情報付きツリーバンクの成果を利用しやすくするために、文の論理意味表示の新たな視覚提示法の開発とそれを利用した外国語教育等への応用法の研究を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまでに確立した、アノテーションの方式にもとづいて、順調に作業をす薄めている。特に、「~について」「~における」などの助詞に相当する連語について検討を行い、単一の助詞として扱うこと、また同様に「~にちがいない:などモーダル助動詞に相当する連語を単一の助動詞相当語として扱うための方針を定めて、意味解析の制度を向上させることができた。
|
Strategy for Future Research Activity |
アノテーション方式をさらに続けながら、ツリーバンク構築作業を継続する。同時に、マニュアルの執筆も行う。また、得られた論理意味解析情報について、どのような文法情報を選んで係り受け情報を表示すべきかについて考察し、適切と思われる文法情報表示の候補を数件選ぶ。これらによる日本語テクストの係り受け関係の視覚表示を与えたテクスト読解実験を日本語学習者に対して行い、理解度のテストやアンケートにより、最適のものを選ぶ。フレーム・グラフについては、最下層の意味グループとして採用する、個体、述語、オペレーター等の意味的次元ごとに日本語に特有の構文や機能語の差異を除去していく。これにもとづいて、異なる意味解析法や異なる言語間の比較を行う。
|
Causes of Carryover |
脳機能測定実験がずれこんだため、当初の計画が実行できなかったため。
|
Expenditure Plan for Carryover Budget |
次年度に実験を行って、謝金等として使用する。
|