2015 Fiscal Year Research-status Report
「修辞機能」と「脱文脈化程度」の観点からのテキスト分析手法確立と自動化の検討
Project/Area Number |
15K02535
|
Research Institution | Kanagawa University |
Principal Investigator |
田中 弥生 神奈川大学, 外国語学部, 非常勤講師 (90462811)
|
Co-Investigator(Kenkyū-buntansha) |
水澤 祐美子 慶應義塾大学, 理工学部, 講師 (10598345)
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 准教授 (80379528)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 修辞ユニット分析 / 修辞機能 / 脱文脈化 / 中核要素 |
Outline of Annual Research Achievements |
本研究の目的は、日本語の「修辞ユニット分析」の手法を確立し、テキスト分析における「修辞機能」及び「脱文脈化程度」の概念の利用を提案するとともに、自動化を検討することである。この目的を達成するために、平成27年度は環境を整えるため、本研究課題の遂行に必要なパソコンや、本研究課題の遂行に必要なコーパス、研究の基礎となるコーパス研究、談話分析、プログラミング言語等の参考図書など、備品を購入し、先行研究について分析を行い、打ち合わせを行った。 また、複数の人手による認定作業の分析が必要となるため、3回の認定作業を行った。1,2回目については、研究代表者がこれまでに行った研究で用いたYahoo!知恵袋のデータについて、「修辞ユニット分析」の現基準に従って2名による認定作業を行い、その認定結果の分析を行った。分析結果の一部は、言語処理学会にて口頭発表を行った。「修辞ユニット分析」の過程の一部である「中核要素」(おおむね主語)の認定についての2名の作業者の一致度を知るためカッパ係数を求めたところ、k=.47で中程度の一致とみなされる結果であった。不一致の要因を「Yahoo!知恵袋が物理的空間を持たないインターネット上の空間であることから中核要素のとらえ方が異なるため」と予測をたてたが、分析の結果、「中核要素」(おおむね主語)として、「ヲ格」を選択している、(Yahoo!知恵袋における)助言の受け手を選択している、話題になっている事象を選択している、という違いなど、空間のとらえ方が要因とは限らないことが明らかになった。今後も詳細な分析を続ける。 さらに、述語項構造解析および拡張モダリティの知見の活用を視野にいれ、打ち合わせを経て、3回目の認定作業として、『現代日本語書き言葉均衡コーパス』(以下BCCWJ)ですでにアノテーションが行われている雑誌記事データについての1名による作業も行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
平成27年度は研究開始の初年度にあたるため、研究・調査と研究結果の分析に必要な備品や参考図書のうち、主要なものを購入し、先行研究について分析を行い、打ち合わせを行った。また、当初計画に従い、修辞ユニット分析の現基準による人手による認定作業を2名の作業者によって行い、認定結果について確認し、学会において口頭発表を行った。また、「述語項構造解析」「拡張モダリティ」など本研究の分析と関連のある他アノテーション研究について確認を行い、打ち合わせを行ったうえで1名の作業者による認定作業もすすめた。このようにおおむね計画通りに進んでいるが、この1名の認定作業は実施が2~3月となり、その結果の分析については、平成28年度に行うこととなるため、やや遅れているとした。
|
Strategy for Future Research Activity |
二年目となる平成28年度は、まず、平成27年度末に行った認定作業結果の分析を行う。また、初年度の打ち合わせや調査で複数の指摘を得て明らかになった「脱文脈化指数」の妥当性の問題について、当初計画にはなかったが、調査を行う予定である。 また、認定結果の統計分析についても実施し、新基準策定に向けて進める。新基準策定後は、BCCWJコアデータへの複数の人手による認定を行い、その後、認定結果の一致の確認を行い、その後の自動付与に向けた準備を進める。
|
Causes of Carryover |
謝金について、1回目と2回目の2名については認定作業対象としたサンプルが当初の予定より短くなったこと、3回目の1名については、調査の結果、BCCWJにおいて他のアノテーションがすでに行われているデータを、当初の予定にはなかったタイミングにおいて使用することとしたため、時間の関係から分量が少なくなったこと、といった理由によって平成27年度の支出が計画より少なくなった。 旅費について、計画作成時点で学会開催場所が明確になっていなかったものについて開催場所が関東であったため旅費が少なくなった。
|
Expenditure Plan for Carryover Budget |
次年度にも謝金によって認定作業を行う。 また、連携研究者や、作業者との打ち合わせのため、および学会での成果発表のため、旅費の支出が発生する予定である。
|