研究課題/領域番号 |
15K02535
|
研究機関 | 神奈川大学 |
研究代表者 |
田中 弥生 神奈川大学, 外国語学部, 非常勤講師 (90462811)
|
研究分担者 |
水澤 祐美子 慶應義塾大学, 理工学部(矢上), 講師(非常勤) (10598345)
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 准教授 (80379528)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 談話分析 / 修辞ユニット分析 / 修辞機能 / 脱文脈化 |
研究実績の概要 |
本研究の目的は,日本語の「修辞ユニット分析」の手法を確立し,テキスト分析における「修辞機能」及び「脱文脈化程度」の概念の利用を提案するとともに,自動化を検討することである。 2年目となる平成28年度は,前年度に行った2名の作業者による「Yahoo!知恵袋」のデータへの認定作業における問題点や課題について検討し,研究代表者,研究分担者,連携研究者による打ち合わせを行い,また,「Yahoo!知恵袋」以外のデータについての認定を複数の作業者によって実施した。必要な書籍なども購入した。 「Yahoo!知恵袋」データについての2名の作業者による認定の一部については,前年度につづき言語処理学会にて口頭発表を行った。「修辞ユニット分析」の過程で確認する「発話機能」(そのメッセージ(おおむね節)が情報の交換にかかわるものか,行為や物の交換にかかわるものかを表す)について,2名の作業者による認定では約25%が不一致であったため,その原因を確認し発表した。不一致の原因は,インターネット上のQ&Aサイトにおける情報要求表現や行為要求表現について「発話機能」のとらえ方に違いがあることに加え,「発話機能」確認前に行うメッセージの分割時点でのカッコ内にある文字列のとらえ方や,メッセージの種類の認定における従属節の機能のとらえ方の違いなどが,その後の「発話機能」認定の不一致に影響を与えていることが確認された。 また,「Yahoo!知恵袋」以外のデータを使用した分類についても,学会,ワークショップ等で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
平成28年度は,初年度(平成27年度)に行った複数作業者による認定結果の不一致項目の関係を明らかにし,その結果をふまえて新基準を策定する計画であった。不一致に関して検討が必要な項目を追加する必要があることがわかり,それらの検討を行っている。また,インターネット上のQAサイト(Yahoo!知恵袋)以外の場面のデータも新たに追加して,アノテーションを行い,検討している。これらの検討のため,新基準の策定は次年度に延期する予定となっている。
|
今後の研究の推進方策 |
平成29年度は,計画では自動付与を検討することとしているが,平成28年度に実施予定であった,新基準策定及び『現代日本語書き言葉コーパス』コアデータへの人手による付与作業を先に行い,その後自動付与の検討を行う予定である。
|
次年度使用額が生じた理由 |
発表学会の開催地が関東で,日帰りとなったため,旅費の使用が予定より少なかった。当初計画にて2年目に実施予定であったアノテーション作業が3年目に変更となったため謝金の使用が少なかった。
|
次年度使用額の使用計画 |
地方での学会出張を予定している。『現代日本語書き言葉コーパス』データへの複数作業者によるアノテーションのため謝金の支出を予定している。
|