2014 Fiscal Year Research-status Report
コーパスから取得しやすい情報と取得しにくい情報の研究
Project/Area Number |
26770156
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
加藤 祥(保田祥) 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 研究員 (40623004)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 対象物認知 / コーパス研究 / テキスト情報 |
Outline of Annual Research Achievements |
本研究は、人がテキストから何を読み取り、何が書いてあれば情報の伝達が可能なのかを明らかにするため、どのように書いてあれば読み手がテキスト内容を認識可能なのかという観点から情報の整理を行っている。 平成26年度は、対象物を有する名詞として動物を取り上げ、(1)コーパスから取得可能な要素とそれらの対象物認識における有用性を確かめる調査、(2)対象物認識に適した情報の提示順序の調査を行った。 まず、日本語書き言葉均衡コーパス(BCCWJ)とGoogle日本語n-gramから各種の動物に関する情報を収集し、取得できた情報を提示することで対象動物が同定可能かどうか、クラウドソーシングを用いた被験者実験によって調査した。また、辞書の語釈・被験者が対象物同定に求めた情報・コーパスから取得した情報のうち被験者が有用とした情報について、それらの順序を変え(順列全て)て被験者に提示し、対象物の認識にどのような影響が現れたのか調査した。 引き続き、使用コーパスの規模を拡大する(開発中の超大規模コーパス)などによるテキスト情報の調査や、得られた実験結果の分析を進める予定である。 なお、これらの途中経過と得られた成果は、国内外への発表を行っている。平成26年度は、UK-CLC 5th(平成26年7月)と日本認知科学会第31回大会(平成26年9月)、第7回コーパス日本語学ワークショップ(平成27年3月)で発表した。引き続き学会発表と論文投稿を予定している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成26年度に実施を計画していた調査と実験は年度内に終了した。とくに、クラウドソーシング実験を取り入れることにより、1万人以上の被験者による大規模な調査を行うことができた。但し研究計画では、個々の調査実験を行った後に、最適と考えられる情報提示による検証実験まで行う予定であったが、対象物の認識は対象物によって可否に大きく差が生じるため、調査個別の検証実験を行うことはしなかった。しかし、問題に関する考察は学会発表において報告したほか、今後も引き続き報告を予定しており、分析を進めることと個々の実験結果をあわせることで、あらためて検証を行う予定である。本年度の実施計画はおおむね達成されていると考えられる。引き続き研究計画の実施に取り組む予定である。
|
Strategy for Future Research Activity |
平成27年度は、平成26年度に得られた成果と実際のテキストの異同を整理することを予定している。具体的には、読み手の知識、文化的前提(日英語対照)、文体指標(対象読者など)による差異を調査する計画である。また、研究成果は国内外の学会で報告を行う予定である。
|
Causes of Carryover |
遠方での国内発表に掛かる旅費が計画より少なかった。実験計画を変更したことで、実験を予定していた謝金の使用を繰り越した。
|
Expenditure Plan for Carryover Budget |
平成27年度は、主に被験者実験のための謝金費用が必要となる。また、既に決定している海外発表(英国)や国内発表の旅費に使用する。
|
Research Products
(3 results)