2016 Fiscal Year Research-status Report
コーパスから取得しやすい情報と取得しにくい情報の研究
Project/Area Number |
26770156
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
加藤 祥 (保田祥) 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (40623004)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 対象物認知 / コーパスから取得可能な情報 / テキスト情報 |
Outline of Annual Research Achievements |
テキストから取得可能な情報の整理を行い、何がどのように書いてあれば読み手はテキスト内容を認識することが可能なのか、調査を進めてきた。平成28年度は、本課題研究の最終年度の予定であったため、平成26年度と27年度の研究成果をまとめることを目指した。 具体的には、まず、これまでの調査において扱ってきた対象物が主に動物であり、限定的であったことから、調査対象物を植物や道具をはじめとする様々な種類へ拡充し、調査結果から考案したモデルを適用した情報作成を試みた。これにより、内容や頻度、提示順序などが適切と考えられるテキストが、対象物を認識するために必要な情報としてどの程度有効であるのか、検証実験を行うためのデータ整備が進んだ。これらのデータを用いた実験を行うことで、調査結果の応用性と考案モデルの汎用性を検証することが可能になると期待される。(但し、研究環境の変化に伴う進捗の遅れが生じたことにより、本課題研究期間を延長し、検証実験と実験結果を勘案した汎用モデルの提案を翌平成29年度に繰り越すこととなった。)また、対象物を具体物から抽象物やコーパスから新規に取得される未知語などへも広げるとともに、テキストから取得可能な情報の活用方法を検証する予定である。 このほか、これまでに取得したデータの分析を進めた。調査対象物についてテキストから取得される比喩表現に着目することで、対象物の説明に関わる比喩表現の性質の一端を考察することが可能となった。これらの分析結果は、UK-CLC 6th(平成28年7月)において発表した。別途論文の投稿も予定している。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
研究環境(所属)の変化に伴い、本課題計画当初のエフォートが確保できなくなった。そのため、平成28年度に実施を予定していた検証実験を行うことができなかった。但し、これまでの研究成果による汎用モデルの考案と検証実験用データ作成は進んでいるため、平成29年度中に実験を行う予定である。また、途中経過の学会発表は行っており、研究成果の論文投稿による報告も予定している。本年度の実施計画は予定通りに進めることができなかったが、本課題の研究は遅延していても着実に進行しているといえる。
|
Strategy for Future Research Activity |
平成29年度は、平成28年度に実施を予定していた検証実験を行う。この結果を基に、研究成果としての汎用モデルを作成する。また、汎用モデルを用いたサンプルの作成を行う予定である。これらを本課題のまとめとし、成果を学会で報告するほか、論文として投稿する。平成28年度と同程度のエフォートが確保できる予定である。
|
Causes of Carryover |
研究環境の変化に伴い、当初計画したエフォートの確保ができなくなった。調査の実施が大きく遅れたため、翌年度までの延長申請を行った。本課題研究の延長とともに、次年度に助成金を繰り越した。
|
Expenditure Plan for Carryover Budget |
謝金の使用額が予定と異なっているが、研究進捗の遅延によって次年度計画となった検証実験や追加実験を行うため、主に謝金として使用する予定である。このほか、最終年度の報告として、学会発表などの旅費に使用する。
|
Research Products
(1 results)